Инструмент lemmatizator.ru - специальный инструмент текстового анализа, который можно использовать для определения количества вхождений лемм и биграмм, проверки на переспам, получения минус-слов по списку фраз из сервисов по подбору ключевых слов, любой задачи, где нужен учет вхождений ключевых слов.
При открытии инструмента видим поле для ввода анализируемого текста. В данное поле возможно добавить:
При добавлении текстом обращайте внимание на то, что копируется в поле “текст”. Возможна склейка нескольких слов в одно.
Замечание! При выделении текста с картинками и дальнейшем копировании, в буфер обмена копируется и атрибут alt, если он прописан.
При добавлении исходного кода страницы не учитываются вхождения слов, находящихся в атрибутах любых html-тегов.
ВНИМАНИЕ!!! При копировании текста страницы или исходного кода, отжимаем установленную по умолчанию галочку “Содержит ссылки”.
При добавлении URL-адреса страницы производится анализ исходного кода данной страницы. При добавлении нескольких URL’ов списком - каждый новый адрес записывается с новой строчки. Также проверяем наличие галочки “Содержит ссылки”.
Результатом работы инструмента является две таблички: “Леммы” и “Биграммы”
Разберем по отдельности.
В данной таблице приведены все леммы текста (исходного кода), который был добавлен для анализа. Разберем таблицу по всем столбцам:
Замечание! Если добавлять для анализа текст, то все вхождения будут записываться в столбец “Other”.
Поиск работает в стандартном режиме, ищет все леммы по указанному фрагменту.
Приведены биграммы в анализируемом тексте (исходном коде). Разберем значения столбцов:
Замечание! Перестановка двух лемм в биграмме - новая биграмма.
Поиск! Для нахождения биграммы нужно записать две леммы через пробел. При записи лишь одной леммы, будут выводиться все биграммы, содержащие данную лемму. При записи части леммы, будут выводиться все биграммы, содержащие фрагмент этой леммы.