Алгоритмы Text.ru и инструкция по чтению отчёта

Иван Корнев·21.05.2024·4 мин

Сервис Text.ru определяет оригинальность текста, разбивая его на короткие последовательности слов (шинглы) и сравнивая их с индексом миллионов страниц в интернете. Чтобы получить качественный отчёт, вставьте текст в поле проверки, дождитесь анализа и оцените три ключевых параметра: процент уникальности (цель >90%), водность (норма 60–70%) и тошноту (оптимально 3–4%). Красным цветом выделяются фрагменты плагиата, жёлтым — частичные совпадения, требующие рерайта.

Механизм проверки и ограничения сервиса

Алгоритм Text.ru имитирует работу поисковых систем. Он сканирует текст, выделяя цепочки из 3–5 слов. Если такая цепочка найдена на других проиндексированных сайтах, она помечается как неуникальная. Процесс занимает от 10 до 30 секунд для стандартных объёмов.

Бесплатный режим позволяет анализировать до 10 000 символов с пробелами за один раз. Для текстов большего объёма (до 100 000 символов) или массовой проверки файлов требуется платная подписка или покупка пакетов символов.

Лайфхак для бесплатной версии: Если текст превышает 10 000 знаков, разбейте его на части по 8–9 тысяч символов. Это позволит проверить весь материал без оплаты, сохраняя буфер на случай технических ошибок.

Зарегистрированные пользователи получают доступ к истории проверок, возможности загружать файлы напрямую и использованию API для автоматизации процессов.

Расшифровка метрик отчёта

После завершения анализа пользователь видит дашборд с четырьмя основными показателями. Понимание их значения критически важно для доработки контента.

Ключевые параметры качества

  • Уникальность (%) — доля текста, не имеющая точных совпадений в сети. Для коммерческих статей и SEO норма составляет 90–100%. Показатель ниже 80% сигнализирует о необходимости глубокого рерайта.
  • Водность (%) — процент «лишних» слов, не несущих смысловой нагрузки (местоимения, вводные конструкции, клише вроде «таким образом», «является»). Оптимальный диапазон: 60–70%. Значение выше 80% делает текст размытым и сложным для восприятия.
  • Тошнота (ключевые слова) — частота повторения конкретного слова или фразы. Измеряется в процентах. Норма: 3–4%. Превышение 6% расценивается поисковиками как переспам, что может привести к санкциям.
  • Заспамленность (по символам) — общая плотность всех значимых слов в тексте. Рекомендуется держать этот показатель ниже 4–5%.

Визуальная индикация совпадений

В подробном отчёте текст подсвечивается цветами:

  • Зелёный — уникальный фрагмент.
  • Жёлтый — частичное совпадение (20–50%). Часто возникает при использовании устойчивых выражений или неудачном рерайте.
  • Красный — прямой плагиат (совпадение >50%). Требует обязательного переписывания или указания источника (если это цитата).

Нажав на подсвеченный фрагмент, вы увидите ссылку на сайт-источник и процент сходства. Это помогает понять контекст заимствования.

Таблица нормативных показателей

ПараметрОптимальное значениеКритическая зонаДействия редактора
Уникальность90–100%< 80%Глубокий рерайт, изменение структуры предложений
Водность60–70%> 80%Удаление вводных слов, канцеляризмов и штампов
Тошнота3–4%> 6%Замена повторяющихся ключей на синонимы (LSI)
ЗаспамленностьДо 45% (символы)> 50%Снижение общей плотности ключевых запросов

Типичные ошибки и способы исправления

Часто пользователи сталкиваются с ситуацией, когда технически грамотный текст показывает низкую уникальность. Основные причины и решения:

  1. Цитаты и названия. Прямые цитаты, названия законов, книг или компаний всегда будут подсвечены красным.
    • Решение: Оформите их как цитаты (сервис иногда игнорирует их в общем расчете, если они выделены) или кратко перескажите суть своими словами.
  2. Списки и инструкции. Перечисления шагов часто совпадают у разных авторов.
    • Решение: Добавьте пояснения к каждому пункту, измените порядок слов, используйте авторские примеры.
  3. Автоматический рерайт. Text.ru предлагает свои варианты замены слов для повышения уникальности.
Не копируйте автоматические замены слепо. Алгоритм может исказить смысл предложения или нарушить согласование падежей. Всегда вычитывайте отредактированный текст вручную.

Алгоритм доработки текста:

  1. Откройте подробный отчёт и скопируйте все красные и жёлтые фрагменты.
  2. Перепишите их, меняя структуру предложения (например, замените пассивный залог на активный, разбейте длинное предложение на два коротких).
  3. Используйте синонимы для ключевых слов, чтобы снизить тошноту.
  4. Запустите повторную проверку. Цельтесь в показатель 95%+ для гарантированного прохождения модерации на биржах и сайтах.

Частые вопросы (FAQ)

Почему уникальность упала после второй проверки? База данных Text.ru постоянно обновляется. Если ваш текст был опубликован где-то ещё в интервале между проверками, он мог попасть в индекс и стать «плагиатом» самого себя.

Достаточно ли 85% уникальности для студенческой работы? Для большинства вузов порог составляет 70–80%, однако требования зависят от конкретной кафедры. Алгоритмы антиплагиата вузов (например, «Антиплагиат.ру») отличаются от Text.ru, поэтому результат может варьироваться.

Что делать, если сервис зависает? При высокой нагрузке проверка может идти дольше обычного. Не обновляйте страницу сразу. Если процесс длится более 5 минут, попробуйте проверить текст меньшими частями или повторите попытку через 10–15 минут.

Влияет ли форматирование на результат? Нет, сервис анализирует только текстовое содержимое. Жирный шрифт, списки и заголовки не влияют на процент уникальности, но помогают структурировать ответ для читателя.