1 Star2 Stars3 Stars4 Stars5 Stars (5 голосов, среднее: 4,20 из 5)

Естественность текста, закон Ципфа и как с ним бороться

analiz cipfa

результат анализа по Ципфа 1 главы романа Мастер и Маргарита

Сегодня на каждом углу Сети все чаще шепчутся о «поумнении» поисковых систем, которые постепенно учатся то тематику текста определять, то полезность текста для людей оценивать, добрались и до определения источника, из которого текст появился. Иными словами текст, сгенерированный или паршивенько синонимизированный, может показаться поисковику неестественным и отправится в небытие, то есть, вниз выдачи.

Определить естественность текста, как оказалось, можно по исключительно математическому методу, который взял и придумал лингвист Ципфа. Теорию идеи рерайтить не вижу смысла, но в двух словах пояснить обязан:

Например, мы пишем текст о заработке в сети, предлагаем различные методы, в том числе и копирайтинг, наваяли оду на пару-тройку тысяч символов, то для естественного текста должно получиться примерно следующее:

  • если слово «заработок» вы употребили 15 раз,
  • то следующее по частотности слово, например, «копирайтинг» должно встречаться 7-8 раз,
  • следующее – 5.

Иными словами, самое частое слово является основным, а частотность каждого последующего должна быть меньше, чем самое «спамное» во столько раз, на какой позиции стоит слово в порядке убывания частоты использования.

Текст, который этому соответствует этому правилу хотя бы на 30-50%, имеет право претендовать на естественность. Конечно, чем выше показатель вами будет достигнут, тем лучше с точки зрения этого распределения выглядит текст. В сети есть онлайн-сервисы, которые считают показатель Ципфа и, скорее всего, вы будете удивлены относительно низкой естественностью написанных вами текстов.

Это удивление перейдет в негодование, когда текст, написанный вами, не будет удовлетворять требованиям заказчика по проценту естественности. Возможно, вы даже начнете подсовывать в сервис проверки тексты классиков. Кстати, 1 глава «Мастера и Маргариты» по оценке естественности не дотягивает даже до 40%, а ведь классик писал. Как так, почему?

analiz cipfa 1

результат анализа по Ципфа текста этой статьи

А кто вам сказал, что классики пишут тексты, которые должны укладываться в банальный статистический анализ, характерный для речи среднестатистического носителя языка. А копирайтер просто обязан уложиться, поскольку не сделает – не будет на что мазать масло.

Чтобы написать текст с высоким показателем по анализу Ципфа, достаточно забыть то, чему учили нас раньше, а именно, что таблица частотности слов не должна иметь больших разрывов. Оказывается должна и будет, иначе высоких процентов по этой проверке не видать. Поэтому если сео-оптимизатор указывает ключ из пяти слов, требует употребить его не чаще определенного значения, соблюсти разрыв между словами по частоте использования не больше 1-2 раз и просит показатель Ципфа не ниже 50% — верните такое задание обратно, обернув вокруг камня, ибо он сам не знает, чего хочет.

Если же заказчик знает, что он хочет, и дает только требуемое число ключей без ограничения их использования сверх нормы, дать ему требуемый текст не составит труда. Главное определиться, какое слово будет «центровым» в тексте, то есть, самым часто встречающимся. По нему придется вытягивать график вверх, это гораздо проще, чем «ровнять» график (текст) по менее частым включениям слов.

Подобный вариант поднятия естественности текста я использовал и здесь. Благодаря этому, текст сей статьи имеет хороший показатель: 85%, а если бы я не поленился и использовал слово «текст» еще пару раз, текст был бы вообще отличным:)

Ваш И. Бигога

Похожие записи

6 комментариев

  1. Александр

    • bigoga

  2. Юлия

    • bigoga

Добавить комментарий