Google решил предпринять довольно сомнительный шаг и запатентовал на этой неделе свой алгоритм по оценке качества контента ресурса, который используется для выявления страниц с содержанием низкокачественного или искусственно сгенерированного контента и последующего занижения Page Rank.

Кроме этого, в патенте имеется описание подобного сомнительного контента, который иногда находится на страницах с немалым количеством часто применяемых ключевых слов. Как правило, подобное содержание страниц генерируют посредством следующих способов: отбор контента, модификация и случайная нарезка; перевод с другого языка; применение дешевого труда с низкой квалификацией (к примеру, который получен на Amazon Mechanical Turk).

Отличительными чертами спам-контента является также синтаксис разговорной формы, неверный порядок слов и так далее. Кроме того, в патенте отмечается тот факт, что спаммеры стараются получать прибыль от использования нецелевого трафика, достигая этого путем размещения на страницах огромного числа рекламных объявлений, ссылок и участвуя в партнерских программах. В патент входит перечисление ряда других показателей, расчетов и критериев, за счет чего лидер поиска осуществляет анализ качества имеющегося контента.

Стоит напомнить, что весной компания Google получила патент на свой метод выявления спама ссылок, а также борьбы с ним. По заверениям интернет-гиганта полученные патенты должны гарантировать пользователям высококачественную и релевантную поисковую выдачу, но сотрудники отрасли не могут скрыть свое недовольство. Они считают, что, запатентовав подобные базовые технологии, компания стремится обеспечить только свою монополию или же просто рекламирует себя.