Воруют контент сайта – что делать: кому жаловаться и как защищаться


Источник картинки: SEOblog.com

 

Вопрос пользователя

Кто-то умышленно копирует весь наш сайт, со всем контентом и контактами и размещает на самом дешевом домене и хостинге. На сегодняшний день известно две таких копии сайта. Хостинг, техподдержка и др. сервисы помочь нам не могут или не хотят.

Вопрос: какие последствия угрожают нашему сайту-оригиналу? И есть ли какие способы защиты или борьбы с воровством сайта и контента?

 

Наш ответ

Сайт-оригинал может потерять поисковый трафик, если его контент частично или полностью воруют другие сайты.

Плохая новость – нет таких средств, которые стопроцентно защитят сайт от копирования контента (хотя есть методы усложнить этот процесс – о них пойдет речь ниже).

Хорошая новость – риск потери трафика значительно снижается, если:

  • хостовые факторы у сайта-оригинала прокачаны лучше, чем у плагиаторов;
  • контент сайта-оригинала попадает в индекс быстрее, чем у ресурсов, скопировавших контент.

Поэтому есть основания полагать, что полные копии вашего сайта на самом дешевом домене и хостинге вряд ли нанесут вред ресурсу-оригиналу.

По-другому обстоят дела с молодыми сайтами, контент которых растаскивают более сильные и старые конкуренты. В таких случаях часто бывает, что скопированная статья на сайте плагиатора попадает в ТОП-3 даже раньше, чем она успевает проиндексироваться на сайте-оригинале.

Давайте рассмотрим, что можно сделать, чтобы избежать потери трафика из-за копирования вашего контент другими сайтами.

Ваш сайт должен индексироваться быстрее, чем плагиатор

Итак, первое, что необходимо сделать, посмотреть – чей контент появляется раньше в индексе поисковых систем. В случае если ваши страницы индексируется позже, необходимо принять меры к ускорению индексации.

Индексацию можно улучшить следующими способами:

  1. Автоматически добавлять созданные страницы в Sitemap.
  2. Вывести на сайте сквозные блоки со ссылками на новые статьи.
  3. Отправлять новые статьи на индексацию.
  • В Я.Вебмастере это можно сделать с помощью инструмента «Переобход страниц», который находится в разделе «Индексирование»

Обратите внимание, что таким образом можно ускорять индексацию до 20 страниц в 24 часа.

  • В Google Search Console нужно сначала нажать на ссылку в «Проверить URL» – вводим туда адрес страницы, получаем ответ, что она не проиндексирована и нажимаем на кнопку «Запросить индексирование»:

  1. Настроить заголовки Last-Modified.

В первую очередь актуально для сайтов с большим количеством страниц. Проиндексированные страницы, на которых не меняется контент, должны отдавать ответ сервера 304 Not Modified. Это «рекомендация» для ботов не переобходить эти страницы заново и не тратить на них краулинговый бюджет. Таким образом, квота должна расходоваться на новые страницы или на те, на которых были изменения.

К сожалению, боты не всегда слушаются рекомендаций. Но в большинстве случаев этот метод работает и в любом случае сайту он не навредит.

  1. Настроить автоматическое добавление ссылок с социальных сетей или хабов со ссылкой на новые страницы.

Это привлечёт бота, он перейдёт по ссылке и обойдёт страницу. Но чтобы решить задачу, таких ссылок нужно ставить по несколько на каждую новую страницу.

  1. Закрыть от индексации страницы пагинации, которые ведут на старые страницы.

Еще один метод экономии краулингово бюджета. Оставить открытой пагинацию, которая ведёт на новые страницы, добавленные в течение 4–5 дней.

  1. Пинговать новые страницы

То есть сообщать поисковикам напрямую, что появилась новая страница. У большинства готовых движков есть готовые модули и плагины, которые решают эту задачу.

Инструкции по теме ускорения индексации:
Как привлечь на сайт быстробота
Как ускорить индексацию сайта

 

Закрепление авторства

Яндекс дает возможность закрепить за своим сайтом авторство контента с помощью инструмента «Оригинальные тексты», который находится  в Я.Вебмастере:

Увы, ожидания от работы этого инструмента почти не оправдываются. Многие тексты, которые «защищены» таким образом, ранжируются хуже, чем их копипаст на сайтах-плагиаторах с более сильными хостовыми факторами. Но для собственного спокойствия этим методом лучше не пренебрегать.

В Google инструмента для закрепления авторства контента, к сожалению, нет.

 

Кому жаловаться на украденный контент?

Обе поисковые системы дают возможность пожаловаться на плагиат:

Форма Яндекса для жалобы на нарушение авторских прав.

Форма Google для удаления материалов, нарушающих авторские права.

После рассмотрения и подтверждения авторского права страницы с копированным контентом должны быть удалены из индекса ПС Google – пруфлинк.

Но проблема в том, что сам факт обращения в службу поддержки ПС не является доказательством нарушения ваших авторских прав. Если контент воруют частично, не стоит ожидать, что после вашей жалобы нарушитель будет гарантировано удален из выдачи (хотя такие случаи в моем опыте были).

В ситуации, описанной автором вопроса, злоумышленники скопировали весь сайт полностью. В таком случае сайты-плагиаторы, скорее всего, после жалобы будут удалены.

 

Технические приемы защиты текстов от копирования

Можно усложнить процесс воровства контента следующими способами:

  1. Программный запрет от ручного копирования

Настроить запрет на копирование текста со страницы с помощью специальных скриптов, чтобы пользователь не смог задействовать комбинации нажатия клавиш для копирования текста с сайта.

Альтернатива – автоматическое добавление ссылки на сайт-источник под скопированный текст (но, как показывает опыт, в большинстве случаев такие ссылки удаляют).

  1. Бан по IP

Если сайт регулярно парсят, можно отследить IP злоумышленников по логам и забанить их (либо вместо контента сайта выдавать заглушку).

Это не гарантирует, что контент перестанут копировать, но затруднит сам процесс.

  1. Вшивание ссылки в малозаметные элементы текста.

Например, в точку, тире или запятую. Их замечают и удаляют гораздо реже, чем ссылки на источник под скопированным текстом, о которых шла речь в первом пункте. Если ваши статьи растащат конкуренты, то хотя бы со ссылками на ваш сайт.

 

Вместо выводов

Существующие на данный момент способы защиты контента сайта от воровства не решают проблему полностью:

  • «Оригинальные тексты» в Яндексе не дают гарантий, что ваша страница будет ранжироваться выше плагитора;
  • жалобы на нарушения авторских прав в Яндексе и Google не гарантируют, что нарушитель будет наказан;
  • технические приемы могут только усложнить процесс копирования текста, но не могут запретить его полностью.

Приходится признать, что авторство контента на данный момент не является для ПС весомым фактором ранжирования. Бороться с проблемой следует с другой стороны – работать над ускорением индексации своего контента и прокачивать хостовые факторы.


Автор ответа – Виктор Кислый, SEO-специалист SiteClinic

Задать свой вопрос

 

Просмотров: 394


  • А как же вариант про то, чтоыб вычислить в реале?))

  • легче забить
    гавно сайт не даёт выхлоп