Яндекс открыл API – привет копипасту.
Итак, поддержка API открыта: http://webmaster.ya.ru/15459
Вроде как все хорошо, теперь можно будет не париться и добавлять тексты в сервис на автомате. Уже есть плагины под различные CMS для автоматизации и т.д.
Но!
Теперь молодые сайты будут убивать и это можно будет сделать еще проще, чем раньше.
Представим, что у вас есть трастовый старый сайтик. Хотя бы 2-ух летней давности с ТИЦ 10 и больше.
И появляется новый сайт с хорошими статьями. Новый сайт – еще не попал в индекс.
Злоумышленник может спокойно отпарсить весь сайт, разместить все статьи у себя, и имея ТИЦ больше 0 – добавить их в панельку Я.В. якобы тексты его.
Далее, Яндекс приходит индексировать ваш сайт, смотрит – да у вас тут копипаст! Тексты то уже добавлены другим сайтом…
И ваш няшный новый сайтик с хорошими текстами летит под фильтры.
Пичалька…
Если раньше так делали редко только из-за того, что нужно было руками, то теперь это сделать будет без проблем и количество таких инцидентов будет увеличиваться.
Лекарство: Поднять ТИЦ вашего домена до 10 и только потом делать на нем сайт.
Письма Платону в случае парса сайта не помогут, будет стандартный ответ: «Яндекс не разбирается, кто у кого что копирует, он просто индексирует инет.»
Такие дела.
Твит дня: «Обычно, девочки любят куколок, а мальчики — красивые машинки. Но это только до 17 лет. После всё становится наоборот.»
- ElitePay.ru – говнопартнерка под мобильный траффик. Моя рецензия после дня работы.
- А вы все еще не тестируете?
- Взрыв в Минском метро. Я сначала не поверил…
- Черная сторона белого SEO. Как убить сайт конкурента.
- Апдейт Яндекса от 23.09.2011 – Результаты маленького эксперимента по безанкорному продвижению.
Какие защиты от парсинга имеются на данный момент?
Мне кажется, что быстрая индексация страниц при помощи твиттера поможет в этом вопросе. У меня новые сайты в течение 2-3 часов в индекс попадают, а новые статьи за 10-15 минут.
>>Уже есть плагины под различные CMS для автоматизации
Ссылки на плагины не помешают :)
В посте Яндекса есть ссылки. Если еще не обновили их, то в ближайшее время обновят и добавят функцию автоматического импорта текстов статей в Оригинальные тексты.
Может быть Яндекс одумается и снимет ограничение в 10Тиц, тогда будет проще, а пока это явно на руку «Силе зла»
> Теперь молодые сайты будут убивать и это можно будет сделать еще проще, чем раньше.
Думаю, ненадолго.
Вебмастера же вой по этому поводу подымут :)
Логичный следующий шаг со стороны Яндекса — открыть «оригинальные тексты» для сайтов даже с НУЛЕВЫМ тиц.
В этом случае как раз наоборот — отличная защита новых сайтов от парсинга трастовыми получится.
А зачем на ссылке супер редирект?
Чтобы вес не передавала
И вправду нас ждет вот такой попадос. Но с другой стороны по сути это проблема авторского права. Как раз в оффлайне этот вопрос не решен должным образом и в онлайне та же беда. Вот как раз и нужно эти вопросы параллельность решать.
Может быть побуду КЭПом.
В общем как я думаю, то все происходит следующим образом:
первый раз робот приходит довольно быстро, пусть даже если мы говорим о addurl.
То есть пришел, зафиксировал новую страницу и ушел.
Второй раз когда приходит уже забирает статью полностью для индекса.
Третий раз выбирает что в сниппет взять.
Так вот, если банально брать и добавлять ссылку в addurl то яндекс нашу статью замечает, и все, он знает что статья наша.
Угу, только первый раз он может прийти через час после покупки домена, а второй — через 3 дня после размещения клиентского сайта… Вообще вы представляете себе этот геморрой — найти кучу сайтов-нулевиков с уникальным контентом (тематическим), написать под них парсер чтобы потом плагином отгружать в оригинальные тексты. Имхо — овчинка выделки не стоит
Может и не стоит оно того, а с другой стороны большое количество вебмастеров этим и занимаются.