Массовый бан сателитов

На радостях от увеличенных тИЦок не заметил что примерно в этот-же момент из моих 29 тестовых сателитов 9 вылетели из индекса Яшки. Притом картина бана такая:

Список тестовых сателитов

Сателиты перечислены в порядке их создания. Отметка БАН стоит у тех ГС, которые Яндекс выплюнул из индекса. Это конечно не совсем бан, т.к. если на эти домены залить другие сайты, то они проиндексируются. Это просто Яшка не хочет держать в индексе мои сателиты.

Для начала конечно погрустил немного, но потом решил все-таки разобраться почему некоторые ГС остались в индексе, а некоторые нет. Особенно интересно стало, почему последние сателиты не попали под фильтр…

Долго не мог ничего понять, пока не задумался над тем как Яндекс идентифицирует ГС. Ведь практически все кто вылетел из индекса не успели продаться сапе. Они только проходили модерацию 🙂

Так вот, чтобы узнать по каким признакам Яндекс определяет ГовноСайтовость надо определить чем отличаются ГС. Вы можете сказать, что про это сто раз говорилось и так ясно, там то-то, то-то и то-то. Нефига! Все что я читал — это фантазии школьников, которые ничего общего с реальностью не имеют. У школьника банят пару сателитов и он сразу кричит на каждом углу, что его забанили за движек WordPress. И этому школяру совсем не интересно, почему, например, у моего блога никогда проблем с индексацией небыло (а он ведь тоже на WP). Но зато половина школьников считает, что из-за того что они наклепали ГС на вордпрессе, теперь WP будут банить.

А главная отличительная черта ГС (ГовноСайтов) — конвеерное производство. Еденичные ГС ничего не меняют на фоне остального интернета, а вот когда их каждый манимейкер десятками в день делает и в сапу загоняет, то это уже проблема для поисковиков. Тоесть для ПС надо просто определить что создание таких сайтов стоит на потоке и не индексировать, т.к. сайты для людей пачками не делаются. Ну а если под раздачу попадет СДЛ, то ничего страшного. Вебмастер напишет письмо и Платон перемодерирует его в ручную. Из-за ГС никто не будет письма писать.

Натолкнуло на эту мысль то, что в моем списке в начале стоят самые некачественные ГС. И вот они то как-раз досих пор в индексе. Все дело в том, что они индивидуальные. Каждый делался без использования конвеера и поточного производста.

Так как-же Яндекс определяет, что перед ним сайты сошедшие с конвеера? Я думаю, что суммируется ряд факторов, и все должно быть предельно просто. Никто не будет выделять огромное кол-во ресурсов на сложные математические расчеты. Ресурсы серверов на самом деле не безграничные.

Как я считаю, факторы должны быть примерно такие:

  • ip адрес
    Как ни крути, но несколько сателитов располагаются на одном ip. Выдавать каждому сателиту свой ip экономически не целесообразно.
    Но это не значит, что раз 2 сайта на одном ip значит они ГС.
  • Контент
    Если контент не уникальный — появляется шанс того что перед нами ГС. Мне кажется высчитывается процент уникальности контента каждого сайта и от этого процента Яндекс пляшет в своих дальнейших действиях.
    Но это не значит, что если контент 100% не уникален, значит БАН.
  • Структура сайта
    Если Ваш сайт зарегистрирован в Яндекс.вебмастер, то вы себе представляете, как выглядит структура сайтов в глазах Яндекса.
    Именно этой части в понимании не хватает школьникам. Все предельно просто. Если одинаковая структура у двух сайтов, то это уже достаточно серьезный аргумент в пользу БАНа.
  • Контроль за исходящими ссылками
    Если вы ссылаетесь на плохие сайты (порнуха, продажа дипломов, доры и т.д.), то тут 3 варианта: вам это интересно, вы продаете ссылки, вас спамят, т.к. вы не следите за сайтом или все вместе взятое. Не важно. По мнению ПС ваш сайт будет не интересен пользователям сети и должен быть полностью или частично исключен из индекса.
  • Прочие мелкие факторы
    Это может быть дизайн, whois домена и т.п. Но думаю очень незначительно влияют эти факторы.

В моем понимании по сумме этих факторов Яндекс определяет ГС или СДЛ.

Схема получается примерно такая:

Расчет ГС

Я, конечно, не претендую на точность формулы бана, но сам буду придерживаться этих правил.

Те ГС, что у меня получили БАН, заслужили вылет из индекса тем, что находились на одном IP и имели одинаковую структуру. Последние сателиты не вылетели из индекса, т.к. я случайно сделал рандомную структуру в конвеере версии 3. Хотя может просто до них еще не дошла очередь.

Кстати, Гугл скушал все ГС без проблем. Видимо он похуже определяет отечественные сателиты.

PS. Еще один БАН

Бан

6 комментариев

  1. Ну мне все-же хотелось бы в дальнейшем избегать такого филосовского события, как БАН.

  2. И все же, как уник влияет на бан? Что если собрать солянку из сочинений К. Маркса и Мао ДзеДуна, что об этом пудмает яндекс? ведь по идее тогда должны потоком баниться все библиотеки с выложенными книжками и т.п.
    Структура рулит это точно, но все же? или досточно для одинковых конвеерных ГС делать разные движки и разную структуру и все будет пучком?

  3. ведь по идее тогда должны потоком баниться все библиотеки с выложенными книжками и т.п.

    Думаю все зависит от того, когда такой ГС был сделан. Если до того, как яндекс научился распознавать автора и дубликаты, то не факт, что бананут. Если после, то вероятно бананут, когда ссылками начнете торговать.

    или досточно для одинковых конвеерных ГС делать разные движки и разную структуру и все будет пучком?

    Не знаю, там может сотни факторов учитываются, вплоть до уникальности оформления текста. Экспериментируйте.

  4. Бан будет если использовать метод для ГС, но это произойдет в любом случае рано или поздно smile.gif А если сайт белый и пушистый то смысл волноваться и переживать? 😉

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *