На скриншоте выше данные с webmaster.yandex этого сайта artemmian.ru на которых видно, что проиндексировано
48318, но из них в поиске всего
321. Как минимум 40 тыс. страниц заслужили этот фильтр, остальные 8к - спорно, но тоже заслужили мусорку, а именно:
- страницы профилей пользователей, а их у меня свыше 70 тыс. доступны для индекации и выстроены в специальном каталоге по алфавиту;
- страницы с тегами так же доступны для индексации и их так же очень много
Вот собственно и есть искусственная накрутка страниц, но яндекс не дурак и научился отсеивать поисковый мусор. Это главная причина отсеивания страниц!
Так же основными проблемами плохой индексации являются:
1. Робот банально незнает о новых страницах - могло пройти слишком мало времени и робот еще не успел добраться до новой сатьи
- на статьи нет ссылок, к ним невозможно добраться с главной
2. Заблокированные или несуществующие страницы - запрет роботу на индексирование разделов или отдельных страниц через
robots.txt. Можно случайно допустить ошибку в синаксисе и сайт просто вылетит из индекса
- запрет индексирования через meta-robots. Это тег, размещаемый между head, являющийся аналогом файла, описанного выше
- использование flash или ajax навигации. Некоторые роботы плохо разбираются в таких технологиях и лучше не экспериментровать
- тег noindex. А вдруг? Случайно незакрытый тег :)
- нет страницы
ошибок для 403 и 404 3. На сайт наложены фильтры - черное seo
- гс, создан для торговли ссылками
- плохая история домена
4. Технические ошибки - некорректный http заголовок
- кривой doctype
- кривые редиректы, например
301 - сайт
с www и без это абсолютно разные сайты и может индексироваться немного не то!
- проблема с кодировкой, когда мы видим "крякозябры" вместо текста
5. Посторение страниц, заспамленность. неуникальность - ворованый контент
- статья частично или полностью повторяется на сайте и может не попасть в выдачу
- одинаковые или близкие заголовки так же не любят пс
- мало текста, оптимальный размер 500+ символов
- плохая скорость загрузки сайта
Обращая внимание на эти факторы можно решить много проблем с индексацией!