Роботы Яндекса

Автор: admin | 0 коммент. »

Робот (англ. crawler) хранит список URL, которые он может проиндексировать, и регулярно выкачивает соответствующие им документы. Если при анализе документа робот обнаруживает новую ссылку, он добавляет ее в свой список. Таким образом, любой документ или сайт, на который есть ссылки, может быть найден роботом, а значит, и поиском Яндекса.

Яндекс использует разные виды роботов для различного рода документов. Определить какой робот к вам заходил можно по строке User-agent системе статистики:

  • Yandex/1.03.003 (compatible; Win16; D) – робот, обращающийся к странице при добавлении ее через форму “Добавить URL”
  • Yandex/1.02.000 (compatible; Win16; F) – индексация иконки сайта (favicon)
  • Yandex/1.01.001 (compatible; Win16; H) – определение зеркалов сайтов
  • Yandex/1.01.001 (compatible; Win16; I) – основной индексирующий робот
  • Yandex/1.03.000 (compatible; Win16; M) – робот, обращающийся при открытии страницы по ссылке “Найденные слова”
  • Yandex/1.01.001 (compatible; Win16; P) – индексатор картинок
  • YaDirectBot/1.0 (compatible; Win 16; I) – индексация страниц сайта, участвующего в рекламной сети Яндекса
  • YandexBlog/0.99.101 (compatible; DOS3.30,B) – робот, индексирующий xml-файлы для поиска по блогам.
  • YandexSomething/1.0 – робот, индексирующий новостные потоки партнеров Яндекс-Новостей

Также, в Яндексе есть “дятлы”, они проверяют доступность документов:

  • Yandex/2.01.000 (compatible; Win16; Dyatel; C) – Яндекс.Каталог. Если сайт недоступен в течение нескольких дней, он снимается с публикации. Как только сайт начинает отвечать, он автоматически появляется в Каталоге.
  • Yandex/2.01.000 (compatible; Win16; Dyatel; D) – Яндекс.Директ. Она проверяет корректность ссылок из объявлений перед модерацией.
  • Yandex/2.01.000 (compatible; Win16; Dyatel; Z) – Яндекс.Закладки.

Прокомментировать