Занялся анализом сайтов и наткнулся на интересные подробности, но вначале о простом.
Яндекс.вебмастер сразу показывает в рубрике «Индексирование сайта» сколько было «Загружено страниц» и сколько из них попало в выдачу «Страницы в поиске«. Для исследуемого сайта это было 2567 и 848, соответственно. Очевидно, поисковая система анализируект контент, то что ей нравится — дает в выдачу, а про остальное она знает и, возможно, при очередном обновлении, если будут нужны данные страницы возьмет и их.
— количество всех проиндексированных страниц достаточно большое — sitemap.xml содержит всего 659 ссылок (нормальная ситуация для блога с 342 записями, 40 рубриками и 260 метками), а остальные — это страницы с комментариями, архивами и т.п., что так хорошо генерируется вордпрессом.
Если сайт не ваш и вы не можете добавить его в вебмастер, то количество страниц в выдаче яндекса можно узнать простым запросом site: имя сайта. Получил 831, чуть меньше, из-за того, что страницы попадают в выдачу не стразу, после посещения роботом сайта, для этого необходимо время. Причем, это необязательно связано с новыми страницами: статичный сайт, который совершенно не менялся пол года постоянно меняет число страниц, происходят небольшие «флуктуации».
Что интересно, именно количество страниц в выдаче яндекса показывают анализаторы сайтов типа PR-CY.ru.
Теперь перейдем к google webmaster — единственное что он может показать, это количество страниц их файла sitemap.xml, размещенного в корне каталога. Для того, чтобы узнать, сколько страниц в проиндексированно нужно задать site: имя сайта в строке поиска (для рассматриваемого сайта было получено 3060). Но не все эти страницы участвуют в выдаче, «странице в поиске» показываются по запросу site: имя сайта/* или site: имя сайта/& — 618
Однако, тот же PR-CY.ru при анализе показывает 3060! Да и все остальные системы делают тоже самое: считают страницы в выдаче яндекса и общее количество проиндексированных страниц у гугла. Вот такое несоответствие.
Есть еще нюансы, в зависимости от того, как вы приписали настройки dns для своего сайта запросы могут давать различные цифры.
site:www.имя сайта.ru
site:имя сайта.ru
Запрос с суффиксом www в гугле более предпочтителен, поскольку он выдает данные на весь домен, с учетом возможных поддоменов.
Запрос с именем сайта в кавычках site:»имя сайта.ru» дает 618, количество страниц в выдаче.
В записи нет меток.