Loading


Основные принципы работы поисковой системы Яндекс

Любые способы и приемы SEO-продвижения сайтов — это поиски способов, позволяющих повлиять на работу поисковых систем и «подтащить» сайт на более высокое место в выдаче. Однако чтобы безнаказанно вмешиваться в работу любого механизма, надо понимать, на чем эта работа основана. И чем быстрее нужны вам результаты, тем более глубоким будет вмешательство, и тем точнее вам надо знать. Как функционирует система. Если же знаний окажется недостаточно, то вместо результатов будут неприятности в виде фильтров, санкций и т. д.

Как индексируются сайты

Первым на сайт попадает поисковый робот, он же бот. Бот в данном случае – пакет программ, установленных на сервере. Робот просматривает страницы сайта, который подозревается а том, что он содержит уникальный контент и может быть интересен пользователям. То есть он заходит на страницу, выявляет ее содержимое и если результат его устроит – то передает страницу на следующий уровень, поисковику.

Поскольку ресурсы роботов не бесконечны, свои обходы они совершают по определенным правилам:

  • В первую очередь посещаются страницы, на которые ссылаются другие сайты, уже имеющиеся в базе поисковика и признанные достойными доверия. Чем больше ссылок, тем раньше бот вами заинтересуется, поэтому раскрутка сайта начинается с внешней и внутренней оптимизации.
  • Насколько часто робот будет «обходить дозором» ваш ресурс, знает только он сам. Рассчитывается частота визитов индивидуально для каждого сайта по неизвестным никому (кроме создателей поисковика) критериям.

Яндекс использует две разновидности ботов. Первый, который называют еще быстроботом, индексирует новости. Его задача – как можно быстрее добавить в выдачу новейшие данные о событиях. Он «бегает» по новостным сайтам и блогам с насыщенной RSS-лентой. У него своя, упрощенная система ранжирования страниц, благодаря которой материалы мгновенно попадают в ТОП выдачи, обязательно с указанием даты их создания. Выгодно привлекать быстробот для резкого старта SEO-продвижения. Однако второй робот, который приходит на следующий день и подходит к работе более основательно, может изменить выдачу по новостным запросам и материалы утратят свое преимущество.

Второй бот, основной, отвечает за индексацию контента, не связанного с новостями. Он просматривает страницы медленнее и тщательнее, оценивает их SEO-данные и полезность контента, изучает линки и на основании этого выполняет ранжирование, после чего передает страницы поисковику.

Как выполняется поиск в индексе

Поисковая система – это тоже сервер, просто с другим пакетом программ. Задача этих программ – скачать содержимое страниц, которые робот им передал, и обработать его, тем самым создав индекс. В ходе выполнения задачи все страницы скачиваются (как HTML-коды), а их содержимое извлекается и подвергается первичному анализу. Текст каждой страницы попадает в отдельный файл, туда же «забрасываются» найденные ссылки, которые поисковик позже отправит поисковому боту, а тот их обойдет и проверит.

Как работает яндекс

Далее программы чистят текст от всех слов, не имеющих самостоятельного смысла, и знаков препинания. Получается словарный набор, который система разбивает на части, называемые пассажами. Пассажи чем-то похожи на предложения – они тоже имеют законченный смысл. Дело в том, что машины не могут оперировать обычными предложениями, анализируя русскоязычный контент, русский язык для машинного анализа неудобен, так что приходится формировать пассажи.

Затем полученные псевдо-предложения отправляют в индексную базу, попутно присваивая каждому из них собственный вес. Вес показывает, насколько велика значимость пассажа. Зависит он от ряда факторов, в числе которых релевантность, количество повторений, расположение внутри текста и пр. Результатом работы поисковика является индексная база данных. Когда пользователь набирает запрос, система просматривает ее и выдает результат – тот самый ТОП выдачи, куда все стремятся попасть.

Так выглядит работа поисковой системы в общих чертах. Бесспорно, есть еще множество нюансов и тонкостей, которые не вошли в эту статью, но о которых тоже надо знать. Если вы хотите прочесть о них в нашем блоге, напишите об этом в комментариях.