что такое запросный индекс
Кворум и попадание в SERP в Яндексе
Документы могут присутствовать в результатах выдачи поисковой системы без вхождения ряда слов из запроса в его текст и тексты входящих ссылок. Порой, в процесс поиска причин данного поведения SEO-специалисты наделяют значимыми качествами meta-тег Description, атрибут alt картинки и т.д., что некорректно для Яндекса. Приведем основные причины попадания документов в выдачу Яндекса, когда в тексте документа и входящих на него ссылках ЗАВЕДОМО отсутствуют слова из поискового запроса.
Прохождение кворума
Как известно, для попадания в выдачу по каждому запросу, документ должен набрать (пройти) определенный кворум.
Кворум — необходимая доля суммарного веса (IDF) слов из поискового запроса, которая должна присутствовать в тексте документа и/или текстах входящих на него ссылок для попадания в результаты поиска (SERP).
Как следует из определения, для попадания в результаты выдачи, документ должен содержать в себе и/или текстах входящих на него ссылок все или заданную минимальную долю веса слов из запроса. Доля высчитывается как функция от длины запроса (в словах) и весов слов входящих в него по формуле представленной ниже (Рис.1), где:
Рис. 1. Формула для кворума (доли веса) из презентации одного из разработчиков Яндекса — Дениса Расковалова. Формула известна и сильно ранее, в частности встречается и в статье разработчиков 2004 года.
Численный параметр 0.01 из формулы носит название мягкости и может меняться в зависимости от настроек поисковой системы. Имеются определенные основания полагать, что значение мягкости в Яндексе может быть отлично от 0.01 и принимать значение 0.06. Для двух данных значений была вычисленная минимальная доля веса (кворум), которая должна быть найдена для документа для включения в результаты выдачи (Рис. 2).
Рис. 2. Вычисленное значение Quorum для двух значений мягкости — 0.01 (синие столбцы) и 0.06 (красные столбцы) в зависимости от длины запроса в словах. По оси Y — минимальная доля суммарного веса для прохождения кворума, по X — число слов в запросе от 1 до 10.
Как видно из гистограммы, для включения в ранжирование документа по пятисловному поисковому запросу (при коэффициенте мягкости 0.06) достаточно чтобы в нём встречалось 4 слова из запроса (при равенстве весов всех слов из запроса). Более того, правила прохождения кворума могут меняться в зависимости от запроса и числа найденных по нему документов.
Таким образом, мы приходим к первому возможному случаю, когда в тексте документа и/или текста входящих на него ссылок встречаются не все слова из запроса, а только часть, но этой части оказывается достаточно для прохождения кворума. Пример представлен ниже (Рис. 3):
Рис. 3. Демонстрация прохождения документа по кворуму в Яндексе со словом, которое заведомо отсутствует в его тексте и анкорах ссылок.
Синонимы слов из запроса
Второй распространенный случай присутствия документа в SERP без прямого вхождения слов из поискового запроса — это вхождение СИНОНИМОВ ЗАПРОСА в текст и анкоры входящих на него ссылок.
Кроме того, не все синонимы подсвечиваются в сниппете, что может вводить SEO-специалистов в заблуждение. Определить, что документ найден в Яндексе с помощью синонимов можно используя GET-параметр «nosyn». На иллюстрациях ниже (Рис. 4 и Рис. 5) представлен как раз такой пример, когда при обработке поискового запроса [мебель офис] в переколдовку добавляется слово «офисная», в результате чего документы с вхождением таких фраз как «офисная мебель» оказывается найденными. При добавлении GET-параметра «nosyn» — документ пропадает из выдачи (Рис. 5).
Рис. 4. Демонстрация попадания документа в выдачу Яндекса за счёт синонимов.
Рис. 5. Использование GET-параметра «nosyn» для проверки того, что документ найден с помощью синонимов.
Важно отметить, что корректно говорить о синонимах ЗАПРОСА, а не о синонимах СЛОВ из него, так как в зависимости от точной формулировки запроса одно и то же слово может, как является синонимом, так и не быть таковым.
К данному же случаю стоит отнести и прочие примеры, когда документ оказывается найден из-за механизма переколдовки поискового запроса (к словам из запроса, в зависимости от его содержимого, добавляются: синонимы, аббревиатуры, перевод и т.д.)
Вхождение в URL
Третий, весьма распространенный случай попадания в выдачу без вхождения слов из запроса, это вхождение всех или некоторых слов в виде транслита в URL-документа.
Интересным здесь также оказывается то, что не все виды транслита, которые понимает поисковая система, подсвечиваются. Ниже (Рис. 6) представлен аналогичный пример, когда документ оказывается релевантным запросу [шуба] за счёт вхождения в URL конструкции вида «wuba».
Рис. 6. Ранжирование документа за счёт вхождения в URL запроса без подсветки самого транслита в адресе.
Стоит отметить, что вхождение транслита слов из запроса в URL повышает вероятность документа набрать кворум в Яндексе.
Запросный индекс
Индексация прочих зон документа
Поисковые системы включают в текстовый индекс содержимое не всех зон документа. В частности, известно, что Яндекс не осуществляет поиск по таким зонам как: мета-теги Description, Keywords, атрибуты alt и title картинок и ряду других. Но, данные утверждения могут перестать быть корректными с течением времени. Требуется проводить регулярные наблюдения за выдачей и индексатором. В частности, на текущий момент имеется возможность производить поиск по некоторым служебным зонам.
Разбор примера
Иногда, аспекты описанные выше не принимаются во внимание и SEO-специалисты могут делать ошибочные выводы. В частности по запросу [безопасные коляски трансформеры] находится документ, в сниппете которого фигурирует текст из meta-тега Description (Рис. 7). Слово «безопасные» же отсутствует в тексте документа и входящих на него ссылках. Может Description начал давать плюс? Нет, на самом деле, здесь срабатывает мягкость и документ проходит кворум без этого слова. Данное утверждение можно проверить заменив слово «безопасные» на произвольное, скажем «вурбалакийсын» (Рис. 8).
Рис. 7. Документ с вхождением в сниппет слова «безопасные».
Рис. 8. Ранжирование документа за счёт срабатывания мягкости.
Также, убедиться к отсутствии текста из meta-тега Description в текстовом индексе можно задав фразу из Description в кавычках (Рис. 9).
Рис. 9. Отсутствие заданного документа в выдаче по тексту точно составленному из Description.
Надеемся, что рассмотренные выше примеры помогут SEO-специалистам производить аналитику выдачи и успешно продвигать сайты самостоятельно.
Что такое «запросный индекс»?
SEO и интернет-маркетинг являются областями, которые находяться в процессе постоянного развития, поэтому, регулярно пополняются новыми терминами, значение которых иногда не совсем понятно даже профессионалам. Например, одним из таких понятий является «запросный индекс» — фактор, о котором мало кто слышал, но, по утверждению опытных оптимизаторов Яндекс его учитывает при ранжировании.
Что же такое «запросный индекс»? На самом деле все просто — под этим понятием понимается общая совокупность всех запросов, по котором сайта показывается поисковиком в выдаче, и по котором осуществлялись переходы пользователей. По структуре запросный индекс напоминает семантическое ядро, но собрано оно не оптимизатором, а самим поисковиком. Таким образом, Яндекс оценивает релевантность сайта в целом, и понимает, релевантен ли он тому или иному запросу.
В качестве примера можно привести какой-либо высокочастотный запрос, например, «квартиры в москве». Для SEO-специалиста он является основным, но, чтобы продвинуться по нему в выдаче, необходимо сначала добиться переходов и топа по другим запросам, содержащих в себе основную фразу «квартиры в москве», но, более низкочастотных. Таким образом, воздействуя на группу низкочастотных ключевых слов, оптимизатор улучшает этот фактор, что положительно влияет и на продвижение основного запроса.
Как можно увеличить количество привлекаемого трафика по НЧ- запросам? Прежде всего, этого можно добиться путем подготовки качественного контента и продуманной внутренней перелинковки. Контент должен быть не только оптимизированным под те или иные запросы, но и интересным для пользователя, быть уникальным не только в техническом, но и в смысловом плане.Таким образом, можно не только увеличить количество переходов по нужным кейвордам, но и добиться хороших поведенческих метрик, которые также учитываются поисковыми системами.
Принцип работы над улучшением запросного индекса в том, что продвигая сайт по большому количеству НЧ-запросов, вы одновременно способствуете повышению позиций и по основным высоко- и среднечастотным запросам. По-сути, этот принцип уже давно был известен опытным оптимизаторам, но просто по новому назван и отнесен к факторам ранжирования, которые необходимо учитывать при работе над раскруткой сайта.
Запросный индекс сайта
Еще один важный момент, оправдывающий разрастание сайта — это запросный индекс сайта. Это все запросы по которым был показан сайт в результатах поиска.
Положительное влияние запросного индекса
Чем больше у вас запросный индекс в тематике, тем проще вам продвигать конкурентные запросы. Наполняя сайт полезной информацией и дробя услуги, вы быстро получаете видимость по низкочастотным запросам, затем постепенно растут позиции по высокочастотным основным запросам.
Приведу наглядный пример. Если я пишу статьи на тему SEO и рекламы, то они быстро начинают получать поисковый трафик. Но если я сделаю страницу про услуги отопления, маникюр, или страницу продажи каких-нибудь товаров, то как бы я не пытался ее оптимизировать, шансов занять какие-то позиции практически нет.
Чтобы примерно оценить его, можно воспользоваться сервисами для анализа видимости, либо посмотреть свои запросы в кабинете Вебмастера Яндекс или Google.
Смотрим в сервисе конкурентов, видимость в ТОП-50 — поможет примерно оценить запросный индекс.
Запросный индекс в Google
Важность запросного индекса подтвердил Джон Мюллер из Google на одной из видео встреч с вебмастерами. Хотя он не использует термин «запросный индекс», но очевидно речь об этом:
По его словам, сайтам действительно имеет смысл углублять свою экспертизу в предметной области и пытаться максимально охватить её. С точки зрения поисковых систем, это создаёт ему репутацию знатока в этой области и помогает ранжироваться по более широкому спектру запросов. Другими словами, таким образом сайты могут охватывать больше запросов по определённой теме.
Такой подход также позволяет увеличивать доверие пользователей. Если они видят, что на сайте есть обширная информация по теме, то они больше доверяют и другому контенту на сайте.
Судя по его словам, Google может понимать сайт как целое, а не только на уровне отдельных страниц. Поэтому движение в этом направлении всегда оправдано.
Запросный индекс в Яндекс
«Как найти похожие слова и запросы — тема отдельного рассказа. Для этого в нашем поиске тоже есть разные алгоритмы, а решению задачи очень помогают логи запросов, которые нам задают пользователи»
«Что может быть чуть менее очевидно — аналогично запросу можно «расширять» и документ, собирая для него «альтернативные» тексты, которые в Яндексе называют словом стримы (от англ. stream). Например, стрим для документа может состоять из всех текстов входящих ссылок или из всех текстов запросов в поиск, по которым пользователи часто выбирают этот документ на выдаче»
В докладе нет речи про видимость домена по списку запросов, я просто хотел показать, что сотрудники Яндекса говорят о том, что как раз можно назвать запросным индексом (хотя сам термин используется именно SEO-специалистами).
Но зато, наверное, можно ввести новые термин — «запросный индекс документа».
Запросный индекс документа
Запросный индекс документа — это все запросы, по которым был показан документ.
Причем из статьи Яндекса можно предположить, что учитываются только запросы, по которым были переходы, то есть документ был выбран пользователем.
Как оценить запросный индекс
Доступно рассказал о запросном индексе SEO-эксперт Алексей Чекушин на вебинаре ПиксельТулс:
Все запросы по которым был показан сайт есть в Вебмастере
Выгрузите все запросы, потом проверьте в сервисе анализе частостности текста, например здесь:
Для примера я проанализировал только группу популярных запросов и обнаружил, что у меня очень много запросов про позиции сайта, при этом явно мой блог не является нужным ресурсом по этой теме.
Анализ частотности запросного индекса
Отрицательное влияние запросного индекса
Существует гипотеза о размытии запросного индекса (стоит ее протестировать). Если ваш сайт отвечает на запросы определенной тематики, а вы начнете писать на совершенно другую тему, то начнете снижать свою тематичность.
Вариацией этой гипотезы является гипотезы:
Например, в моем примере очень много фраз про мониторинг позиций, ведь у меня есть подходящая статья. Хотя вероятно люди ищут сервис, поисковик это понимает, и не смотря на кучу показов, переходов по этим запросам очень мало (средняя позиция страницы ТОП-30).
Такое ощущение, что у меня не блог, а сервис проверки позиций.
Если гипотеза верна, то с этим надо бороться:
Запросный индекс — это показы или переходы?
У меня большие сомнения насчет того, что учитывать надо показы. В статье Яндекса явно указано, что в стрим документа попадают запросы, по которым страница была выбрана пользователями.
Кроме того, показы это результат работы алгоритма, это поисковик решил показать документ по этим запросам. Может быть формула ранжирования дала сбой, зачем это учитывать. Я клоню к тому, что такой запросный индекс бесполезен, это просто алгоритм, которые посчитал на какие запросы отвечает страница.
А вот если добавить сюда поведение пользователей, то есть переходы, то тогда запросы по которым были переходы становятся действительно сигналом, что документ отвечает на запрос.
Что делать
Очевидно, что явление запросного индекса существует, просто называться это может по разному.
Представитель Google явно это подтвердил, а представители Яндекс пишут о том, что используют запросы, по которым люди перешли на сайт в качестве сигнала для обучения алгоритма.
Также, опыт показывает, что на тематичном сайте, новые статьи по теме быстро выходят в ТОП-10 и получают трафик.
Есть гипотеза, что нетематичные показы надо сокращать и это надо проверить.
Я общался с поддержкой Яндекс по вопросу, можно ли на тематичный сайт добавлять статьи другой тематики или лучше запустить новый сайт. Получил ответ, что решение надо принять самому, а подробности работы алгоритма они раскрыть не могут. Можно сделать вывод, что обладание такой информацией может влиять на продвижение.
Запросный индекс
Что такое запросный индекс?
Поговорим о «запросном индексе» — штуковина, о которой мало кто слышал, но, по утверждению уважаемых оптимизаторов — Яндекс его учитывает при ранжировании.
Что такое «запросный индекс сайта»? — совокупность ключевых слов, которые пользователи запрашивают в поисковую систему и потом попадают к нам на сайт.
Т.е. по сути это семантика, выражаясь более простым языком – это своего рода сем. ядро, только сформированное не человеком, а поисковой системой.
Чем полнее будет ядро на сайте, те выше будет запросный индекс и выше ранжирование сайта. Поисковые системы показывают пользователям те объявления в выдаче, которые максимально отвечают на запросы и закрывают интент пользователя.
Соответственно, если ваш ресурс охватывает максимально возможное «ядрище» в нише – тем выше будет ранжироваться, конечно если по остальным факторам у вас все в норме.
Пример:
Высокочастотный запрос «игрушки в спб», для SEO-батьки он является основным, но, чтобы продвинуться по нему, надо получить переходы по другим запросам, содержащим в себе основную фразу, однако, более низкочастотных как «детские игрушки в спб», «купить детские игрушки в спб».
Таким образом, воздействуя на группу низкочастотных запросов, улучшается этот фактор, что в целом влияет и на продвижение основного запроса «игрушки в спб».
Улучшение запросного индекса
Принципы работы над улучшением запросного индекса в том, что, продвигая сайт по большому пулу НЧ-запросов, вы одновременно стимулируете повышение позиций по ВЧ и запросам.
Ничего вроде нового, просто новое название и привязка к факторам ранжирования.
Советы
Пример из жизни блога:
Из за некорректного заголовка Яндекс определил статью к этому запросу «Сайт закладок», интент понятен, надо править заголовки и ключи чтоб не валился отказной трафик.
Вывод
Если в ядре много НЧ-запросов с включением ВЧ-запроса — тогда шансы продвинуть ВЧ-запросы умножается.
В одной из статей я переводил руководство по оптимизации сайтов под Google, статья старая, в ней описан этот метод, актуальный до сих пор и будет актуальным еще долго.
SEO-оптимизация страницы
Ранее писал про общие SEO требования к сайту. Рассмотрели, что нужно учесть, чтобы поисковой робот беспрепятственно мог проиндексировать сайт. Для страницы тоже есть рекомендации, которым желательно следовать, опять же, для того, чтобы поисковики лучше понимали содержимое страницы. Рассмотрим ключевые моменты с примерами.
Метатег Title
Это элемент HTML-кода, в котором содержится заголовок страницы. Вы его видите в заголовке окна браузера. Обычно этот заголовок выводится и в результатах поисках. Логично, что это один из важных элементов страницы, которые сообщает тему или содержание страницы. Например title этой страницы точно будет содержать словосочетание «seo-оптимизация», а ниже скриншот заголовка окна другой страницы с этого сайта.
заголовок окна браузера
title отображается в результатах поиска
Так что и люди видят этот заголовок в поиске и поисковая система ориентируется на его содержимое. Наличие продвигаемых фраз в метатеге title значительно увеличивают шансы на успешное продвижение. Составление и прописывание правильных title входит в SEO-оптимизацию сайта.
Метатег Description
Этот HTML-элемент отвечает за краткое описание страницы. Поисковые системы могут использовать его для описания страницы в результата поиска, но не обязательно. Это зависит от поискового запроса. Если текст запроса будет в description, то скорей всего поисковик покажет это описание.
Метатег Description на поиске
К Description следует относится как к рекламному тексту. Учитывайте, что люди могут его прочитать в результатах поиска и принять решение перейти к вам или нет.
URL — адрес страницы
Если URL адрес страницы содержит нужные слова, то это может дать поисковым систем информацию о содержании страницы. Даже человек, если смотрит на ссылку, которую ему прислали, может по адресу определить что будет по ссылки.
Использовать читаемые URL лучше, чем использовать набор символов и цифр. К сожалению, некоторые сайты созданы так, что для новых страниц автоматически добавляются технические адреса и за этим нужно следить.
Адрес страницы также отображается в результатах поиска, а ключевые слова в адресе страницы подсвечиваются в результатах поиска. Это привлекает внимание и люди чаще переходят на сайт.
Заголовки и подзаголовки H1-H6
Точно также, как с title, слова из которых состоят заголовки получают большее значение при поиске в базе поисковой системы. Тут все логично, если вы что-то ищете и на одной странице оно встречается в заголовках, а на другой просто в тексте, то больше шансов, что первая страница более тематичная.
Текст и содержимое страницы
С текстом всё просто — он должен раскрывать тему и решать потребность пользователя. Если пользователь ищет товары, то страницы должна содержать товары (цены, описания, наличие), если пользователь ищет ответ на вопрос, то страница должна быть информационная и отвечать на вопрос.
Списки UL и OL
Нумерованные и ненумерованные списки добавляют структуры в страницу. В виде списков представляется обычно важная информация, поэтому поисковые системы могут приписывать им более важно значение. Учитывайте это и используйте ключевые фразы в списках.
Изображения
У изображения вставленного на страницу сайта кроме собственно изображения есть еще:
Картинка может помогать продвижению страницы, если отвечает по смыслу содержимому страницы. В обратную сторону это тоже действует — текст вокруг картинки, ее название и атрибуты помогают продвигаться картинке в поиске по картинкам.
Добавлю, что в Яндексе alt никак не влияет на продвижение, но влияет на поиск по картинкам, а это может быть дополнительным источником трафика на сайт.
Анкорный текст
Анкорный текст — это кликабельная часть текстовой ссылки. Другими словами — это текст, которым мы ссылаемся на другой адрес. Логично, что текст характеризует то, что находится по ссылке и это используется поисковыми системами.
Проставляя ссылки между страницами своего сайта, покупая ссылки с других сайтов, вы таким образом показываете людям и поисковым роботам о чем эти страницы.
Пример анкорной ссылки
Нужно знать еще кое-что про анкорный текст. В SEO-оптимизации интернет-магазинов очень важно, какой текст будет анкорным у списка товаров. Если робот заходит на страницу и видит очень много анкоров с каким-то словом, например «ноутбук», то это говорит о том, что на этой странице содержится много ссылок на ноутбуки. Чем больше таких ссылок, тем больше ассортимент. При выборе двух конкурентов предпочтение будет тому, у кого больше ассортимент.
Именно поэтому сложно конкурировать с крупными магазинами, не важно какой текст у вас на странице, если нет ассортимента.
Таблицы
Таблицы используются для отображения структурированной информации, которая обычно важней чем просто текст. Если в таблицу будут входить ключевые фразы, то их ценность будет вероятней выше, чем вхождения в текст. Это тоже стоит использовать.
Пример таблицы с моего блога
Кроме того, таблицы удобно представляют информацию, люди дольше задерживаются на странице, а это сигнал, что страница ценная.
Длина текста
По длине текста нет конкретных рекомендаций, потому-что в зависимости от потребности, требуются разные страницы. В разделе интернет-магазина текст никому не нужен. К счастью поисковые системы, особенно Яндекс, решили этот вопрос. На данный момент размещая текст в интернет-магазине, можно добиться обратного результата.
Лучше ориентироваться на ТОП-10 по конкретным поисковым запросам. Если у всех конкурентов длинные тексты с картинками, то и вам придется делать также.
Структура страницы
В заключение по теме SEO-оптимизации текста обратим внимание на структуру страницы.
Во первых, структурированный текст легче воспринимать, это положительно влияет на время проведенное пользователем на странице. Поведение пользователя — важный фактор ранжирования.
Во вторых, текст, который содержится в структурных элементах, будет считаться более важным по сравнению с «простынями» текста.
Чтобы выстроить структуру страницы используйте: