что такое каноникал url
Руководство по работе с канониклами
В этой статье собраны свежие данные на лето 2021 года о канонических страницах. Разобраны все возможные случаи использования атрибута rel=“canonical”. Рассмотрены основные ошибки при работе, а также даны ответы на популярные вопросы.
Определения каноничности
Каноническая страница — это страница, которую поисковая система считает главной в группе схожих по содержимому.
Неканоническая страница — это страница на которой размещен атрибут rel=»canonical» с адресом другой страницы.
Как выглядит атрибут каноникал
Атрибут rel=“canonical” может быть прописан двумя способами:
Какой из этих методов выбрать лучше всего, разберем в главе «Как указать канонический адрес страницы».
Процесс канонизации
Канонизация — это процесс выбора главной страницы среди дублей (одинаковых страниц доступных по разным адресам) и/или среди страниц с похожим контентом.
В подкасте Search Off the Record от 4 ноября 2020 сотрудник Google Мартин Сплитт рассказал, как поисковик обрабатывает канонизацию:
Сначала нужно обнаружить дубликаты, сгруппировать их вместе и отметить, что эти страницы дублируют друг друга. Затем для всех них нужно найти страницу лидер а.
На вопрос: «Обнаруживает ли такой метод только точные дубли или частичные тоже?» специалист ответил:
У нас есть несколько алгоритмов, которые пытаются обнаружить и не учитывать шаблонную часть страниц. Так, например, мы исключаем навигацию из расчета контрольной суммы, убираем нижний колонтитул. Тогда у нас остается то, что мы называем центральным элементом, то есть центральное содержимое страницы, что-то вроде самой сути страницы.
После вычисления и сравнения контрольных сумм, те, которые похожи между собой (сильно или частично) мы объединяем в дублирующий кластер.
Далее по словам Мартина, необходимо выбрать один документ из кластера, который и будет показываться в результатах поиска:
Но вычислить какая из них будет ведущей в кластере не так просто. Есть случаи, когда даже людям будет сложно определить, какая именно страница должна отображаться в результатах поиска. Мы используем более 20 сигналов, чтобы решить, какую страницу выбрать как каноническую из дублирующего кластера.
После сравнения всех сигналов для всех пар страниц, мы приближаемся к фактическому определению канонической.
Почему канониклы важны для SEO
1) Поисковики не любят дублирующийся контент, потому что он засоряют выдачу. Так же алгоритмам бывает непросто выбрать правильно главную страницу. Атрибут rel=»canonical» подсказывает какой URL стоит индексировать.
Google и Яндекс заявляют, что они не всегда признают указанный канонический адрес. Из-за того, что теги каноничности считаются подсказками, а не директивами (указаниями). Учитываются различные сигналы (были рассмотрены выше). Грамотное использование тегов каноничности помогает снизить риск того, что робот сочтет канонической не ту страницу.
Что такое атрибут rel=“canonical”, когда и как его использовать?
В этой статье мы разберём, как и для чего нужно использовать атрибут rel=“canonical”, а также на конкретных примерах опишем, когда его лучше применять.
Что такое rel canonical и для чего он нужен?
Таким образом, если на вашем сайте есть идентичный или очень похожий контент, доступный по разным URL, с помощью атрибута rel=“canonical” можно указать тот URL, который является предпочтительным для индексации.
Когда нужно использовать канонические ссылки
1. Для предупреждения появления различных дублей. Например:
В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:
2. Для доступных по разным URL страниц с очень похожим контентом.
Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.
В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё».
В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».
Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:
Как указать основной URL при помощи атрибута rel=“canonical”?
Прописать между тегами любой HTML-страницы
Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.
Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.
Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:
Важно!
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.
В файле Sitemap
В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.
Важно!
Атрибут rel=“canonical” — это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.
В заголовке HTTP
Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.
В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:
Важно!
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.
С помощью плагина
Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
— для WordPress можно настроить canonical с помощью Yoast SEO;
— в OpenCart — реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
— для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).
Как проверить правильно ли настроен rel=“canonical”?
Провести анализ можно специальной программой для SEO-анализа сайта — Screaming Frog SEO Spider.
С помощью этой программы вы увидите:
— какие страницы на сайте без атрибута rel=“canonical”;
— на каких страницах стоит атрибут rel=“canonical”, и какие страницы являются для них каноническими;
Основные ошибки использования rel=“canonical”
— Канонический URL отдаёт 404 ошибку.
— Указанный канонический URL находится на другом домене или поддомене.
— Каноническая ссылка не является индексируемой.
— Использование rel=“canonical” со страниц пагинации на первую страницу.
Для всех страниц пагинации неправильно прописывать канонической первую страницу. Это делает индексацию всех страниц пагинации невозможной.
Для страниц пагинации в качестве канонических нужно указывать эти же страницы.
Например, страница https://site.ru/category-1/page-2 должна содержать каноническую ссылку:
Если в категориях сайта есть страницы «Показать всё», на которых доступны все товары из категории — на каждой из страниц пагинации можно указать канонической страницу «Показать всё».
— Несколько ссылок rel=“canonical” с одной страницы.
Для одной страницы должна быть одна каноническая страница, в ином случае будет учтён только первый URL.
— Разные канонические URL.
Указывайте одни и те же канонические страницы при разных способах реализации атрибута (например, через XML-карту сайта и через rel=“canonical” на самой странице).
Заключение
Атрибут rel=“canonical” — удобный и полезный инструмент для поискового продвижения. При правильном использовании, он повысит эффективность работы и ускорит индексирование сайта, что, в свою очередь, существенно повлияет на его ранжирование.
Хотите узнать правильно ли настроен canonical на вашем сайте — обратитесь к нам.
Оптимизирую сайты с 2009 года. Люблю сложные кейсы, которые оказались не по зубам специалистам с других компаний. Делаю очень подробные аудиты.
Пишу статьи-инструкции на блог SiteClinic по SEO-инструментам и аналитике.
Любимая цитата: Чтобы добиться успеха, надо искренне любить то, чем вы занимаетесь.
Оцените мою статью:
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
7 комментариев к статье “ Что такое атрибут rel=“canonical”, когда и как его использовать? ”
Про использование со страниц пагинации на первую страницу — полная чушь. Именно это и является единственным верным решением, если на странице «Показать все» очень много товаров. Такая страница будет долго грузиться и плохо восприниматься поисковиками.
Попадать страницам пагинации в индекс категорически не нужно, это практически бесполезные дубли. А ссылки с этих страниц поисковики прекрасно индексируют.
Добрый день, Александр!
Тут на самом деле ситуация какая-то скользкая…
я поднимал эту тему и с Еленой Першиной и отсматривал все возможные рекомендации от Google.
Смотрите,
— да, гугл порекомендовал делать на вьюол,
— Яндекс сначала рекомендовал ссылаться канониклом каждой страницы пагинации на 1-ю страницу, но потом понял, что моменты конфликтуют. и согласились, что да, давайте на вьюол.
Проблема, которая из этого возникает (во всяком случае для Яндекса) — это то, что (ссылаюсь на эксперименты Шакина (вроде)) Яндекс нормально в первые места не выводит страницы с весом более 10 мб. Т.к. долгая по-любому загрузка снижает ПФ.
Lazyload не решает этой проблемы, т.к. Яндекс НАСТАИВАЕТ, чтобы ему при первом обращении выдавали ВСЮ инфу. Но не для каждого владельца сайта просто сделать такую возможность — боту отдавать всю, а пользователю подгружать по лэзилоад.
Поэтому интересно Ваше мнение, как Вы бы сделали? Или, если Сергей Кокшаров близок (а я думаю, к сеоклинике он близок), то предложить ему поделиться своим золотым рецептом канониклов при пагинации + лэзилоад, который подойдет и для Яндекса и для Гугла.
Поиск страниц с атрибутом rel=»canonical» на сайте
Что такое атрибут rel=»canonical»
Как прописать атрибут rel=»canonical» в коде страницы
Задается он с помощью тега LINK с атрибутом rel=”canonical” в блоке HEAD страницы. Для этого необходимо поместить в HEAD следующую запись:
Где «канонический URL» – это полный адрес страницы, которую вы считаете предпочтительной для индексации.
Пример атрибута rel=canonical в HTML-коде страницы:
В каких случаях применяют этот атрибут?
Почему rel=canonical важен для поисковых систем?
Атрибут rel=canonical позволяет поисковым системам определить среди страниц с одинаковым содержанием основную, которую нужно проиндексировать и вывести в результаты поиска.
Информация от Яндекс о поддержке поисковыми роботами rel=canonical появилась в 2011 году. Вы можете ознакомиться с рекомендациями от Яндекс по употреблению rel=canonical в разделе Яндекс.Помощь.
Google также официально рекомендует использовать rel=canonical для борьбы с повторяющимися URL. Об этом можно прочитать в руководстве Консолидация повторяющихся URL.
Почему нужно знать, на каких страницах сайта есть rel=canonical?
Например, известен кейс, когда на всех страницах сайта в качестве канонической прописали главную страницу, поэтому поисковые системы не могли проиндексировать все остальные страницы веб-ресурса.
Как обнаружить на сайте страницы с rel=canonical?
Быстро сделать это можно с помощью сервиса Labrika. Отчет «Страницы с rel=canonical» находится в разделе «Технический аудит» левого бокового меню.
Поставив галочки около нужных пунктов в верхней части отчета, можно отфильтровать его содержимое так, чтобы отображались данные только по rel=canonical с выбранными параметрами. Тогда вы сможете проверить наличие конкретных ошибок в указании канонической страницы.
Какие виды ошибок rel=canonical поможет определить Labrika?
Страницы с несколькими rel=canonical
На странице может быть указан только один канонический URL. В случае нескольких объявлений rel=canonical Google и Яндекс проигнорируют все указания канонических страниц.
Страницы с кросс-доменным rel=canonical
Чаще всего ссылка на другой домен при использовании атрибута rel=canonical происходит по ошибке. Если в качестве канонического адреса указан URL на другом домене или субдомене, Яндекс не учитывает канонический адрес. Google допускает выбор основного URL на стороннем домене, но рекомендует проверить правильность такого указания.
Ссылки с rel=canonical на несуществующие страницы
Указание главной страницы в качестве канонической на всех страницах сайта
Это считается грубой ошибкой, поскольку тогда все страницы веб-ресурса, кроме главной, не будут проиндексированы и не попадут в результаты поиска.
Канонический URL заблокирован для индексации
Не следует запрещать индексирование страниц, которые указаны как канонические. Это не позволит поисковым роботам их проиндексировать, и они не смогут участвовать в поиске. Если указанная в rel=canonical страница заблокирована от индексации, нужно снять блокировку или указать в качестве канонической другую страницу, которая доступна для индексирования.
В URL-адресе отсутствует префикс http или https
Абсолютные URL-адреса должны указывать полный путь к канонической странице, включая обозначение протокола (http:// или https://), например:
rel = canonical найден в
Руководство по использованию атрибута rel=canonical вы найдете в отдельной статье нашего сайта.
Канонические URL. Руководство по использованию атрибута rel = Canonical
Существует несколько причин образования дублей, например, CMS могут создавать дополнительные копии, где страница доступна по адресу с www и без. Особенно часто копии возникают в интернет-магазинах, где страницы товара отличаются только фотографией.
Канонический URL – это предпочитаемый адрес страницы, то есть, именно он будет индексироваться из группы схожих.
Канонический URL в борьбе с дублями.
Допустим, есть несколько адресов, ведущих на одну и ту же страницу:
Стоит отметить, что поисковые системы не гарантируют стопроцентного следования данному правилу. Однако, если вы не укажете каноническую страницу, то ПС может сделать это сама. В этом случае вы потеряете контроль над индексацией, так как поисковый робот выберет страницу рандомно и занесет в индекс.
Злоупотреблять атрибутом rel=canonical также не стоит. Встречались сайты, которые теряли позиции в результатах поиска после того, как разработчики ошибочно записывали в rel=canonical всех страниц сайта одинаковый url.
Как правильно использовать канонические урлы?
В чем разница между канонической ссылкой и 301-редирект?
Различие в принципе их действия. Атрибут rel=canonical показывает поисковой системе, какую страницу нужно индексировать и отображать в поиске. Остальные страницы не ранжируются, но на сайте пользователю видны. При использовании 301-редирект, вас автоматически перенаправляют на основную страницу. Если рассматривать с позиции передачи веса, то оба варианта будут передавать определенную часть веса канонической странице.
Одновременное использование rel=canonical и 301-редирект может оказаться плохой идеей. Мы говорим о тех случаях, когда вы указываете на страницу, как на каноническую, перенаправляя с нее, в свою очередь, на другую 301-редиректом. Скорее всего, поисковый робот посчитает это ошибкой. Возможно, передаваемый вес потеряется внутри этой цепи, что приведет к потере позиций в выдаче. Лучше не соединять канонические ссылки в цепь, а использовать только в пределах одного шага до основной страницы.
И еще несколько правил
Использование канонических URL не обязательное правило. Но если у вас есть дублированный контент, лучше решить эту проблему самостоятельно. Иначе поисковая система решит ее по-своему.
Атрибут rel=»canonical» и ситуации в которых его следует использовать
Что такое canonical URL
Как настроить rel=”canonical”
1. На странице сайта (основной способ)
Чтобы указать канонический URL-адрес для текущей страницы вам необходимо установить ниже указанный код, в разделе HEAD, поскольку, если вы случайно зафиксируете этот атрибут в другом разделе, то инструкция будет проигнорирована поисковыми системами.
2. Через xml-карту сайта
Для каждой страницы в xml-карте сайта вы можете проставить свою каноническую ссылку. Но иногда поисковые системы могут игнорировать эти рекомендации.
3. Через ответ сервера
Если вам нужно указать канонические ссылки для документов другого типа (не-html), например, для pdf-файлов, вы можете поставить каноническую ссылку в http-заголовке. В таком случае при запросе дублирующего файла сервер должен выдать следующее:
Но следует иметь ввиду, что сейчас Google поддерживает этот элемент заголовка только для веб-поиска.
Когда использовать канонические ссылки
1. Если вы точно знаете, что на вашем сайте есть дубликаты
Если вы четко понимаете причину появления похожих страниц на собственном сайте, и в то же время каждая такая страница должна присутствовать на сайте, нужно определить, какая из набора этих страниц является главной. Тогда изо всех остальных страниц следует проставить канонические ссылки на эту приоритетную страницу.
2. Когда трудно или невозможно выполнить 301-редирект
3. Несколько страниц для одного типа продуктов
Если у вас есть серия продуктов в интернет-магазине, которые отличаются, например, только по цвету, то лучше выбрать один продукт как основной (типичный) и проставить на него канонические ссылки из страниц других продуктов.
4. Для разных видов товаров в каталоге
Если на вашем сайте предусмотрены разные способы сортировки товаров, а параметр сортировки указан в URL-адресе.
Тогда важно из всего разнообразия сортировок поставить канонические ссылки на каталог с сортировкой по умолчанию. Обычно это категория URL без параметров, которые отвечают за сортировку товаров.
5. При создании страницы каталога со всеми продуктами
Согласно рекомендациям Google, способ, с помощью которого вы проставляете каноническую ссылку со всех страниц каталога на страницу со всеми продуктами/статьями, оптимальный как для индексации страниц каталога, так и для всех продуктов/статей на сайте. С помощью этого метода для каждого раздела сайта вам необходимо создать страницу «Просмотреть все», и с каждой страницы пагинации поставить на нее каноническую ссылку.
6. Страница печати
Если печать страниц на сайте осуществляется с помощью дополнительного параметра, например,
тогда необходимо поставить каноническую ссылку на основную версию страницы.
7. При использовании партнерской программы на сайте
Если на вашем сайте есть партнерская программа или любая другая реферальная система, то очень важно прописать канонические ссылки для всех страниц, которые могут содержать аффилированные ссылки. Если вы забудете сделать это, то в индексе очень быстро могут появиться десятки или даже сотни дубликатов страниц сайта, поскольку по внешним ссылкам поисковые роботы быстро индексируют необходимые страницы.
Поэтому для всех страниц с партнерскими ссылками
нужно прописывать следующую инструкцию:
Также вы можете сообщить Google о всех параметрах, которые не стоит индексировать с помощью специального инструмента. В этом случае вы должны отметить партнерский параметр, чтобы он не менял содержимое страницы.
Старая версия Google Search Console > Сканирование > Параметры URL
8. Для склейки файла индекса каталога
Важно проверить, чтобы файлы в каталоге типа index.html не дублировались: подобное происходит, когда два таких адреса доступны для индексирования: http://site.com/dresses/ и http://site.com/dresses/index.html. В подобных ситуациях для решения проблемы проще внести такую каноническую ссылку в файл http://site.com/dresses/index.html
9. При использовании одинакового контента на разных доменах или различных языковых версиях
Когда вы создаете аналогичные сайты, либо различные языковые версии своего контента, и при этом используете одинаковый контент на разных сайтах/языковых версиях, тогда вам нужно использовать rel=”canonical” в главной версии контента.
Главные ошибки при использовании rel=”canonical”
1. Использование на странице пагинации
Очень часто при пагинации или с некоторыми сериями страниц на сайте, для всех страниц этой серии предписывается первая каноническая страница. Это неправильно, потому что подобное препятствует индексированию всех страниц серии.
2. Каноническая ссылка не индексируется
Если мы проставляем каноническую ссылку на другую страницу, следует убедиться, что эта страница индексируется:
Найдите неиндексируемые страницы
Запустите аудит и узнайте какие из канонических ссылок запрещены к сканированию поисковыми ботами
3. Несколько ссылок rel=”canonical” со страницы
Для одной страницы должна быть одна каноническая ссылка. Если указано несколько страниц, будет приниматься во внимание только первая инструкция.
4. Разные канонические URL-адреса
Всегда указывайте одни и те же канонические страницы для разных вариантов реализаций (например, через xml-карту сайта или через rel=”canonical” на самой странице).
5. Неправильное использование относительных ссылок
При указании канонических ссылок лучше всегда предписывать абсолютные ссылки
поскольку, когда вы указываете относительные ссылки, существует очень высокая вероятность ошибки:
Тогда поисковые системы просто проигнорируют эти инструкции.
Check your website SEO performance
Get a personalized checklist on how to improve your website to rank higher on Google
No, thanks. I don’t want to improve my SEO Score