Что такое канонический адрес страницы и как его указать
Одна из технических ошибок, которая встречается при оптимизации сайта — страницы с одинаковым контентом. Например, страницы https://site.com/company и https://site.com/about-us имеют идентичное содержимое, но разные URL-адреса. В таком случае, поисковые системы могут автоматически объединить страницы с одинаковым контентом в группу «дублей». В группе будет выбрана основная страница, которая будет показываться в поисковой выдаче. Остальные страницы будут признаны дублями и исключаться из индекса. Проблема в том, что поисковые роботы могут выбрать основную страницу не ту, которую владелец сайта считает основной.
Также может быть, что поисковые роботы не создадут группу дублей. В результате страницы с одинаковым контентом начнут конкурировать друг с другом. Роботы будет дольше индексировать сайт из-за того, что придется сканировать дублирующие страницы. Все это может негативно сказаться на позициях сайта в выдаче.
Разные ссылки на одну страницу могут возникать, когда существует несколько версий сайта (десктопная и мобильная) или при пагинации.
Чтобы избежать проблем в ситуациях, когда на сайте есть страницы с одинаковым контентом, необходимо самостоятельно определить, какая страница считается основной — канонической. Поисковые роботы будет индексировать страницу с каноническим URL-адресом.
Указать канонический адрес страницы через HTML-код
Этот вариант подходит для HTML‑страниц. Для файлов, в частности, PDF, таким способом указать канонический URL-адрес нельзя.
Предположим, что на одну и ту же страницу ведут две ссылки: https://site.com/company и https://site.com/about-us. В качестве канонической страницы необходимо сделать — https://site.com/company. Тогда в HTML-код страницы https://site.com/about-us необходимо добавить элемент link:
Указать канонический адрес страницы в заголовке HTTP
Предположим, что на сайте размещен файл с расширением PDF, на который ведут две ссылки: https://site.com/company/file.pdf и https://site.com/files/file.pdf. В качестве канонической страницы необходимо сделать — https://site.com/files/file.pdf. Тогда для страницы https://site.com/company/file.pdf необходимо настроить сервер так, чтобы он передавал в HTTP-заголовке следующее:
Если контент на страницах различается, робот может проигнорировать указание, в результате все страницы будут проиндексированы.
Если в URL-адресе неканонической страницы содержатся GET-параметры или метки, для исключения ее из индекса нужно в файле robots.txt прописать директиву Clean-param.
Указание канонических адресов страниц является важным элементом оптимизации для поисковых систем. Оно помогает роботам индексировать необходимые страницы, а также избежать проблем с дублированием контента. Правильное использование канонического адреса помогает улучшить видимость сайта в результатах поиска и повысить его позиции.