Дублированный контент, WordPress, тег rel=canonical
В поисках ответа на вопрос о дублированном контенте на блогах с движком WordPress нашел что-то похожее на решение, правда только под Google с Yahoo и MSN до кучи:
1 | <strong><link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" /></strong> |
Поддержка этого тега сразу была взята на вооружение различными как специализированными, так и многофункциональными плагинами. Например, All in One SEO.
Насколько я понял из описания, rel=»canonical» предназначен для конкретизации первоисточника для страниц использующих сессии, т.е., имеющих дополнительные параметры после основного URL страницы. В первую очередь для форумов, гостевых книг, и т.п. Ничего объясняющего, как поступать с категориями, архивами и пр. я не нашел! Однако в комментариях и в русскоязычной блогосфере считают что это решает все проблемы внутрисайтового «плагиата». Например, Сергей Кокшаров заявляет:
Теперь нет надобности использовать robots.txt для запрета индексации таких страниц, как “печатная версия” и других дубликатов (напр. в WordPress нужно было закрывать путь /tag/) и угождать каждому поисковику отдельно (есть общие стандарты для robots.txt, но есть также и ряд особенностей работы каждого поисковика с этим файлом, поэтому мы раньше не могли предусмотреть запрет индексации некоторых страниц сразу для всех ботов).
© Новый тег
rel=canonical для удаления дубликатов страниц
С какого перепуга «не надо» опять же, не понятно. Открываю, например, HTML страницы категорий «Анализ сайта«. Вижу тег:
1 | <strong><link rel="canonical" href="http://blog.negotiant.org/seo/analiz-sajta/" /></strong> |
т.е., указывается, что основная страница сайта — это http://blog.negotiant.org/seo/analiz-sajta/. Но на ней полно дублированного контента со страниц с публикациями! И как тут Google должен выяснять где основной текст, а где дубликат?
А с категориями и тегами может и правда, того… В noindex?
P.S. Так же напомню про интересный способ выявления платных ссылок, путем добавления различных параметров к основному URL страницы.
2 Комментариев
мая 20, 2009
было дело я тоже пытался вникнуть, поставил себе плагин, а результата не видно, перерыл весь свой wp и не нашол использование этого тэга, плюнул и отключил плагин
Трэкбеки
Добавить комментарий