Документ является неканоническим - Ошибки в яндексе

wick · 4 марта 2015

Что за ошибка и как от неё избавиться?

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Изменено 4 марта 2015 пользователем wick

siv1987 · 03/04/15 14:15

Эти ошибки носят информативный характер. Это означает что не надо сломя голову бежать и все "исправлять", особенно то, что исключено роботсом - понятно, да, что раз документ запрещен в robots.txt значит так и должно быть и это будет отражено в "ошибках". Веб-мастера информируют, что эти адреса не проиндексированы по таким-то причинам. "Документ является неканоническим" означает что неканонические ссылки, т.е. дубли, были исключены. То же касается и остальных ошибок.

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Старые адреса не соответствуют новым каноническим адресам, поэтому старые были исключены и новые проиндексированы (будут).

wick · 03/04/15 14:18

странно что в индексе обычные ссылки, а в блоке ЧПУ ссылки и их количество превышает количество проиндексированых

siv1987 · 03/04/15 14:22

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

wick · 03/04/15 14:25

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

Спасибо за инфу.

wick · 03/15/15 07:53

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

siv1987 · 03/15/15 09:04

На 2.3 небыло канонического тега, небыло роботс'а который поставлялся вместе с дистрибутивом, поэтому небыло и никаких "ошибок" - бот индексировал все подряд, весь мусор и дубли на форуме. Откуда там 200 000 страниц? Для этого надо иметь примерно 150 тысяч тем. Вы вкурсе что одна страница может иметь как минимум 15 дублей в зависимости от количество сообщений на странице, потом были разные режима просмотра - древовидный, линейный. Понятно, что реально целевые страницы были в десять раз меньше, а все остальное были дубли. Ваша проблема в том, что вы видимо не понимаете, что эти ошибки причины по которым бот не проиндексировал страницы. Причины могут быть разные - вебмастер запретил индексацию, указал канонический адрес, а может быть наоборот из-за незнания и криворукости закрыл к индексации половину форума. В этих ошибках указывается какие адреса были исключены из поиска, по ним можно определить нет ли действительно каких-то ошибках на форуме что мешает индексации нормальным url.

kgb · 03/15/15 09:09

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

Документ является неканоническим - это не ошибка. Погуглите хоть, что значит неканонический документ, что такое дубли страниц и зачем нужен rel='canonical'

siv1987 · 03/15/15 09:16

Оно не то что не ошибка, это причина исключения. Если всунуть левый тег который будет указывать для всех страниц один и тот же канонический адрес тогда это действительно будет ошибкой. В данном случае эти страницы исключены правильно.

wick · 03/17/15 17:15

подскажите к какому модулю или вообще к чему эта ссылка

/index.php?app=forums&module=forums&section=markasread&marktype=forum&forumid=41&returntoforumid=0&i=1

Вчера в гугле появилось сотен 5 ошибок с этим "markasread&marktype"

Роботу Googlebot не удалось просканировать URL, поскольку для него заблокирован доступ к сайту или для просмотра страницы требуется аутентификация на сервере.

siv1987 · 03/17/15 18:52

section=markasread&marktype=forum

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

wick · 03/17/15 20:40

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

подскажите пожалуйста как запретить их, ну то есть как выглядит ссылка или каталог который надо запретить. Спасибо

siv1987 · 03/17/15 20:45

подскажите пожалуйста как запретить их

А потом еще других стоппицот ссылок найдете. Есть стандартный роботс который изначально настроен чтобы исключить большинство дублей и служебных страниц. Пользуйтесь им.

ну то есть как выглядит ссылка или каталог который надо запретить

Ссылка у вас перед глазами.

wick · 03/17/15 21:10

Спасибо большое, если бы ещё знать где взять этот стандартный роботс )

Атаман · 03/18/15 04:33

Он у вас в корне фтп. robotstxt.txt или robots.txt

Документ является неканоническим - Ошибки в яндексе

Рекомендованные сообщения

wick 2

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

kgb 35

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

siv1987 2630

Поделиться сообщением

Ссылка на сообщение

wick 2

Поделиться сообщением

Ссылка на сообщение

Атаман 465

Поделиться сообщением

Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Создать аккаунт

Войти

Сейчас на странице 0 пользователей

Сообщество