Перейти к публикации
Дизайн и модификация IPS Community IPBSkinsBETA
Поиск в
  • Дополнительно...
Искать результаты, содержащие...
Искать результаты в...
wick

Документ является неканоническим - Ошибки в яндексе

Рекомендованные сообщения

03/04/15 13:50 (изменено)

Что за ошибка и как от неё избавиться?

post-57740-0-07627500-1425476571_thumb.jpg

 

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Изменено пользователем wick

Поделиться сообщением


Ссылка на сообщение

Эти ошибки носят информативный характер. Это означает что не надо сломя голову бежать и все "исправлять", особенно то, что исключено роботсом - понятно, да, что раз документ запрещен в robots.txt значит так и должно быть и это будет отражено в "ошибках". Веб-мастера информируют, что эти адреса не проиндексированы по таким-то причинам. "Документ является неканоническим" означает что неканонические ссылки, т.е. дубли, были исключены. То же касается и остальных ошибок.

 

 

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Старые адреса не соответствуют новым каноническим адресам, поэтому старые были исключены и новые проиндексированы (будут).

Поделиться сообщением


Ссылка на сообщение

странно что в индексе обычные ссылки, а в блоке ЧПУ ссылки и их количество превышает количество проиндексированых

Поделиться сообщением


Ссылка на сообщение

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

  • Upvote 1

Поделиться сообщением


Ссылка на сообщение

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

Спасибо за инфу.

Поделиться сообщением


Ссылка на сообщение

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

post-57740-0-78965500-1426405907_thumb.jpg

Поделиться сообщением


Ссылка на сообщение

На 2.3 небыло канонического тега, небыло роботс'а который поставлялся вместе с дистрибутивом, поэтому небыло и никаких "ошибок" - бот индексировал все подряд, весь мусор и дубли на форуме. Откуда там 200 000 страниц? Для этого надо иметь примерно 150 тысяч тем. Вы вкурсе что одна страница может иметь как минимум 15 дублей в зависимости от количество сообщений на странице, потом были разные режима просмотра - древовидный, линейный. Понятно, что реально целевые страницы были в десять раз меньше, а все остальное были дубли. Ваша проблема в том, что вы видимо не понимаете, что эти ошибки причины по которым бот не проиндексировал страницы. Причины могут быть разные - вебмастер запретил индексацию, указал канонический адрес, а может быть наоборот из-за незнания и криворукости закрыл к индексации половину форума. В этих ошибках указывается какие адреса были исключены из поиска, по ним можно определить нет ли действительно каких-то ошибках на форуме что мешает индексации нормальным url.

Поделиться сообщением


Ссылка на сообщение

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

 

Документ является неканоническим - это не ошибка. Погуглите хоть, что значит неканонический документ, что такое дубли страниц и зачем нужен rel='canonical'

Поделиться сообщением


Ссылка на сообщение

Оно не то что не ошибка, это причина исключения. Если всунуть левый тег который будет указывать для всех страниц один и тот же канонический адрес тогда это действительно будет ошибкой. В данном случае эти страницы исключены правильно.

  • Upvote 1

Поделиться сообщением


Ссылка на сообщение

подскажите к какому модулю или вообще к чему эта ссылка

/index.php?app=forums&module=forums&section=markasread&marktype=forum&forumid=41&returntoforumid=0&i=1

Вчера в гугле появилось сотен 5 ошибок с этим "markasread&marktype"

 

Роботу Googlebot не удалось просканировать URL, поскольку для него заблокирован доступ к сайту или для просмотра страницы требуется аутентификация на сервере.

Поделиться сообщением


Ссылка на сообщение

section=markasread&marktype=forum

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

Поделиться сообщением


Ссылка на сообщение

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

подскажите пожалуйста как запретить их, ну то есть как выглядит ссылка или каталог который надо запретить. Спасибо

Поделиться сообщением


Ссылка на сообщение
подскажите пожалуйста как запретить их

А потом еще других стоппицот ссылок найдете. Есть стандартный роботс который изначально настроен чтобы исключить большинство дублей и служебных страниц. Пользуйтесь им.

 

 

ну то есть как выглядит ссылка или каталог который надо запретить

Ссылка у вас перед глазами.

Поделиться сообщением


Ссылка на сообщение

Спасибо большое, если бы ещё знать где взять этот стандартный роботс )

Поделиться сообщением


Ссылка на сообщение

Он у вас в корне фтп. robotstxt.txt или robots.txt

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×
×
  • Создать...