Jump to content
Дизайн и модификация Invision Community IPBSkinsBETA
Search In
  • More options...
Find results that contain...
Find results in...
Sign in to follow this  
wick

Документ является неканоническим - Ошибки в яндексе

Recommended Posts

Что за ошибка и как от неё избавиться?

post-57740-0-07627500-1425476571_thumb.jpg

 

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Edited by wick

Share this post


Link to post

Эти ошибки носят информативный характер. Это означает что не надо сломя голову бежать и все "исправлять", особенно то, что исключено роботсом - понятно, да, что раз документ запрещен в robots.txt значит так и должно быть и это будет отражено в "ошибках". Веб-мастера информируют, что эти адреса не проиндексированы по таким-то причинам. "Документ является неканоническим" означает что неканонические ссылки, т.е. дубли, были исключены. То же касается и остальных ошибок.

 

 

в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса

Старые адреса не соответствуют новым каноническим адресам, поэтому старые были исключены и новые проиндексированы (будут).

Share this post


Link to post

странно что в индексе обычные ссылки, а в блоке ЧПУ ссылки и их количество превышает количество проиндексированых

Share this post


Link to post

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

  • Upvote 1

Share this post


Link to post

Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.

Спасибо за инфу.

Share this post


Link to post

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

post-57740-0-78965500-1426405907_thumb.jpg

Share this post


Link to post

На 2.3 небыло канонического тега, небыло роботс'а который поставлялся вместе с дистрибутивом, поэтому небыло и никаких "ошибок" - бот индексировал все подряд, весь мусор и дубли на форуме. Откуда там 200 000 страниц? Для этого надо иметь примерно 150 тысяч тем. Вы вкурсе что одна страница может иметь как минимум 15 дублей в зависимости от количество сообщений на странице, потом были разные режима просмотра - древовидный, линейный. Понятно, что реально целевые страницы были в десять раз меньше, а все остальное были дубли. Ваша проблема в том, что вы видимо не понимаете, что эти ошибки причины по которым бот не проиндексировал страницы. Причины могут быть разные - вебмастер запретил индексацию, указал канонический адрес, а может быть наоборот из-за незнания и криворукости закрыл к индексации половину форума. В этих ошибках указывается какие адреса были исключены из поиска, по ним можно определить нет ли действительно каких-то ошибках на форуме что мешает индексации нормальным url.

Share this post


Link to post

на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц (

 

Документ является неканоническим - это не ошибка. Погуглите хоть, что значит неканонический документ, что такое дубли страниц и зачем нужен rel='canonical'

Share this post


Link to post

Оно не то что не ошибка, это причина исключения. Если всунуть левый тег который будет указывать для всех страниц один и тот же канонический адрес тогда это действительно будет ошибкой. В данном случае эти страницы исключены правильно.

  • Upvote 1

Share this post


Link to post

подскажите к какому модулю или вообще к чему эта ссылка

/index.php?app=forums&module=forums&section=markasread&marktype=forum&forumid=41&returntoforumid=0&i=1

Вчера в гугле появилось сотен 5 ошибок с этим "markasread&marktype"

 

Роботу Googlebot не удалось просканировать URL, поскольку для него заблокирован доступ к сайту или для просмотра страницы требуется аутентификация на сервере.

Share this post


Link to post

section=markasread&marktype=forum

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

Share this post


Link to post

markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.

подскажите пожалуйста как запретить их, ну то есть как выглядит ссылка или каталог который надо запретить. Спасибо

Share this post


Link to post
подскажите пожалуйста как запретить их

А потом еще других стоппицот ссылок найдете. Есть стандартный роботс который изначально настроен чтобы исключить большинство дублей и служебных страниц. Пользуйтесь им.

 

 

ну то есть как выглядит ссылка или каталог который надо запретить

Ссылка у вас перед глазами.

Share this post


Link to post

Спасибо большое, если бы ещё знать где взять этот стандартный роботс )

Share this post


Link to post

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...