wick Posted March 4, 2015 Share Posted March 4, 2015 (edited) Что за ошибка и как от неё избавиться? в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндекса Edited March 4, 2015 by wick Link to comment Share on other sites More sharing options...
siv1987 Posted March 4, 2015 Share Posted March 4, 2015 Эти ошибки носят информативный характер. Это означает что не надо сломя голову бежать и все "исправлять", особенно то, что исключено роботсом - понятно, да, что раз документ запрещен в robots.txt значит так и должно быть и это будет отражено в "ошибках". Веб-мастера информируют, что эти адреса не проиндексированы по таким-то причинам. "Документ является неканоническим" означает что неканонические ссылки, т.е. дубли, были исключены. То же касается и остальных ошибок. в списке ошибок ссылки ЧПУ, то есть после включения ЧПУ, все ссылки ушли в блокировку яндексаСтарые адреса не соответствуют новым каноническим адресам, поэтому старые были исключены и новые проиндексированы (будут). Link to comment Share on other sites More sharing options...
wick Posted March 4, 2015 Author Share Posted March 4, 2015 странно что в индексе обычные ссылки, а в блоке ЧПУ ссылки и их количество превышает количество проиндексированых Link to comment Share on other sites More sharing options...
siv1987 Posted March 4, 2015 Share Posted March 4, 2015 Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще. 1 Link to comment Share on other sites More sharing options...
wick Posted March 4, 2015 Author Share Posted March 4, 2015 Индекс обновляется не сразу. Есть такое понятие как поисковой АП. Все зависит от того самого "траста" сайта, насколько он является обновляемым и посещаемым ресурсом. Там, где посещаемость десятки тысяч пользователей ежедневно и обновляется ежеминутно соответственно и бот будет сканировать его чаще.Спасибо за инфу. Link to comment Share on other sites More sharing options...
wick Posted March 15, 2015 Author Share Posted March 15, 2015 на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц ( Link to comment Share on other sites More sharing options...
siv1987 Posted March 15, 2015 Share Posted March 15, 2015 На 2.3 небыло канонического тега, небыло роботс'а который поставлялся вместе с дистрибутивом, поэтому небыло и никаких "ошибок" - бот индексировал все подряд, весь мусор и дубли на форуме. Откуда там 200 000 страниц? Для этого надо иметь примерно 150 тысяч тем. Вы вкурсе что одна страница может иметь как минимум 15 дублей в зависимости от количество сообщений на странице, потом были разные режима просмотра - древовидный, линейный. Понятно, что реально целевые страницы были в десять раз меньше, а все остальное были дубли. Ваша проблема в том, что вы видимо не понимаете, что эти ошибки причины по которым бот не проиндексировал страницы. Причины могут быть разные - вебмастер запретил индексацию, указал канонический адрес, а может быть наоборот из-за незнания и криворукости закрыл к индексации половину форума. В этих ошибках указывается какие адреса были исключены из поиска, по ним можно определить нет ли действительно каких-то ошибках на форуме что мешает индексации нормальным url. Link to comment Share on other sites More sharing options...
kgb Posted March 15, 2015 Share Posted March 15, 2015 на 2.3.6 всего ошибок было около 200 шт. загружено яндексом страниц более почти 200 000, проиндексировано было 40 000 страниц. Сейчас ошибок в десять раз больше чем проиндексированных страниц ( Документ является неканоническим - это не ошибка. Погуглите хоть, что значит неканонический документ, что такое дубли страниц и зачем нужен rel='canonical' Link to comment Share on other sites More sharing options...
siv1987 Posted March 15, 2015 Share Posted March 15, 2015 Оно не то что не ошибка, это причина исключения. Если всунуть левый тег который будет указывать для всех страниц один и тот же канонический адрес тогда это действительно будет ошибкой. В данном случае эти страницы исключены правильно. 1 Link to comment Share on other sites More sharing options...
wick Posted March 17, 2015 Author Share Posted March 17, 2015 подскажите к какому модулю или вообще к чему эта ссылка /index.php?app=forums&module=forums§ion=markasread&marktype=forum&forumid=41&returntoforumid=0&i=1Вчера в гугле появилось сотен 5 ошибок с этим "markasread&marktype" Роботу Googlebot не удалось просканировать URL, поскольку для него заблокирован доступ к сайту или для просмотра страницы требуется аутентификация на сервере. Link to comment Share on other sites More sharing options...
siv1987 Posted March 17, 2015 Share Posted March 17, 2015 section=markasread&marktype=forummarkasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал. Link to comment Share on other sites More sharing options...
wick Posted March 17, 2015 Author Share Posted March 17, 2015 markasread - отметь форум как прочитанный. Обычно их запрещают в роботс чтобы бот их зря не дергал.подскажите пожалуйста как запретить их, ну то есть как выглядит ссылка или каталог который надо запретить. Спасибо Link to comment Share on other sites More sharing options...
siv1987 Posted March 17, 2015 Share Posted March 17, 2015 подскажите пожалуйста как запретить ихА потом еще других стоппицот ссылок найдете. Есть стандартный роботс который изначально настроен чтобы исключить большинство дублей и служебных страниц. Пользуйтесь им. ну то есть как выглядит ссылка или каталог который надо запретитьСсылка у вас перед глазами. Link to comment Share on other sites More sharing options...
wick Posted March 17, 2015 Author Share Posted March 17, 2015 Спасибо большое, если бы ещё знать где взять этот стандартный роботс ) Link to comment Share on other sites More sharing options...
Атаман Posted March 18, 2015 Share Posted March 18, 2015 Он у вас в корне фтп. robotstxt.txt или robots.txt Link to comment Share on other sites More sharing options...
Recommended Posts
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now