Опубликовано: 16 сентября 201114 г Здравствуйте, мне нужно что нибудь изменить в robots.txt ?User-agent: * Disallow: /admin/ Disallow: /*&s= Disallow: /*&s=* Disallow: /*?s= Disallow: /*?s=* Disallow: /cache/ Disallow: /converge_local/ Disallow: /hooks/ Disallow: /ips_kernel/ Disallow: /retail/ Disallow: /public/js/ Disallow: /public/style_captcha/ Disallow: /public/style_css/ Disallow: /index.php?app=core&module=task Disallow: /index.php?app=core&module=usercp&tab=forums&area=forumsubs Disallow: /index.php?app=core&module=usercp&tab=forums&area=watch&watch=topic Disallow: /index.php?app=forums&module=extras§ion=forward Disallow: /index.php?app=members&module=messaging Disallow: /index.php?app=members&module=chat Disallow: /index.php?app=members&module=search Disallow: /index.php?app=members&module=search&do=active Disallow: /index.php?&unlockUserAgent=1 Disallow: /*app=core&module=usercp Disallow: /*app=members&module=messaging Disallow: /*&p= Disallow: /*&pid= Disallow: /*&hl= Disallow: /*&start= Disallow: /*view__getnewpost$ Disallow: /*view__getlastpost$ Disallow: /*view__old$ Disallow: /*view__new$ Disallow: /*view__getfirst$ Disallow: /*view__getprevious$ Disallow: /*view__getnext$ Disallow: /*view__getlast$ Disallow: /*page__view__findpost* Disallow: /*&view=getnewpost$ Disallow: /*&view=getlastpost$ Disallow: /*&view=old$ Disallow: /*&view=new$ Disallow: /*&view=getfirst$ Disallow: /*&view=getprevious$ Disallow: /*&view=getnext$ Disallow: /*&view=getlast$ Disallow: /index.php/user/ Disallow: /index.php?app=core&module=global§ion=login Disallow: /index.php?app=core&module=global§ion=lostpass Disallow: /index.php/calendar Disallow: /index.php?app=calendar&module=calendar Disallow: /index.php?app=forums&module=extras§ion=stats&do=who&t= Disallow: /index.php?app=forums&module=forums§ion=attach&tid= Disallow: /index.php?app=core&module=attach§ion=attach&attach_id= Disallow: /index.php?app=core&module=attach§ion=attach&attach_rel_module=post&attach_id= Disallow: /index.php?app=forums&module=extras§ion=rating&t= Disallow: /index.php?app=forums&module=post§ion=post&do=reply_post&f= Disallow: /*app=calendar Disallow: /index.php?app=forums&module=forums§ion=markasread&marktype= Disallow: /index.php?app=core&module=global§ion=login&&do=deleteCookies&k= Disallow: /index.php/index Disallow: /public/style_emoticons/default/ Disallow: /index.php?app=blog&module=display§ion= Disallow: /index.php?app=blog&showblog= Disallow: /index.php?app=blog&show_members_blogs= Disallow: /index.php?app=forums&module=ajax§ion=
Опубликовано: 19 декабря 201114 г Решил не создавать новую ветку. Суть вопроса вот в чем. Гугл у меня на форуме практически живет. Заходит каждые 3-10 минут. Так вот почему он ходит по профилям пользователей и на другие закрытые от индексации страницы. Вот вам текст файла robots.txt User-agent: * Disallow: /admin/ Disallow: /cache/ Disallow: /converge_local/ Disallow: /hooks/ Disallow: /ips_kernel/ Disallow: /retail/ Disallow: /public/style_captcha/ Disallow: /index.php?app=core&module=task Disallow: /index.php?app=core&module=usercp&tab=forums&area=forumsubs Disallow: /index.php?app=core&module=usercp&tab=forums&area=watch&watch=topic Disallow: /index.php?app=forums&module=extras§ion=forward Disallow: /index.php?app=members&module=messaging Disallow: /index.php?app=members&module=chat Disallow: /index.php?app=members&module=search Disallow: /index.php?app=members&module=search&do=active Disallow: /index.php?&unlockUserAgent=1 Disallow: /*app=core&module=usercp Disallow: /*app=core&module=usercp Disallow: /*app=members&module=messaging Disallow: /*&p= Disallow: /*&pid= Disallow: /*&hl= Disallow: /*&start= Disallow: /*view__getnewpost$ Disallow: /*view__getlastpost$ Disallow: /*view__old$ Disallow: /*view__new$ Disallow: /*view__getfirst$ Disallow: /*view__getprevious$ Disallow: /*view__getnext$ Disallow: /*view__getlast$ Disallow: /*&view=getnewpost$ Disallow: /*&view=getlastpost$ Disallow: /*&view=old$ Disallow: /*&view=new$ Disallow: /*&view=getfirst$ Disallow: /*&view=getprevious$ Disallow: /*&view=getnext$ Disallow: /*&view=getlast$ Disallow: /*?s= Disallow: /*&s= Disallow: /index.php?app=core&module=global§ion=login&do=deleteCookies Disallow: /index.php?app=forums&module=extras§ion=rating Disallow: /index.php?app=forums&module=forums§ion=markasread Disallow: /*moderate Disallow: /*user/ Disallow: /*Print Disallow: /*page__p Disallow: /*0__p__ Disallow: /*5__p__ Disallow: /*&pid= Disallow: /*page__pid Вебмастер яндекса, говорит мне что страница с профилями защищена, тобишь файл роботс.тхт работает. В чем может быть причина?
Опубликовано: 19 декабря 201114 г 1. Запрет в роботс означает не индексировать данный урл. Но заглянуть туда бот может.2. Зачем дублировать для яндекс и гугла одни и те же правила? Пишите один раз под общей секцией User-agent: *3. Раньше на главной стоял дле, а форум в папке. Возможно роботс небыл скопирован в корень домена, и поэтому профили попали в индекс. Со временем они выпадут.
Опубликовано: 16 января 201213 г Вот такой вопрос.Мне надо закрыть от индексации альбомы галереи и её главную.Disallow: /gallery/ исключает главную и все последующие страницы с таким путем. К примеру /gallery/image/название фото/ тоже вылетит из индекса по правилу "Disallow: /gallery/"Как мне одновременно закрыть от индексации "/gallery/" и "/gallery/album", но разрешить "/gallery/image/название фото/"
Опубликовано: 16 января 201213 г Allow: /gallery/image/Disallow: /gallery/ Написать после секции User-agent и в таком порядке
Опубликовано: 16 января 201213 г Allow: /gallery/image/Disallow: /gallery/ Написать после секции User-agent и в таком порядкеСпасибо, работает. Я так понимаю блоки с Allow должны быть первыми и идти один за одним, и только потом Disallow.
Опубликовано: 17 августа 201213 г Подскажите пожалуйста как сделать так что бы не индексировался раздел форума.ЧПУ сейчас вида форум11 форум 12 и дальше пошли топик1 топик 2, вот как запретить индексировать именно раздел со всеми топиками внутри?
Опубликовано: 17 августа 201213 г Через роботс этого не сделать. Но можно использовать метатег robots в шаблоне, установив его под условием для нужного раздела. <if test="$this->request['app']=='forums' AND $this->request['f']==id_форума"> <meta name='robots' content='noindex' /> </if> Естественно добавлять в header главного шаблона (globalTemplate)noindex можно заменить на noindex,nofollow чтобы боты еще не ходили по ссылкам.http://googlewebmastercentral.blogspot.com/2007/03/using-robots-meta-tag.html
Опубликовано: 11 октября 201213 г Яндекс индексирует следующее:**.ru/index.php?/tags/forums/%25252525252525252525D0%252525252525252525259E%25252525252525252525D1%2525252525252525252581%25252525252525252525D0%25252525252525252525B0%25252525252525252525D0%25252525252525252525BA%25252525252525252525D0%25252525252525252525B0/ Ясное дело, результат поиска - нулевой Disallow: /*tags/*так правильно в роботс.тхт добавить? и ещё вопросик.у меня для яндекса и гугля одни правила, для все остальных другие можно юзер агент через запятую писать чтоб не повторять гугль и яндекс? Изменено 11 октября 201213 г пользователем Boris
Опубликовано: 12 октября 201213 г так правильно в роботс.тхт добавить?Да. у меня для яндекса и гугля одни правила, для все остальных другие можно юзер агент через запятую писать чтоб не повторять гугль и яндекс?Нельзя
Опубликовано: 17 ноября 201213 г Может для вас мой вопрос покажется глупым но не пинайте сильно просто я никак понять не могу.У меня форум лежит в подкаталоге site.ru/forum/ и соответственно robots.txt находится по адресу site.ru/forum/robots.txtТоесть для поисковиков если я правильно понимаю он не дает совсем никакого результата,так как поисковики кушают именно site.ru/robots.txt Получается что у меня два robots.txtОдин это site.ru/robots.txtвторой это site.ru/forum/robots.txtкак правильно прописать и где его прописать чтоб поисковики кушали и site.ru/forum/robots.txt и site.ru/robots.txtДумал что просто нужно совместить два robots.txt в один файл в корне сайта,но почему то мне кажется что это не правильно!Посоветуйте пожалуйста!
Опубликовано: 17 ноября 201213 г Тоесть для поисковиков если я правильно понимаю он не дает совсем никакого результата,так как поисковики кушают именно site.ru/robots.txtДа. robots.txt может быть только один - в корень домена. Туда вы можете записать правила для любой папки. Думал что просто нужно совместить два robots.txt в один файл в корне сайта,но почему то мне кажется что это не правильно!Это правильно. Почему это должно быть не правильно? /forum/ для бота это обыкновенная папка как и любая другая, например /uploads/, /admin/ и тд. Не писать же в каждой папке отдельный роботс если нужно что-то в них запретить.
Опубликовано: 17 ноября 201213 г Да. robots.txt может быть только один - в корень домена. Туда вы можете записать правила для любой папки. Это правильно. Почему это должно быть не правильно? /forum/ для бота это обыкновенная папка как и любая другая, например /uploads/, /admin/ и тд. Не писать же в каждой папке отдельный роботс если нужно что-то в них запретить.Ок. Спасибо большое за розширенный ответ!
Опубликовано: 15 января 201312 г Подскажите пожалуйста как закрить ссылку на рейтинг видео от индексации в роботсе?ссылки вида /index.php?app=videos&module=extras§ion=rate&video_id=188&rating=1/index.php?app=videos&module=extras§ion=rate&video_id=188&rating=5и т.д...не могу понять как лучше сделать!буду благодарен.
Опубликовано: 15 января 201312 г Конкретно рейтинг к видео можно закрыть следующим способом:Disallow: /*app=videos&module=extras*&rating=
Здравствуйте, мне нужно что нибудь изменить в robots.txt ?