Robots.txt

Бот	Функция
Google
Googlebot	основной индексирующий робот Google
Googlebot-News	Google Новости
Googlebot-Image	Google Картинки
Googlebot-Video	видео
Mediapartners-Google	Google AdSense, Google Mobile AdSense
Mediapartners	Google AdSense, Google Mobile AdSense
AdsBot-Google	проверка качества целевой страницы
AdsBot-Google-Mobile-Apps	Робот Google для приложений
Яндекс
YandexBot	основной индексирующий робот Яндекса
YandexImages	Яндекс.Картинки
YandexVideo	Яндекс.Видео
YandexMedia	мультимедийные данные
YandexBlogs	робот поиска по блогам
YandexAddurl	робот, обращающийся к странице при добавлении ее через форму «Добавить URL»
YandexFavicons	робот, индексирующий пиктограммы сайтов (favicons)
YandexDirect	Яндекс.Директ
YandexMetrika	Яндекс.Метрика
YandexCatalog	Яндекс.Каталог
YandexNews	Яндекс.Новости
YandexImageResizer	робот мобильных сервисов
Bing
Bingbot	основной индексирующий робот Bing
Yahoo!
Slurp	основной индексирующий робот Yahoo!
Mail.Ru
Mail.Ru	основной индексирующий робот Mail.Ru
Rambler
StackRambler	Ранее основной индексирующий робот Rambler. Однако с 23.06.11 Rambler перестает поддерживать собственную поисковую систему и теперь использует на своих сервисах технологию Яндекса. Более не актуально.

Показать комментарии

Andrey Guru says:

16.09.2017 at 15:25

А почему в User-agent: * не прописаны:

Allow: /*/*.js
Allow: /*/*.css
Allow: */uploads

Denis Bisteinoff says:

16.09.2017 at 17:55

Конкретно в этой статье приведен базовый robots.txt для сайтов, которые могут быть на совершенно разных движках (CMS). Вы его можете взять за основу и дорабатывать под особенности вашего конкретного сайта. Не обязательно, что у вас будет папка /uploads/ для изображений. Где-то это может быть /files/ или /images/ или вообще какое-то специфическое месторасположение. Где-то, возможно, вы вообще никак не закрываете от индексирования папки с изображениями, JS и CSS, и вам не стоит беспокоиться, чтобы их открыть отдельно.

Кстати, на некоторых CMS недостаточно двух уровней вложенности для правил вида Allow: /*/*.js - нужно увеличивать - например, Allow: /*/*/*.js - чтобы все JS, CSS и изображения индексировались.

Все это проверяйте в системах вебмастер тех поисковых систем, под которые продвигаете сайт.

Мария says:

05.10.2017 at 23:45

Добрый вечер! Очень прошу помощи! Я не асс в деле настройки сайтов. Обратились к девушке, нашли объявление в интернете, она за очень немаленькую сумму сайт сделала, но аже основные параметры не настроила, я сама как могла сайт настроила, потому что трафика входящего вообще не было, но вот с robot.txt испытала сложность. Помогите пож-та правильно сформировать robot.txt .

Denis Bisteinoff says:

06.10.2017 at 03:33

Мария, в разделе Контакты https://seogio.ru/kontakty/ есть информация, как со мной можно связаться.
Услуги по настройке файла robots.txt недорогие. Конечно, если его вообще нужно изменять. Трафик на ваш сайт может быть низким не из-за robots.txt. Но если файл все-таки некорректный, то это может сильно повлиять на продвижение сайта.

Alexandr Semenov says:

13.02.2018 at 13:33

Как убрать из индекса архивные записи 2014/09 и метки я так понимаю /tag/blog ?

Denis Bisteinoff says:

13.02.2018 at 20:21

С помощью правила Disallow.
Указываете часть URL, общую для ссылок, которые нужно закрыть.
Только проверьте, чтобы вы таким образом не закрыли нужные URL.
У каждого сайта могут быть нюансы, поэтому нужно все предварительно проверить.

Alexandr Semenov says:

14.02.2018 at 17:54

Не совсем понял. Есть ссылки с разными окончаниями . Какая тут общая часть, http:// vandruem. com/ 2014/09

http:// vandruem. com/ 2018/01

Denis Bisteinoff says:

14.02.2018 at 22:39

Добавьте:
Disallow: /2014/
Disallow: /2015/
Disallow: /2016/
Disallow: /2017/
Disallow: /2018/
Disallow: /2019/
Disallow: /2020/

Но вот так лучше не делать:
Disallow: /20

Так закроете другие URL, например, такого вида: site.ru/20-sposobov-kak-prodat-slona/

Denis Bisteinoff says:

01.03.2018 at 14:07

Елена, для страниц пагинации лучше настройте canonical
https://seogio.ru/meta-tegi/
Mikhail Dagelis says:

12.03.2018 at 11:29

Добрый день,есть вопрос;вы не по можете составить файл robots для кино сайта движок instantCMS 2,пробовал сам ставить готовые,была перегрузка сервера,потом вставил ваш пример файла Clean-param,нагрузка упала,но вскоре упал и трафик,у меня опыта очень мало,помогите услуги оплачу,с уважением Михаил.

Denis Bisteinoff says:

12.03.2018 at 15:02

Михаил, добрый день!
Просто так копировать нельзя - нужно смотреть, что нужно закрывать от индексирования, а что, наоборот, должно быть открыто для роботов.
Clean-param не мог повлиять на трафик. Если только закрыли индексирование какого-то раздела через Disallow. Либо вообще другие причины, не связанные с robots.txt

Можете мне написать на почту, контакты здесь: https://seogio.ru/kontakty/

Denis Bisteinoff says:

12.04.2018 at 13:40

Похоже на правду.
Но такие вещи нужно всегда проверять через яндекс или гугл вебмастер. Там есть специальный раздел для проверки robots.txt. Для проверки можете указать как реальные, так и выдуманные ссылки.
Олег says:

21.04.2018 at 17:21

Добрый день. Может поможете в таком вопросе ?
Олег says:

21.04.2018 at 17:27

Добрый день. Может поможете в таком вопросе ? В корне сайта почему-то нет этого файла. Когда создаю новый, с помощью инструмента гугл и помещаю его в корень, он тут же исчезает. Исчезает и сам сайт из поиска. После повторной индексации появляется, но ненадолго. Это в гугле. В яндексе всё в порядке. Недавно, в админке я закрывал на несколько дней сайт для индексации. Может это внесло сбой ?

Denis Bisteinoff says:

22.04.2018 at 03:35

Олег, это вопрос к разработчику сайта.
Обычно такого не происходит. Но бывают специфические CSM или плагины для них, из-за которых настройка robots.txt происходит по-другому. Как - надо, чтобы смотрел программист, который делал сайт.

Олег says:

22.04.2018 at 16:40

Спасибо. Будем решать.

Gaucho says:

02.05.2018 at 01:36

Отличная статья, спасибо!
SEOONLY.RU says:

17.08.2018 at 13:27

мерси!

Как влияет robots.txt на индексацию сайта

Директивы robots.txt

User-agent

Disallow и Allow

Sitemap

Host

Crawl-delay

Clean-param

Другие параметры

Закрывающий robots.txt

Правильная настройка robots.txt

Пример robots.txt

Как добавить и где находится robots.txt

Как проверить robots.txt

Типичные ошибки в robots.txt

P.S.

P.S.2

Показать комментарии

Последние публикации

Core Web Vitals: как оптимизировать сайт и улучшить его ранжирование в Яндексе и Google

Чек-лист по SEO оптимизации сайта на 2023 год

Robots.txt для WordPress

Профессия веб-аналитик в современном мире

Протокол HTTP/2 — как проверить и почему это важно для SEO?

SEO умерло?

Robots.txt

Как влияет robots.txt на индексацию сайта

Директивы robots.txt

User-agent

Disallow и Allow

Sitemap

Host

Crawl-delay

Clean-param

Другие параметры

Закрывающий robots.txt

Правильная настройка robots.txt

Пример robots.txt

Как добавить и где находится robots.txt

Как проверить robots.txt

Типичные ошибки в robots.txt

P.S.

P.S.2

Показать комментарии

Похожие страницы

Последние публикации

Core Web Vitals: как оптимизировать сайт и улучшить его ранжирование в Яндексе и Google

Чек-лист по SEO оптимизации сайта на 2023 год

Robots.txt для WordPress

Профессия веб-аналитик в современном мире

Протокол HTTP/2 — как проверить и почему это важно для SEO?

SEO умерло?