Правильный robots.txt для CMS wordpress

Правильный robots.txt для CMS wordpress
Правильный robots.txt для CMS wordpress

Всем привет! За свою «вебмастерскую» карьеру я встречал не один десяток вариантов составления правильного по мнению автора robots.txt для wordpress. Поэтому я решил выложить свой вариант этого файла. За все 3-4 года, что я работаю с этой CMS проблем с индексацией изза роботс.тхт не возникало.

Если у вас нет до сих пор этого файла, то самое время создать его в блокноте и посетить в корень сайта. Правильный robots.txt для яндекса и гугла спешл фор CMS wordpress выглядит так:

User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Host: ( здесь указывается основной домен, с www или без, например, www.sayt.ru

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments

Sitemap: http://vasha-karta-sayta.ru/sitemap.xml ( тут указывается адрес карты сайта )

Также часто можно встретить немного измененные варианты этого файла. Чаще всего изменения касаются удаления строчек ( Disallow: /wp-comments и Disallow: */comments ) для индексации комментариев поисковыми системами. Вот в этой статье подробно описано о важности комментариев. Скажем для этого блога открытие к индексации текста комментариев ( ссылка уже давно открыта, так как блог dofollow) дало прирост трафика +10-15%, так как в комментариях по сути тот же контент и он несет ценность для поисковых машин.

Вторым частым изменением является добавление еще 1 строчки, связанной с картой сайта. Sitemap: http://vasha-karta-sayta.ru/sitemap.xml.gz , но это условие совсем не обязательное.

Страдать извращениями и добавлять User-agent: YandexBlog я смысла не вижу. Вообще robots.txt для вордпресс надо писать индивидуально под свой проект, но в качестве основы то, что я привел выше Вам вполне сгодится.

Всем хорошего дня!

Понравилась статья? Поделиться с друзьями:
Комментарии: 119
  1. Виктор

    Спасибо. Мне сейчас такая статья очень кстати.

  2. Влади

    Спасибо за дельный и детальный совет еще и приложением файла. Давно искал эту инфу, никак не мог найти правильного решения, почему так долго мой сайт яндексом индексируется. Теперь ясно. Спасибо. Подписался.
    PS пазл — каптча прикольная)))) поиграл)

  3. Александр

    Роботс полезная штука. Файл нужно закидывать на сайт сразу же после создания и заливки шаблона. провел небольшой эксперимент и лично убедился в скорости индексации с роботс. Сайт без этого файла долго индексируется (лично у меня было так)

  4. Sergei

    Интересная статья. Попробую себе такой роботс поставить.

  5. Александр Дюбченко

    Если на блоге есть постраничная навигация (выводятся все статьи, например, по 5 на странице) в robots.txt стоит добавлять строчку Disallow: /page, т.к. это будут копии главной страницы — а они обычно не нужны.

    1. Алексей

      Вот за этот совет — спасибо. Добавил себе disallow: /page

Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: