Всем привет! За свою «вебмастерскую» карьеру я встречал не один десяток вариантов составления правильного по мнению автора robots.txt для wordpress. Поэтому я решил выложить свой вариант этого файла. За все 3-4 года, что я работаю с этой CMS проблем с индексацией изза роботс.тхт не возникало.
Если у вас нет до сих пор этого файла, то самое время создать его в блокноте и посетить в корень сайта. Правильный robots.txt для яндекса и гугла спешл фор CMS wordpress выглядит так:
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Host: ( здесь указывается основной домен, с www или без, например, www.sayt.ru
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Sitemap: http://vasha-karta-sayta.ru/sitemap.xml ( тут указывается адрес карты сайта )
Также часто можно встретить немного измененные варианты этого файла. Чаще всего изменения касаются удаления строчек ( Disallow: /wp-comments и Disallow: */comments ) для индексации комментариев поисковыми системами. Вот в этой статье подробно описано о важности комментариев. Скажем для этого блога открытие к индексации текста комментариев ( ссылка уже давно открыта, так как блог dofollow) дало прирост трафика +10-15%, так как в комментариях по сути тот же контент и он несет ценность для поисковых машин.
Вторым частым изменением является добавление еще 1 строчки, связанной с картой сайта. Sitemap: http://vasha-karta-sayta.ru/sitemap.xml.gz , но это условие совсем не обязательное.
Страдать извращениями и добавлять User-agent: YandexBlog я смысла не вижу. Вообще robots.txt для вордпресс надо писать индивидуально под свой проект, но в качестве основы то, что я привел выше Вам вполне сгодится.
Всем хорошего дня!
Спасибо за пост. Вы полагаете, сейчас такой подход еще оправдан?
Вордпресс вроде бы своими силами создает этот файл…правда мне пока не хватает опыта оценить — насколько автоматически сгенерированный файл хуже специального:)
Вордпресс конечно сам генерирует данный файл, но он в нем закрывает от индексации только админку и служебные файлы.
остальное приходиться доделывать самому.
Если этого не сделать будет куча дублированного контента.
Я думаю для WordPress хватит и динамического robots, только нужно плагин Google XML Sitemaps установить обязательно, и в нём поставить галочку что-бы в динамическом robots генерировалась ссылка на карту сайта.
Как раз искал как составить роботс для первого проекта. Буду знать.
Скажите,а если на вордпрессе блог не ведется, тоесть я зделал обычный сайт, создал файл Роботс но поисковые системы меня не хотят индексировать, что делать?
Добавить сайт самомуЖ
Яндекс Аддурилка: http://webmaster.yandex.ru/addurl.xml
Google Аддурилка: http://www.google.ru/addurl/