robots.txt — это текстовый файл, который используется для того, чтобы запретить роботам (в частности ботам поисковых систем) индексацию и «обход» определенных частей вашего сайта. Без этого файла боты смогут свободно гулять по вашему сайту, что не очень то и хорошо.
По-умолчанию WordPress не создает файл robots.txt, поэтому его необходимо создать самостоятельно и настроить тоже самому.
Общий смысл запрета доступа к определенным частям вашего сайта в том, чтобы сфокусировать внимание роботов на важном контенте.
Что произойдет, если у вас не будет файла robots.txt?
Вкратце, будет индексироваться все подряд.
Для WordPress это означает следующее:
- /cgi-bin
- /wp-admin
- /wp-includes
- /wp-content/themes
- /wp-content/plugins/
Как вы уже, наверное, догадались, ничего из вышеперечисленного не является релевантным контентом для SEO и может даже навредить вашему сайту. Google разрешает только определенное количество «ссылочного мусора», поэтому имеет смысл сконцентрировать усилия на контенте и страницах.
Как можно контролировать индексацию своего сайта?
Решение очень простое.
Создайте текстовый файл, используя ваш любимый текстовый редактор, или же, если на хостинге у вас установлена Cpanel, то создайте новый файл в файловом менеджере и назовите его robots.txt.
Скопируйте и вставьте в него следующее:
5 | Disallow: /wp-content/themes |
6 | Disallow: /wp-content/plugins/ |
7 | Allow: /wp-content/uploads |
Сохраните файл. Если же вы создали его вне сервера, то просто загрузите в корневую директорию сайта. Это та же директория, где расположены папки wp-admin, wp-includes и wp-content.
Вот и все. Теперь вы заметите, что некоторые ссылки сайта станут выпадать из поиска в течение нескольких дней или даже недель.
Если вы захотите добавить другие файлы, просто добавьте правило вроде этого:
Обратите внимание, что мы пропускаем домен сайта, а добавляем путь к папке начиная с прямого слеша (/).
За несколько лет работы с WordPress мы собрали для себя оптимальный «набор» правил для robots.txt. Ниже приводим его содержание. Его можно взять за основу, однако стоит разобраться что именно вы закроете от индексации. Некоторые вебмастера предпочитают закрывать рубрики и теги, другие же — наоборот, оставляют открытыми для ботов.
6 | Disallow: /wp-register.php |
8 | Disallow: /template.html |
12 | Disallow: /wp-content/plugins |
13 | Disallow: /wp-content/cache |
14 | Disallow: /wp-content/themes |
22 | Disallow: */feednt-page-* |
37 | Allow: /wp-content/uploads/ |
43 | User-agent: Googlebot-Image |
74 | Disallow: */feednt-page-* |
89 | Allow: /wp-content/uploads/ |
VN:F [1.9.22_1171]
Rating: 5.0/5 (3 votes cast)