Что такое файл robots.txtЧто такое файл robots.txtRobots.txt – это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов. Эти инструкции могут запрещать к индексации некоторые разделы или страницы на сайте, как для всех, так и для определённых, роботов. К файлу robots.txt предъявляются специальные требования, не выполнение которых может привести к неправильному считыванию роботом поисковой системы или вообще к неработоспособности данного файла. Как создать robots.txtRobots.txt должен создаваться в текстовом формате Unix. Воспользуйтесь любым текстовым редактором, создайте файл с именем "robots.txt" и заполните его в соответствии с представленными ниже правилами. Файл robots.txt должен находиться только в корневой директории сайта, только тогда он будет учитываться поисковыми системами. robots.txt является регистрозависимым, называть файл необходимо robots.txt, Robots.txt будет уже ошибкой. После этого необходимо загрузить файл в корневой каталог вашего сайта. Всегда после того, как вы закачали файл robots.txt на сервер, проверяйте его. Достаточно в броузере набрать простой запрос: http://ваш_сайт/robots.txt Проверка синтаксисаИнструмент Проверка файла robots.txt показывает, не блокирует ли ваш файл robots.txt доступ поискового робота к файлам и каталогам вашего сайта и не разрешает ли он сканирование файлов, которые не должны появляться в Интернете. Для проверки синтаксиса и структуры файла robots.txt существует ряд специализированных онлайн-служб. Служба яндекса - Gogle webmasters - Содержимое файла robots.txtПолностью пустой файл robots.txt эквивалентен его отсутствию, что предполагает разрешение на индексирование всего сайта. User-agent: содержит название робота. Disallow: URL-адреса, которые необходимо заблокировать. User-agent: * - разрешение индексировать всем роботам. Disallow: - разрешение индексировать всё содержимое сайта. Disallow: / - запрет на индексацию всего сайта. Disallow: /name – запрет на индексацию любых файлов и директорий, которые называются или имеют в своём названии name. Disallow: /name/ - запрет на индексацию директории name. Disallow: /*.gif$ - запрет на индексацию всех файлов, имеющих расширение .gif. Disallow: /name.php – запрет на индексацию файла name.php. Disallow: /name.php?action=print – запрет индексации переменной, например, страниц для печати. Allow: / - всё наоборот (разрешается индексировать), синтаксис такой же, как и с Disallow Примеры Разрешает доступ всех роботов ко всему сайту: User-agent: * Disallow: Запрет доступа всех роботов ко всему сайту: User-agent: * Disallow: / Запрещает роботу Roverdog индексировать все файлы сервера: User-agent: Roverdog Disallow: / Запрещает роботу googlebot индексировать файл cheese.htm: User-agent: googlebot Disallow: cheese.htm Чтобы сообщить поисковым системам местоположение файла Sitemap, можно в robots.txt добавить строку вида: Sitemap: http://ваш_сайт/sitemap.xml |
Баннеров в ротаторе: 0 Смотреть все Добавить баннер |