Какие ошибки могут помешать роботу Яндекс индексировать ваш сайт

Здравствуйте, читатели блога Сайт с нуля.

Чтобы ваш интернет-ресурс был проиндексирован, на него должны регулярно заходить роботы от поисковых систем — Яндекс, Google, Mail.ru и других.

Но иногда в процессе получения данных о вашем сайте у этих роботов могут возникнуть трудности — невозможность загрузить страницу, документ, файл, не удается распознать dns или кодировку.

Если взять к примеру Яндекс, вы можете узнать о таких проблемах в Яндекс.Вебмастер.

О возможных видах проблем, с которыми может столкнуться робот этой поисковой системы мы и расскажем.

Ошибки загрузки

Перечень ошибок, возвращаемых роботом Яндекса в случае, если ему не удалось загрузить какой-либо документ с вашего сайта.

Ошибка Описание
Обрыв соединения При попытке загрузить документ произошел обрыв соединения. Загрузка документа была прекращена после нескольких попыток.
Размер текста превышает заданный предел Документ слишком длинный, попробуйте разбить его на части.
Документ запрещен в файлеrobots.txt Документ не индексируется, так как запрещен вами или другим администратором сайта в файле robots.txt.
Неверный адрес документа Адрес документа не соответствует стандарту HTTP.
Формат документа не поддерживается Сервер не указывает тип документа, указывает неправильно или указанный тип не поддерживается Яндексом.
Ошибка DNS Ошибка DNS. Не удается определить IP-адрес хоста по его имени.
Статус-код HTTP не соответствует стандарту Сервер возвращает код статуса не соответствующий стандарту HTTP.
Неверный HTTP-заголовок Заголовок HTTP не соответствует стандарту (включая расширение от Яндекса).
Не удалось соединиться с сервером Не удалось соединиться с сервером.
Неверная длина сообщения Не указана или неправильно указана длина сообщения.
Неверная кодировка Неправильно задан заголовок transfer-encoding или указан неизвестный тип кодирования.
Передано неверное количество данных Длина переданных данных не соответствует заявленной длине, то есть передача данных завершается до или продолжается после получения заявленного количества данных.
Длина HTTP-заголовков превышает предел Длина HTTP-заголовков превысила предел. Возможно, это вызвано попыткой передать слишком много cookies.
Длина URL превышает предел Длина адреса (URL) превышает предел.

 

Ошибки обработки

Перечень ошибок, возвращаемых роботами в случае, если после удачной загрузки документа дальнейшая обработка оказалась невозможной.

Ошибка Описание
Документ содержит мета-тег noindex Документ не индексируется, так как содержит мета-тег noindex.
Неверная кодировка Документ содержит символы не соответствующие заявленной кодировке.
Документ является логом сервера Документ распознан как лог сервера. Если это страница, созданная для посетителей сайта, попробуйте изменить ее так, чтобы она не была похожа на лог сервера.
Неверный формат документа При анализе документа обнаружено несоответствие документа заявленному формату (HTML, PDF, DOC, RTF, SWF, XLS, PPT).
Кодировка не распознана Кодировка документа не распознана. Возможно, документ не содержит текста или содержит текст в различных кодировках.
Язык не поддерживается Язык документа не распознан или не поддерживается. Подробнее ознакомиться со всеми поддерживаемыми языками можно в соответствующем разделе помощи.
Документ не содержит текста Сервер возвращает пустой документ.
Слишком много ссылок Количество ссылок на странице превышает допустимый предел.
Ошибка распаковывания Произошла ошибка при распаковывании GZIP- или DEFLATE-потока данных с сервера.
Пустой ответ сервера От сервера получен ответ нулевой длины. Обратитесь к администратору сервера, на котором находится сайт.
Документ не является каноническим В коде документа элемент link содержит атрибут rel со значением canonical, который указывает на другой (канонический) документ. Вместо данного документа проиндексирован канонический.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

  bigmir)net TOP 100  - .  E-mail: sitesnulyaru@gmail.com