Анализ файла Sitemap используется для обнаружения ошибок, которые создают помехи для правильной индексации. Подобных багов встречается немало и важно знать, как с ними справиться.
Что являет собой карта сайта?
Sitemap – текстовый документ, который имеет формат xml и txt. В нем содержится полный перечень ссылочной массы на разделы, подразделы, отдельные страницы, которые продвигаются в поисковых системах. Время от времени поисковый робот дает запрос к файлу Sitemap и анализирует его содержание на наличие новых ссылок. Это позволяет поисковикам быстро определить все изменения на веб-ресурсе и проиндексировать новую информацию. От этих действий изменится скорость появления страниц в поиске и их последующее продвижение. Некоторые сайты могут содержать сразу несколько карт, которые используются для юзеров и роботов. Содержание у них идентичное. Главная отличительная черта заключается в том, что файл создается в формате html, что позволяет лучше разобраться в структуре.
Особенности создания сайтмеп
Чтобы создать карту сайта необходимо взять в работу любой текстовый редактор. Описание ссылочной массы на страницы содержится в документе и обозначается html-тегами. На его создание вручную понадобится много времени. По этой причине лучше прибегнуть к помощи автоматических генераторов. Они в свою очередь отсканируют сайт и будут добавлять ссылки в новый документ.
Как загрузить файл на сервер
Создав документ, следует произвести его выгрузку на сервер. Карта может находиться только в корневой директории. Чтоб поисковая система смогла увидеть Сайтмеп, нужно обозначить определенную директиву в документе robots.txt. Чтобы процесс был сделан максимально быстро, нужно загрузить документ в панели вебмастера.
Как при помощи панели вебмастера проверить достоверность карты сайта
Чтобы осуществить эту операция своими силами и проверить карту сайта на валидность, нужно использовать встроенный инструмент в Гугл Search Console.
Часто встречающиеся ошибки в карте сайта
- URL-адрес выдает код ответа 404. Карта сайта не должна иметь битых ссылок, это может повлечь за собой появление ошибки-404, а значит, не будет произведена индексация и ее попадание в поисковые системы.
- Не осуществляется переход по ссылке. Такая ситуация может иметь место, если они будут задействованы во многих редиректах. Поисковые роботы попросту не смогут их открыть. Это может быть обусловлено несколькими причинами:
- Вместо стабильных перенаправлений между страницами применяются переадресации посредством JavaScript или через мета-тег refresh.
- Используются относительные ссылки вместо абсолютных.
- Недействительный URL. Поисковый робот столкнется с проблемой обработки карты сайта, если в ней есть ссылки на домен высокого уровня.
- Наличие ошибок в адресе ссылочной массы.
- Баги в синтаксисе. Одна из основных и сложных задач анализа файла – проверка корректного использования кодировки, тегов и других параметров. Такие проблемы должен устранять только специалист.
- Большой по весу документ или много ссылочной массы. У поисковых систем есть определенные требования, согласно которыми размер карты сайта не может превышать 10 мегабайт. Док не должен содержать более 50 000 ссылок. Если количество все же больше, следует поделить сайтмеп на пару файлов.
- Некорректный формат даты. Должно соблюдаться соответствие кодировке W3C. Время не является обязательным для указания.
- Применение недопустимых символов в адресной ссылке. Запрещено использовать пробелы, знаки, кавычки.
- Робот не находит Sitemap. Случается так, что поисковику не отображается карта сайта, а значит, в Гугле должно появиться уведомление об этом.
- В карте ресурса есть URL, а доступ к ним заблокирован в файле robots.txt. Для устранение данной ошибки понадобится открыть доступ для индексирования страниц в определенном формате документа.
Устранение ошибок в карте сайта и чекап статуса
Роботы-поисковики занимаются постоянным анализом файла карты сайта и их проверкой на обновления и ошибки. Чтобы быстрее решить проблему, можно через вебмастера панель внести изменения самостоятельно. Важно помнить, что сделать это можно только 10 раз для одного хоста. Если растратить все попытки, в следующий раз можно использовать опцию только по истечению 30 дней.