Аналіз файлу Sitemap використовується для виявлення помилок, що створюють перешкоди для правильної індексації. Подібних багів зустрічається чимало і важливо знати, як із ними впоратися.
Що таке картка сайту?
Sitemap – текстовий документ, який має формат xml та txt. У ньому міститься повний перелік маси посилань на розділи, підрозділи, окремі сторінки, які просуваються в пошукових системах. Іноді пошуковий робот пропонує запит до файлу Sitemap і аналізує його зміст на наявність нових посилань. Це дозволяє пошукачам швидко визначити всі зміни на веб-ресурсі та проіндексувати нову інформацію. Від цих дій зміниться швидкість появи сторінок у пошуку та його подальше просування. Деякі сайти можуть містити одночасно кілька карт, які застосовуються для користувачів і роботів. Зміст у них ідентичний. Головна відмінність полягає в тому, що файл створюється у форматі html, що дозволяє краще розібратися в структурі.
Особливості створення мапи сайту
Щоб створити карту сайту, необхідно взяти в роботу будь-який текстовий редактор. Опис маси посилань на сторінки міститься в документі і позначається html-тегами. На його створення вручну знадобиться багато часу. Тому краще вдатися до допомоги автоматичних генераторів. Вони, у свою чергу, відсканують сайт і будуть додавати посилання в новий документ.
Як завантажити файл на сервер
Створивши документ, слід здійснити його вивантаження на сервер. Карта може бути лише у кореневої директорії. Щоб пошукова система спромоглася побачити Сайтмеп, потрібно позначити певну директиву в документі robots.txt. Щоб процес був зроблений якнайшвидше, потрібно завантажити документ у панелі вебмайстра.
Як за допомогою панелі вебмайстра перевірити достовірність картки сайту
Щоб здійснити цю операцію самотужки і перевірити карту сайту на валідність, потрібно використовувати вбудований інструмент у Google Search Console.
Часто зустрічаються помилки у мапі сайту
- URL-адреса видає код відповіді 404. Карта сайту не повинна мати битих посилань, це може спричинити появу помилки-404, а значить, не буде проведена індексація та її потрапляння в пошукові системи.
- Не здійснюється перехід за посиланням. Така ситуація може бути, якщо вони будуть задіяні в багатьох редиректах. Пошукові роботи просто не зможуть їх відкрити. Це може бути обумовлено кількома причинами:
- Замість стабільних перенаправлень між сторінками застосовуються переадресації через JavaScript або через мета-тег refresh.
- Використовуються відносні посилання замість абсолютних.
- Недійсна URL-адреса. Пошуковий робот зіткнеться з проблемою обробки картки сайту, якщо вона має посилання на домен високого рівня.
- Наявність помилок на адресі маси посилань.
- Баги у синтаксисі. Одне з основних та складних завдань аналізу файлу – перевірка коректного використання кодування, тегів та інших параметрів. Такі проблеми має усувати лише фахівець.
- Великий за вагою документ або багато маси посилань. Пошукові системи мають певні вимоги, згідно з якими розмір карти сайту не може перевищувати 10 мегабайт. Док не повинен містити понад 50 000 посилань. Якщо кількість все ж таки більша, слід поділити сайтмеп на пару файлів.
- Неправильний формат дати. Дотримуйтесь відповідності кодуванню W3C. Час не є обов’язковим для вказівки.
- Застосування неприпустимих символів у адресному посиланні. Заборонено використовувати прогалини, знаки, лапки.
- Робот не знаходить Sitemap. Трапляється так, що пошуковій системі не відображається карта сайту, а значить, у Гуглі має з’явитися повідомлення про це.
- У картці ресурсу є URL-адреса, а доступ до них заблокований у файлі robots.txt. Для усунення цієї помилки потрібно відкрити доступ для індексування сторінок у певному форматі документа.
Усунення помилок у карті сайту та чекап статусу
Роботи-пошуковики займаються постійним аналізом файлу картки сайту та їх перевіркою на оновлення та помилки. Щоб якнайшвидше вирішити проблему, можна через вебмайстри панель внести зміни самостійно. Важливо пам’ятати, що зробити це можна лише 10 разів для одного хоста. Якщо витратити всі спроби, наступного разу можна використовувати опцію лише після закінчення 30 днів.