Googlebot сканує та індексує перші 15 МБ HTML-контенту
Згідно з оновленою довідковою документацією, пошуковий робот Google використовує лише перші 15 МБ HTML-коду сторінки для визначення рейтингу.
Оновлення довідкового документа Googlebot містить підтвердження того, що він скануватиме перші 15 МБ веб-сторінки, а все, що після цього обмеження, не враховуватиметься при розрахунку рейтингу.
Google вказує у довідковому документі:
«Будь-які ресурси, на які є посилання в HTML, такі як зображення, відео, CSS та JavaScript, витягуються окремо.
Після перших 15 МБ файлу робот Googlebot припиняє сканування та розглядає для індексації лише перші 15 МБ файлу.
Обмеження розміру файлу застосовується до нестиснутих даних».
Це змусило деяких у спільноті SEO поставити питання, чи означає це, що робот Googlebot повністю ігноруватиме текст, який знаходиться нижче зображень на кордоні в HTML-файлах.
"Це пов'язано з самим HTML-файлом, ніби він написаний", - пояснив через Twitter Джон Мюллер, Google Search Advocate.
"Вбудовані ресурси/контент, витягнуті за допомогою тегів IMG, не є частиною файлу HTML".
Що це означає для SEO
Щоб забезпечити зважування Googlebot, важливий контент тепер має бути включений до верхньої частини веб-сторінок.
Це означає, що код повинен бути структурований таким чином, щоб розміщувати релевантну для SEO інформацію з першими 15 МБ у HTML або текстовому файлі, що підтримується.
Це також означає, що зображення та відео повинні бути стиснуті, а не кодовані безпосередньо в HTML, коли це можливо.
Зараз оптимальні методи SEO рекомендують зберігати HTML-сторінки розміром не більше 100 КБ, тому ця зміна не торкнеться багатьох сайтів. Розмір сторінки можна перевірити за допомогою різних інструментів, включаючи Google Page Speed Insights.
Теоретично може здатися тривожним той факт, що потенційно у вас може бути контент на сторінці, яка не використовується для індексації. Насправді проте, 15 МБ — це досить великий обсяг HTML.
Як заявляє Google, такі ресурси, як зображення та відео, витягуються окремо. Судячи з формулювання Google, це обмеження в 15 МБ застосовується лише до HTML.
Подолати цю межу за допомогою HTML було б важко, якщо ви не публікуєте текст на одній сторінці, обсяг якого дорівнює обсягу всієї книги.
Якщо у вас є сторінки, розмір HTML яких перевищує 15 МБ, швидше за все, у вас є основні проблеми, які необхідно виправити.
Джерело: Google Search Central