Google объясняет, почему его краулер игнорирует ваши подсказки ресурсов.

В недавнем эпизоде подкаста Search Off the Record, Гэри Ильес и Мартин Сплитт из Google объяснили, как веб-краулер Google обрабатывает HTML. Они подчеркнули, что Googlebot не всегда интерпретирует веб-страницы так же, как веб-браузер.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Почему Подсказки Ресурсов Не Помогают Googlebot

Функции, такие как предварительная загрузка DNS, предварительная загрузка, предварительная выборка и предварительное подключение, помогают браузерам быстрее загружать веб-страницы, решая проблемы с задержками, которые обычно не возникают на серверах Google.

Ильес сказал, что разрешение DNS от Google не нуждается в той помощи, которую большинство сайтов пытаются оказать.

Он заявил:

Предварительная загрузка DNS может быть действительно полезной, если у вас медленное интернет-соединение. Однако, она нам не нужна, потому что наша система может быстро взаимодействовать со всеми DNS-серверами, которые она использует.

Illyes сказал:

Также, что касается предварительной загрузки, если процесс не происходит немедленно, нам не нужно специально отслеживать или проверять его.

Google использует API правил спекуляций, чтобы ускорить загрузку результатов поиска для пользователей Chrome. Это работает за счет оптимизации производительности непосредственно в браузере, где скорость соединения является ключевым фактором. Однако, когда Google сканирует веб (используя Googlebot), он делает это из собственных центров обработки данных, поэтому не испытывает тех же задержек, что и обычный пользователь.

По словам Illyes и Splitt, эти обновления по-прежнему приносят пользу пользователям, ускоряя работу веб-сайтов, что приводит к повышению вовлеченности и увеличению конверсий. Однако эти улучшения фокусируются на том, как веб-сайты работают в браузере, а не на том, как Google их сканирует и индексирует.

Метаданные должны находиться в шапке документа.

Splitt описал ситуацию, когда правильно закодированный тег

According to Google’s John Illyes, the `` tag and `` elements must be placed within the `` section of an HTML document to adhere to the official HTML standard.

Он сказал:

Размещение метаданных непосредственно в элементах ссылок внутри тела документа может быть рискованным и, как правило, не является хорошей практикой.

Он считает, что разрешение Google распознавать канонические теги внутри самого контента страницы может создать риск для безопасности. Кто-то потенциально может манипулировать этими тегами, чтобы удалить страницу из результатов поиска Google, добавляя вредоносный код.

Гэри Ильес ранее рекомендовал быть конкретным при использовании канонических тегов, предлагая указывать полный URL, чтобы помочь поисковым системам понять, какая страница является предпочтительной версией. Он повторяет эту мысль сейчас, подчеркивая, что четкое размещение этих тегов в секции заголовка страницы устраняет любую путаницу.

Валидность HTML не равнозначна преимуществу в ранжировании.

Джон Мюллер объяснил, почему просто наличие валидного HTML-кода не является фактором в поисковой выдаче. Поскольку валидность – это вопрос «да» или «нет» – код либо валиден, либо нет – Google сложно использовать это как полезный сигнал ранжирования. Простая метрика «сдал/не сдал» не предоставляет достаточной нюансировки.

Сложно определить, когда что-то почти правильно, и непонятно, как действовать в тех ситуациях, когда это не совсем так.

Он объяснил, что отсутствующий закрывающий тег в HTML-коде веб-страницы делает её технически некорректной, но, по словам Illyes, это не повлияет на то, как пользователь воспринимает страницу.

Сплитт также отметил, что использование семантической разметки – таких вещей, как четкие заголовки и стандартные HTML5 элементы – не оказывает существенного влияния на позиции в поисковых системах. Однако, это *действительно* важно для обеспечения доступности и удобства использования веб-сайтов.

Почему это важно

Роджер Монтти недавно объяснил рекомендации Google о том, как ее веб-сканеры используют кэшированный контент. Google предлагает использовать ETag-заголовки, чтобы предотвратить повторную загрузку страниц, которые не изменились, и это соответствует тому, что Ильес обсуждал в этой беседе.

Заглядывая в будущее

Изначально я планировал погрузиться в Client Hints, но мы потратили время на разбор HTML, потому что это важно для понимания того, как всё работает под капотом. Если я доберусь до освещения Client Hints в будущих эпизодах, я обязательно объясню, как Googlebot теперь использует новые заголовки `Accept-CH` и `Sec-CH-UA` – это замена старым строкам user agent, и это большое изменение для SEO.

Полная беседа доступна на YouTube и Apple Podcasts.

Смотрите также

2026-02-27 03:10