Google Обновляет Предел Размера Файла Googlebot Документы

Google обновила свою документацию Googlebot, чтобы уточнить информацию об ограничениях размера файлов.

Мы переместили информацию об стандартных ограничениях размера файлов со страницы Googlebot в нашу основную документацию о том, как Google сканирует веб. Мы также уточнили конкретные ограничения, применяемые к самому Googlebot на странице Googlebot.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Что нового

В журнале изменений документации Google обновление описывается как двухэтапное уточнение.

Google изменил информацию об ограничении размера файлов. Раньше она находилась на странице Googlebot, но теперь её можно найти в документации для всех веб-краулеров и инструментов Google. Google объясняет, что это лучшее место, потому что ограничения влияют на все их системы сканирования, а не только на Googlebot.

Google уточнил ограничения по размеру файлов для Googlebot в своей документации для краулеров. Обновленная документация теперь предоставляет более конкретные сведения об этих ограничениях.

Как человек, который годами управлял веб-сайтами, я всегда знал, что у поисковых роботов Google есть ограничения на объём данных, которые они будут скачивать с одного URL. Исторически, в документации указывалось, что стандарт составляет около 15МБ. Однако всё изменилось! Теперь на официальной странице Googlebot указано, что они ориентируются на 2МБ для большинства поддерживаемых типов файлов, но PDF-файлам предоставляется немного больше свободы – до 64МБ при сканировании для обычных результатов поиска Google. Важно помнить об этих ограничениях при оптимизации вашего сайта, особенно для больших файлов.

Почему это важно

Это часть тенденции, начатой Google в конце 2025 года. Они начали с переноса основной информации о том, как сканируются веб-сайты, на отдельный веб-сайт, отличный от сайта Search Central. Google объяснила это тем, что технология, которая сканирует веб-сайты, поддерживает многие из их продуктов, такие как Shopping, News, Gemini и AdSense – а не только Search.

На протяжении декабря мы опубликовали дополнительные ресурсы, охватывающие такие темы, как улучшение фильтров поиска на веб-сайте и максимальное использование того, как поисковые системы сканируют ваш сайт.

Это обновление основывается на продолжающейся реорганизации систем Google. Ограничение размера файла в 15 МБ, которое было официально отмечено в 2022 году с обновлением страницы справки Googlebot, на самом деле не было новым. Джон Мюллер из Google подтвердил, что оно действовало в течение многих лет, но они просто публиковали эту информацию.

Документация Google теперь предлагает различные объяснения лимитов бюджета сканирования и проблем с индексацией для страниц с большим количеством контента, в зависимости от того, где вы найдете информацию.

Наши системы обычно позволяют просканировать до 15 МБ данных. Однако, когда Googlebot посещает страницу, он обычно загружает до 2 МБ для стандартных веб-страниц и текстовых файлов, и до 64 МБ для PDF-документов. Неясно, как эти различные ограничения связаны с общим лимитом в 15 МБ, поскольку Google не предоставил объяснений.

Теперь вы можете найти стандартные лимиты сканирования в документации с обзором сканера, а подробности, относящиеся к Googlebot, — на странице Googlebot.

Заглядывая в будущее

Недавно Google реструктурировала свою документацию, намекая на дальнейшие улучшения в работе своих веб-краулеров в ближайшем будущем. Это изменение, которое разделяет общие настройки краулеров от деталей, специфичных для каждого продукта Google, упростит документирование и объяснение новых краулеров и средств извлечения данных по мере их запуска.

Смотрите также

2026-02-03 23:09