ИИ-пауки, по сообщениям, истощают ресурсы сайта и искажают аналитику.

Используя значительное количество интернет-трафика, эти боты собирают данные необходимые для создания обширных моделей языка, потенциально влияя на ключевые показатели связанные с ранжированием в поисковых системах.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Вот что вам нужно знать.

Как могут повлиять боты искусственного интеллекта на производительность сайта.

СЕО-эксперты зачастую сосредотачиваются на оптимизации контента для обычных поисковых ботов поисковиков, но по мере того как пауки ИИ от таких фирм, как OpenAI, Anthropic и Amazon, становятся более значимыми, необходимо учитывать новые технические аспекты.

Несколько менеджеров веб-сайтов упомянули проблемы с производительностью и более интенсивным использованием серверов, которые они связывают непосредственно с действиями искусственных интеллектуальных роботов для сканирования.

Данные от облачного хостинга Верцеля показывают масштаб этого трафика: за один месяц OpenAI’s GPTBot сделал 569 миллионов запросов, а Клод от Антропоика внес примерно 370 миллионов.

За это время поисковые боты на базе ИИ составляли приблизительно 20% от общей активности поисковых ботов в Google.

Влияние на аналитические данные

Значительный бот трафик может повлиять на данные аналитики.

Как эксперт по SEO, я заметил существенный рост (увеличение на 86%) недостоверного трафика в последние месяцы 2024 года. Этот рост можно объяснить увеличением активности краулеров с искусственным интеллектом.

Как эксперт по поисковой оптимизации (SEO), я заметил значительную тенденцию в 2024 году: около 16% создаваемых показов от взаимодействий с ботами Identified-bot исходило от AI scraper-ботов таких как GPTBot, ClaudeBot и AppleBot.

В рамках инициативы Read the Docs было обнаружено, что ограничение доступа для AI-ботов снизило их ежедневное потребление данных на целых 75%, с 800ГБ до 200ГБ. Предполагается, что это изменение сэкономит примерно $1,500 ежемесячно на расходах за пропускную способность.

Определение паттернов работы ИИ-сканеров

Понимание поведения краулеров ИИ может помочь в анализе трафика.

Как опытный вебмастер я заметил, что то, что отличает ИИ-пауки от традиционных ботов — это их неустанная частота и обширная глубина исследования. В отличие от поисковых роботов, которые следуют регулярным, предсказуемым моделям, ИИ-пауки демонстрируют более напористое поведение, глубже погружаясь в сайты и быстрее возвращая информацию.

Денис Шуберт, отвечающий за поддержку инфраструктуры социальной сети Diaspora, отметил, что ИИ-краулеры не просто заходят на страницу один раз и уходят. Напротив, они склонны возвращаться примерно каждые 6 часов, словно нет причин этого не делать.

За пределами частоты ИИ-краулеры более тщательные, исследуя больше контента, чем обычные посетители.

Несмотря на беспокойство по поводу интенсивного трафика, обработка и регулирование этих веб-пауков добавляет дополнительных сложностей.

По мере развития технологии поисковых роботов традиционные методы блокировки становятся все менее эффективными.

Разработчик программного обеспечения Xe Iaos отметил, что бесполезно пытаться блокировать ботов AI crawlers, так как они склонны вводить в заблуждение, менять свои пользовательские агенты, использовать домашние IP адреса в качестве прокси и применять другие стратегии.

Балансировка Видимости и Управления Ресурсами

Для определения того, сильно ли влияет сканирование ИИ на ваш сайт:

Проанализируйте журналы сервера на наличие необычных паттернов трафика, особенно от диапазонов IP адресов провайдеров облачных сервисов.
Ищите пики в использовании пропускной способности, которые не соответствуют активности пользователей.
Следите за необычными паттернами в ваших метриках Core Web Vitals

Для тех, кто столкнулся с чрезмерным трафиком от краулера ИИ, доступно несколько вариантов.

Google представила метод под названием Google-Extended в файле robots.txt. С помощью этого инструмента вебсайты могут запретить использование своего контента для обучения платформ Gemini и Vertex AI от Google без влияния на их видимость в результатах поисковых систем.

Cloudflare представила «AI Labyrinth», что означает: когда они обнаруживают неавторизованный веб-скрапинг, вместо того чтобы блокировать запрос напрямую, они направляют скраппера к набору страниц, созданных искусственным интеллектом, которые кажутся законными и могут убедить скраппера исследовать эти страницы.

Заглядывая в будущее

По мере интеграции ИИ в поиск и обнаружение специалисты по поисковой оптимизации должны тщательно управлять пауками.

Вот некоторые практические следующие шаги:

Проверьте журналы сервера аудита, чтобы оценить влияние обходчика искусственного интеллекта на ваши конкретные сайты.
Рассмотрите возможность реализации Google-Expanded в файле robots.txt, чтобы сохранить видимость при поиске и ограничить доступ к обучению искусственного интеллекта.
Настройте фильтры аналитики, чтобы отделить трафик ботов для более точной отчетности
Для сильно пострадавших участков исследуйте более продвинутые варианты смягчения воздействия

Многие обычные веб-сайты хорошо работают при использовании стандартных файлов robots.txt и обычных проверок. Однако для сайтов с высоким трафиком полезно изучить более продвинутые методы управления.

Смотрите также

2025-03-27 01:09