Google’s SAGE Agentic AI Research: Что это значит для SEO

Google недавно опубликовала исследование, в котором подробно описывается новый, сложный набор данных, предназначенный для обучения ИИ-агентов проведению углубленных исследований. В статье объясняется, как эти ИИ-агенты подходят к исследованиям, предлагая ценную информацию для улучшения создания и оптимизации контента.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

SAGE — это технология, создающая полезные и адаптируемые данные для расширенного поиска, и она улучшает свою производительность в зависимости от того, насколько успешно она выполняет задачи. Это расшифровывается как Steerable Agentic Data Generation for Deep Search with Execution Feedback.

Синтетические пары вопросов и ответов

Недавние наборы данных для обучения ИИ, такие как Musique и HotpotQA, обычно требовали до четырех шагов рассуждений для поиска ответов. Эти наборы данных также требовали ограниченного количества поисков: Musique в среднем 2.7 поиска на вопрос, а HotpotQA требовал в среднем 2.1. Другой популярный набор данных, Natural Questions, требовал еще меньше поисков, в среднем всего 1.3 на вопрос.

Текущие наборы данных, используемые для обучения ИИ, испытывают трудности с выполнением сложных поисковых задач, требующих обширного рассуждения и множества шагов поиска. Сложно подготовить ИИ к реальным проблемам, если они не были обучены на действительно сложных задачах.

Исследователи разработали SAGE, систему, которая автоматически создает сложные пары вопросов и ответов, чтобы помочь обучить инструменты поиска с искусственным интеллектом. SAGE работает с двумя ИИ: один генерирует вопрос, а другой выступает в качестве поискового агента, пытаясь ответить на него и предоставляя обратную связь о том, насколько сложен вопрос.

  • Цель первого ИИ — написать вопрос, на который сложно ответить и для решения которого требуется много шагов рассуждений и несколько поисковых запросов.
  • Цель второго ИИ — попытаться измерить, можно ли ответить на вопрос, и вычислить, насколько это сложно (минимальное количество шагов поиска, необходимых для этого).

SAGE работает, отправляя информацию обратно первому ИИ, если второй ИИ испытывает трудности или быстро решает проблему. Эта информация, детализирующая процесс второго ИИ, помогает первому ИИ определить способы упростить решение и позволить второму ИИ решить его более эффективно.

Именно эти ярлыки дают представление о том, как лучше ранжироваться для глубоких исследовательских задач.

Четыре способа, которыми избегали глубоких исследований

Это исследование было направлено на разработку сложных вопросов, требующих от ИИ-агентов выполнения нескольких шагов для получения ответа. Отзывы пользователей выявили четыре метода, которые помогли ИИ находить ответы с меньшим количеством поисков.

Четыре Причины, по Которым Глубокое Исследование Было Ненужным

  1. Сопоставление информации на месте
    Это наиболее распространенный способ, на который приходится 35% случаев, когда глубокое исследование не требовалось. Это происходит, когда два или более фрагмента информации, необходимых для ответа на вопрос, находятся в одном и том же документе. Вместо двойного поиска, ИИ находит оба ответа за один «шаг».
  2. Схлопывание множественных запросов
    Это произошло в 21% случаев. Причина в том, что один удачный поисковый запрос извлекает достаточно информации из разных документов, чтобы сразу решить несколько частей проблемы. Это «схлопывает» то, что должно было быть многоступенчатым процессом, в один шаг.
  3. Поверхностная сложность
    Это составляет 13% случаев, когда глубокие исследования не требовались. Вопрос выглядит длинным и сложным для человека, но поисковая система (которую использует ИИ-агент) может сразу перейти к ответу, не нуждаясь в рассуждениях через промежуточные шаги.
  4. Чрезмерно Конкретные Вопросы
    31% неудач — это вопросы, содержащие столько деталей, что ответ становится очевидным при самом первом поиске, устраняя необходимость в каком-либо «глубоком» исследовании.

Исследователи обнаружили, что некоторые вопросы кажутся сложными, но на самом деле довольно просты, поскольку вся необходимая информация находится вместе на одной веб-странице. Когда ИИ может ответить на сложный вопрос всего за один шаг – потому что веб-сайт удобно содержит все необходимое – это не демонстрирует истинных способностей к рассуждению. Однако, это происходит в реальных поисковых запросах, и ИИ естественным образом выиграет от того, что все ответы находятся в одном месте.

SEO Выводы

Мы можем узнать, какие типы контента помогают ИИ проводить тщательные исследования. Хотя это и не гарантированные способы улучшения позиций в поисковой выдаче, они показывают, что позволяет агентам ИИ находить большую часть или всю необходимую информацию на одной веб-странице.

Наличие всей информации, необходимой для ответа на вопрос, на одной веб-странице может повысить вашу поисковую оптимизацию (SEO). Исследователи обнаружили, что когда информация не разбросана по нескольким страницам, требуется меньше шагов для того, чтобы кто-то (или ИИ) нашёл то, что он ищет. Для владельцев веб-сайтов это означает, что объединение связанных фактов на одной странице может предотвратить необходимость пользователям посещать другие веб-сайты для завершения поиска.

Исследователи обнаружили, что один поисковый запрос может извлекать информацию из нескольких частей документа, если контент организован для одновременного ответа на несколько связанных вопросов. Это позволяет ИИ быстро находить полный ответ на вашей странице, обходя необходимость в длительном, поэтапном процессе рассуждений.

Как человек, который годами разрабатывает веб-сайты и оптимизирует их для поисковых систем, я узнал, что большие языковые модели иногда спотыкаются, когда находят простой, но неверный путь к ответу. Исследование подчеркивает это, называя это ‘shortcut’ (ярлыком) ошибкой. Но как SEO-специалисты, мы *хотим* быть этим ярлыком! Наша работа — предоставлять точную информацию — например, числа, даты или конкретные имена — которая позволит ИИ быстро и уверенно найти ответ, не копаясь в поисках. По сути, мы даем ему прямой путь к успеху.

Цель остается — ранжироваться в классическом поиске.

Для SEO-специалистов и владельцев веб-сайтов создание исчерпывающего, подробного контента выгодно, поскольку это снижает необходимость для систем искусственного интеллекта искать информацию в других местах. Это не означает, что всё должно быть на одной странице, однако. Ссылки на связанные страницы могут быть полезны, если они улучшают взаимодействие с пользователем.

Я считаю, что нам все еще нужно сосредоточиться на традиционной поисковой оптимизации, потому что ИИ по сути выполняет стандартные веб-поиски для поиска ответов. В настоящее время он использует только информацию из трех лучших результатов поиска по каждому запросу. Хотя я не уверен, ведет ли себя поисковик на базе ИИ таким образом в реальных условиях, это важный момент, который следует иметь в виду.

Исследователи фактически использовали Serper API для получения результатов поиска Google в рамках одного из своих тестов.

Итак, когда дело доходит до ранжирования в агентном AI-поиске, примите во внимание следующие выводы:

  • Может быть полезно учитывать важность попадания в топ-три.
  • Оптимизируйте веб-страницы для классического поиска.
  • Не оптимизируйте веб-страницы для поиска искусственным интеллектом.
  • Если есть возможность быть исчерпывающим, оставаться в рамках темы и занимать первые три позиции в рейтинге, то сделайте это.
  • Создавайте внутренние ссылки на релевантные страницы, чтобы помочь пользователям занять высокие позиции в классическом поиске, желательно в топ-3 (для безопасности).

Будущие поиски на основе ИИ могут выходить за рамки обычных трех лучших результатов. Однако по-прежнему важно стремиться к позиции в топ-3 в традиционном поиске, а также сосредоточиться на том, чтобы другие релевантные страницы появлялись в более сложных и углубленных результатах исследований.

Google опубликовала исследовательскую работу 26 января 2026 года, подробно описывающую новый подход под названием SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback. Вы можете найти эту работу в формате PDF.

Смотрите также

2026-01-30 14:10