Патент Google на распараллеливание запросов: тематический поиск

В декабре 2024 года патент поданный Google под названием «Thematic Search«, кажется, сильно соответствует методу Query Fan-Out используемому в их режиме AI. Этот патент раскрывает механизм генерации ответов режимом AI и предлагает инновационные подходы к стратегии контента, которые могут стоить рассмотрения.

🎁 Любишь бесплатные токены?
Airdrop раздаёт крипту каждый день – успей получить свою!

Присоединиться в Telegram

В патенте описывается система, которая группирует релевантные результаты поиска по запросу в отдельные категории или как они их называют, ‘темы’. Каждая категория включает краткое объяснение, позволяя пользователям понять решения на свои запросы без необходимости посещать несколько веб-сайтов, просто ознакомившись с обобщениями.

Данный патент описывает передовую систему для всеобъемлющих исследований, особенно для сложных или многогранных запросов. Отличительная особенность изобретения — способность самостоятельно определять ключевые темы на основе обычных поисковых результатов и использовать искусственный интеллект для создания кратких, информативных сводок по каждой теме. Эти сводки извлекаются не только из содержания, но и из контекста самих поисковых результатов.

Тематическая поисковая система

Тематические области или предметы являются основополагающей идеей, восходящей к начальным стадиям инструментов для веб-поиска, которые привлекли моё внимание и заставили сохранить этот патент несколько месяцев назад.

Вот краткое изложение того, что это делает:

  • Патент ссылается на его использование в контексте большой языковой модели и генератора резюме.
  • Это также относится к тематическому поисковому движку, который получает запрос на поиск и затем передает его в другой поисковый движок.
  • Тематический поисковик берет результаты поиска и организует их по темам.
  • В патенте описывается система, которая взаимодействует с традиционной поисковой системой и использует большую языковую модель для создания сводок тематически группированных результатов поиска.
  • Патент описывает, что единственный запрос может приводить к множественным запросам на основе «подтем»

Сравнение Распределения Запросов И Тематического Поиска

Говоря простыми словами, система, описанная в исходном документе, следует тем же принципам, что объясняет документация от Google относительно методологии распределения запросов (Query Fan-Out).

В определенных ситуациях при вводе поискового запроса типа «142-2», тематическая поисковая система вроде 120 может выдавать тематическую информацию из некоторых результатов поиска. Например, данная тематическая поисковая система 120 могла бы извлечь результаты поиска и создать более конкретные темы или подтемы (например, «район A», «район B», «район C») на основе релевантных документов внутри этих результатов поиска. На странице поиска 160 могут быть отображены подтемы темы 130a и/или тематические результаты поиска 119 по поисковому запросу 142-2. Процесс может продолжаться: выборка подтемы темы 130a могла бы побудить тематическую поисковую систему 120 собрать еще один набор результатов поиска от поисковой системы 104 и создать еще более специфические темы или суб-подтемы внутри темы 130a из этих новых результатов, и так далее.

Описание системы в патенте кажется очень схожим с объяснением метода расширения запросов от Google, особенно в подходе к исследованию связанных тем путём создания новых запросов вокруг конкретных тем.

Генератор резюме

Summarizer является частью системы тематического поиска, созданной специально для создания кратких обобщений по каждой теме на основе результатов поиска.

Так это работает:

  • Генерация сводки иногда реализуется с помощью большой языковой модели, обученной создавать оригинальный текст.
  • Генератор резюме использует один или несколько отрывков из результатов поиска, сгруппированных по конкретной теме.
  • Он также может использовать контекстную информацию из названий, метаданных и окружающих связанных отрывков текста для повышения качества сводки.
  • Генератор резюме может быть активирован при подаче пользователем поискового запроса или при инициализации тематического поисковика.

В патенте не уточняются детали «инициализации» тематического поискового движка; это может быть связано с предположением, что процесс является самоочевидным и относится к начальной стадии работы, когда движок готовится обрабатывать запрос пользователя.

Результаты запроса сгруппированы по теме вместо традиционного ранжирования

В некоторых случаях, продемонстрированных в патенте, обычные результаты поиска заменяются на категоризированные темы и автоматические обзоры. Это изменение в поиске, известное как тематический поиск, изменяет отображаемое содержание и связи с пользователями. Например, вопрос, часто оптимизированный издателями или специалистами по SEO, может служить отправной точкой для информационной экспедиции пользователя. Результаты тематического поиска могут направлять пользователя через исследование подтем, связанных с оригинальным запросом, а веб-страница, которая в конечном итоге привлечет клик, возможно, не будет первой по рангу для первоначального запроса, но окажется более подходящей для соответствующего смежного запроса.

  • Темы отображаются на странице результатов поиска, и в некоторых случаях результаты поиска (или их часть) организованы согласно множественности тем. Отображение темы может включать показ фразы этой темы.
  • В некоторых примерах поисковая система по тематикам может ранжировать темы на основе их значимости и/или релевантности к поисковому запросу.
  • Страница результатов поиска может организовать результаты поиска (или их часть) согласно темам (например, под темой ‘стоимость жизни’, идентифицируя те результаты поиска, которые относятся к теме ‘стоимости жизни’).
  • Темы и
    /или результаты поиска, организованные по темам с помощью тематического движка поиска, могут отображаться на странице результатов поиска различными способами, например в виде списков, карточек или объектов пользовательского интерфейса (UI), горизонтальной карусели, вертикальной карусели и т.д.
  • Результаты поиска, организованные по темам, могут называться тематическими результатами поиска. В некоторых случаях темы и
    /или результаты поиска, упорядоченные по темам, отображаются на странице результатов поиска вместе с обычными результатами (например, нормальными результатами поиска) от поисковой системы.
  • В некоторых примерах темы и/или организованные по темам результаты поиска отображаются в части страницы результатов поиска, которая отделена от поисковых результатов, полученных поисковой системой.

Содержание из нескольких источников объединено

Подготовленные искусственным интеллектом резюме составлены из различных онлайн источников и классифицированы по темам. Это усложняет процесс указания ссылок, поддержания видимости и оценки посещаемости веб-сайтов.

В данной патентной цитате «неструктурированные данные» означают информацию, найденную на веб-сайте.

Чтобы проиллюстрировать это, тематическая поисковая система может извлекать темы из неорганизованных данных путем непосредственного анализа содержимого соответствующих документов. Затем она классифицирует результаты поиска по этим идентифицированным темам.

B ответ на вопрос «Переезд в Денвер», такая поисковая система могла бы показать релевантные результаты (например, информативные документы), связанные с конкретным запросом.

Как профессионал в области цифрового маркетинга, я мог бы объяснить это так: при использовании тематической поисковой системы она будет выбирать группу соответствующих документов (как правило, X лучших результатов поиска) на основе запроса. Затем она создает множество тем из содержания выбранных документов. Например, темы могут включать «районы проживания», «стоимость жизни», «что делать в городе» или даже «за и против переезда». Тема может быть фразой, созданной ИИ моделью, которая обобщает общую тему, встречающуюся во всех предоставленных документах.

B некоторых случаях тематическая поисковая система определяет ключевые слова внутри каждого документа (например, из результатов поиска) и связывает их с похожими ключевыми словами в других документах для создания тем.

Контент с исходных страниц связан

Как SEO-специалист, я мог бы перефразировать это следующим образом:

B некоторых случаях отрывок 145 может представлять собой краткую выдержку из документа 126 или его метаданных. В таких ситуациях отрывок 145 возможно содержит релевантный раздел документа 126, относящийся к теме 130. Иногда поисковый результат 119, связанный с этой темой, включает в себя отрывок 145 вместе со сводным описанием 166, созданным языковой моделью 128 и помещенным в кластер 172 для удобства организации и понимания.

Влияние взаимодействия пользователя на представление

Ранее было сказано, что тематическая поисковая система не предоставляет список документов на основе поискового запроса в порядке релевантности. Вместо этого она собирает данные из различных тем, относящихся к первоначальному поисковому запросу. Взаимодействие пользователя с этими AI-сгенерированными резюме влияет на то, какие вебсайты будут посещены.

Подтемы, созданные автоматически, могут предложить разнообразные пути в процессе изучения пользователем знаний, начиная с его изначального поискового вопроса.

Аннотация использует метаданные издателя

Проще говоря, создатель резюме учитывает заголовки, дополнительную информацию (метаданные) и контекст из близлежащего текста при создании сводок. Следовательно, организованное содержание может влиять на то, как эти сводки формируются.

Ниже приводится то, что говорится в патенте; я добавил пункты списка, чтобы упростить понимание:

  • Генератор кратких версий текста может получить отрывок в качестве входных данных и выдать краткое описание для введенного отрывка.
  • В некоторых примерах генератор резюме 164 получает в качестве входных данных отрывок текста 145 и контекстную информацию, а на выходе выдает краткое описание 166 для отрывка текста 145.
  • В некоторых примерах контекстная информация может включать заголовок реагирующего документа 126 и/или метаданные, связанные с реагирующим документом 126.
  • В некоторых примерах контекстуальная информация может включать один или несколько соседних абзацев (например, соседние параграфы).
  • В некоторых примерах контекстная информация может включать краткое описание одного или нескольких соседних абзацев (например, смежных абзацев).
  • В некоторых примерах контекстная информация может включать все остальные фрагменты текста на том же ответном документе. Например, генератор резюме может принимать фрагмент текста и другие фрагменты текста (например, все остальные фрагменты) с того же ответного документа (и в некоторых случаях другую контекстную информацию) в качестве входных данных и выводить краткое описание для фрагмента текста.

Тематический поиск: Последствия для контента и SEO

Есть два способа, которыми заканчивается режим AI для издателя.

  1. Поскольку пользователи могут получать ответы из тематических сводок или выпадющих списков, поведение без клика (zero-click) вероятно увеличится, снижая трафик от традиционных ссылок.
  2. Или же это может означать, что веб-страница, которая предоставляет конец пути пользователя по информационному запросу для данного запроса, получает клик.

Кажется, нам стоит перенести фокус с ранжирования ключевых слов на понимание основного вопроса, который задает поисковик, а затем предоставлять полные ответы и предвидеть связанные вопросы для предоставления более полного ответа в рамках одной веб-страницы или создания дополнительных страниц по мере необходимости, чтобы лучше удовлетворить информационные потребности пользователя.

Вы можете прочитать патент здесь:

Тематический поиск (PDF)

Прочтите документацию Google об режиме AI (PDF)

Смотрите также

2025-05-29 13:40