Патент Google «Получение информации» для ранжирования веб-страниц

Будучи опытным энтузиастом технологий, умеющим расшифровывать сложные патенты, я оказался втянутым в увлекательный мир патента на получение информации. Этот патент касается не только ранжирования веб-страниц в результатах поиска, но и прогнозирования того, что пользователи захотят увидеть дальше, на основе того, что они уже видели.


В недавнем патенте, выданном Google, подробно описан новый подход к ранжированию веб-страниц, который потенциально может дать представление о том, как системы искусственного интеллекта, такие как обзоры искусственного интеллекта, определяют приоритетность контента. По сути, этот метод включает в себя прогнозирование темы, которая может быть интересна пользователю после текущего поиска или просмотра страницы.

Контекстная оценка прироста информации о ссылках

Патент под названием «Контекстная оценка прироста информации о ссылках» был представлен в 2018 году и одобрен в июне 2024 года. Он касается определения рейтинговой оценки, известной как прирост информации. Эта оценка используется для организации второй группы веб-страниц, которые, как ожидается, будут релевантны пользователю, выступая в качестве слегка измененной последующей темы, связанной с предыдущим запросом.

Первоначально в патенте представлены общие обзоры, а затем постепенно вводятся подробные сведения в его параграфах. Чтобы проиллюстрировать это, рассмотрим сценарий с пиццей: изначально у вас есть пицца с сыром; затем добавляются дополнительные начинки, такие как грибы, и получается грибная пицца. После этого добавляется лук, превращая пиццу в грибно-луковую. По сути, каждая новая деталь добавляет еще один уровень специфичности к первоначальной концепции.

Если вы просто взглянете на одну ее часть, очень легко неверно истолковать свое суждение, поскольку вы можете заключить: «Это, несомненно, похоже на пиццу с грибами, но вы легко можете ошибаться относительно ее истинной сущности». .»

Существуют несколько уровней контекста, но в результате они складываются следующим образом:

  • Рейтинг веб-страницы, релевантной тому, что может заинтересовать пользователя дальше.
  • Контекст изобретения – автоматизированный помощник или чат-бот.
  • Роль поисковой системы похожа на обзоры искусственного интеллекта Google.

Получение информации и SEO: что происходит на самом деле?

Около двух месяцев назад я наткнулся на заявление в социальных сетях, в котором утверждалось, что «прирост информации» сыграл решающую роль в последнем обновлении основного алгоритма Google. Честно говоря, эта идея была для меня новой, поскольку у меня не было никаких предварительных знаний о «получении информации». Обсудив это с моими коллегами по SEO, они тоже не знали об этом термине.

Как специалист по цифровому маркетингу, я столкнулся с интригующей концепцией того, что Google может определять приоритетность веб-страниц на основе показателя «прирост информации». Проще говоря, это означает, что страницы с большим объемом ценного и уникального контента с большей вероятностью будут иметь более высокий рейтинг. По сути, это подчеркивает важность создания всеобъемлющего, информативного контента, который выделяется среди остальных.

Прочитав патент, я обнаружил, что «прирост информации» не означает ранжирование страниц на основе наличия большего количества информации, чем у других. Вместо этого он предлагает более глубокое понимание SEO, поскольку может помочь понять один аспект того, как обзоры ИИ могут определять рейтинг веб-страниц.

TL/DR патента на получение информации

Суть патента Information Gain заключается в его способности намекать на то, как обзоры искусственного интеллекта (AIO) определяют приоритетность веб-страниц, которые могут в дальнейшем привлечь пользователя. Другими словами, речь идет о прогнозировании и адаптации контента на основе того, что пользователь может найти интригующим в дальнейшем, по сути добавляя персонализированный подход.

В этом сценарии, когда пользователь задает вопрос, автоматический помощник или чат-бот предоставляет ответ, связанный с запросом. Между тем, система оценки получения информации работает негласно, чтобы отсортировать еще одну группу веб-сайтов, которые могут быть интересны пользователю в следующий раз. Это добавляет свежий взгляд на то, как ранжируются веб-страницы.

Акцент в патенте на автоматизированных помощниках

С 2018 по 2024 год было несколько итераций патента Information Gain. Первоначальная и окончательная версии имеют много общего, но ключевое различие заключается в интеграции чат-ботов в качестве приложения для изобретения Information Gain.

Как опытный исследователь и энтузиаст технологий с многолетним опытом работы за плечами, я часто просматриваю бесчисленные патенты, чтобы получить представление о новых технологиях. В ходе недавних исследований я наткнулся на интригующий патент, который привлек мое внимание, поскольку он посвящен автоматизированным помощникам.

Понятно, что наличие веб-страницы с большим количеством информации, чем у конкурентов, не обязательно означает, что она будет занимать более высокие позиции в результатах обычного поиска, поскольку в этом патенте это конкретно не обсуждается.

Общее описание контекста

Патент включает в себя различные итерации, каждая из которых подробно описывает, как результаты поиска отображаются в автоматизированных настройках, а также ответы на запросы на естественном языке. Вначале он дает общий обзор, а затем углубляется в конкретные детали. Эта черта характерна для патентов, поскольку они направлены на максимально широкую защиту своего изобретения, постепенно сужая объем.

«Показатель информативности конкретного документа предполагает, что он содержит дополнительную информацию, отсутствующую в документах, которые пользователь уже видел».

По сути, суть патента вращается вокруг уникального аспекта, заключающегося в том, что оценка данных на основе полученной информации происходит на последующих веб-страницах после первоначальных результатов поиска, отображаемых пользователю.

Более конкретный контекст: автоматизированные помощники

Во второй части раздела «Предпосылки» представлено немного больше подробностей, поскольку здесь объясняется контекст изобретения с точки зрения соединений или ссылок. Проще говоря, представьте, что пользователь вводит поисковый запрос и получает ссылки на возможные ответы, но на этом этапе не рассчитывается какой-либо показатель прироста информации.

Как опытный веб-мастер, я могу поделиться примером, когда пользователь может ввести запрос и получить коллекцию соответствующих документов или ссылок, ведущих на эти документы, и все это в ответ на его первоначальный поисковый запрос.

Как человек, который провел бесчисленные часы, просматривая бесконечные груды информации в Интернете, я могу подтвердить удобство и эффективность персонализированной доставки контента. Представьте себе, что вы наткнулись на веб-сайт, на котором вы найдете статьи, видео или другие ресурсы, специально адаптированные к вашим интересам, на основе вашей прошлой истории посещений и предпочтений. Это не просто мечта, а реальность в современную цифровую эпоху.

Последнее предложение плохо сформулировано.

Кроме того, сведения из документов могут быть доставлены пользователю либо при получении поискового запроса, либо в виде текущих предложений во время дальнейшего исследования, даже после завершения сеанса поиска.

Как опытный веб-мастер, я бы выразил это так: «Кроме того, если пользователь продолжит исследование после завершения сеанса поиска, ему могут быть представлены соответствующие детали из документов».

Данные, предоставляемые пользователю, могут быть либо прямым ответом на его поисковый запрос, либо могут доставляться автоматически в зависимости от предпочтений пользователя.

Будет немного понятнее, если вы заключите его в круглые скобки:

Кроме того, данные из документов могут быть предоставлены пользователю либо в ответ на поисковый запрос, либо в виде автоматического предложения, даже если пользователь завершил первоначальный сеанс поиска и продолжает просматривать дальше.

Выводы:

  • Патент описывает идентификацию документов, которые соответствуют «интересам пользователя», на основе «ранее просмотренных документов» «и/или других критериев».
  • Он задает общий контекст автоматического помощника «и/или» поисковой системы.
  • Информация из документов, основанная на «ранее просмотренных документах» «и/или других критериях», может отображаться после того, как пользователь продолжит поиск.

Более конкретный контекст: чат-бот

Патент развивается дальше, обеспечивая дополнительную глубину и точность, объясняя, как чат-боты могут извлекать информацию («извлекать») с веб-страницы («источник») и отображать ее в качестве ответа. По сути, это краткое изложение, включающее ответ, аналогично избранным фрагментам, но в диалоговой обстановке чат-бота.

Иногда определенные сведения извлекаются из документа и показываются пользователю для удобства. Например, когда человек взаимодействует с компьютерной программой, имитирующей человеческий разговор, такой как чат-боты или виртуальные помощники, это программное обеспечение может просматривать документы в поисках важных моментов, а затем сжимать информацию, чтобы ее было легче понять пользователю.

С моей точки зрения как эксперта по SEO, я хотел бы подчеркнуть, что некоторые поисковые системы могут предлагать краткую информацию, полученную из нескольких соответствующих документов, либо рядом, либо вместо обычных ссылок на эти документы. Обычно это действие инициируется поисковым запросом пользователя.

Последнее предложение звучит так, будто оно описывает что-то вроде избранного фрагмента или обзора ИИ, где содержится краткое изложение. Предложение очень общее и двусмысленное, поскольку в нем используются «и/или» и «в дополнение к или вместо» и оно не такое конкретное, как предыдущие предложения. Это пример патента, который является общим по юридическим причинам.

Ранжирование следующего набора результатов поиска

Предстоящая часть называется «Сводка» и более подробно объясняет, как показатель «Прирост информации» указывает на вероятность того, что пользователь найдет последующий пакет документов интересным. Эта концепция связана не с организацией результатов поиска, а с организацией будущего набора результатов поиска (связанных с той же темой).

«Показатель информативности конкретного документа предполагает, что он предоставляет дополнительную, уникальную информацию, которой нет в ранее показанных документах».

Рейтинг на основе темы веб-страниц

Основываясь на своем многолетнем опыте в качестве защитника цифровой грамотности и частого пользователя Интернета, я твердо убежден, что одним из эффективных способов повышения вовлеченности пользователей и повышения доступности является включение функций, которые озвучивают соответствующие разделы веб-страницы или представляют краткое изложение документов в звуковом виде. и визуальные форматы. Как человек, который в прошлом боролся с трудностями при чтении, я могу подтвердить преобразующую силу, которую такие технологии имеют для таких людей, как я. Это позволяет нам с большей легкостью и уверенностью ориентироваться в цифровом мире, что в конечном итоге способствует созданию более инклюзивной онлайн-среды.

Однако что особенно интригует, так это то, что он продолжает иллюстрировать свою методологию, используя тему самой веб-страницы, служащую заменой контента. Это представление затем используется для вычисления показателя прироста информации.

Как опытный веб-мастер, я хотел бы поделиться своим мнением о том, как понять суть веб-страницы. Важно понимать, что для этой цели используются различные методы. Однако ключевой момент заключается в вычислении показателя «Прирост информации», который рассчитывается на основе представления темы или предмета контента. Этот метод помогает нам точно уловить основную тему страницы.

«Для некоторых приложений показатели прироста информации можно рассчитать для нескольких документов, используя их общее содержание, важные детали или обобщенное семантическое представление (например, встраивания, векторы признаков, частоту слов/фраз или гистограммы) в качестве входных данных. в модели машинного обучения для получения оценки прироста информации.»

Далее в патенте объясняется, как он ранжирует первоначальную группу документов на основе оценок прироста информации, а затем использует эти оценки для ранжирования дальнейших групп документов, которые могут ответить на дополнительные вопросы или продолжить разговор об области интересов пользователя.

В некоторых случаях этот автоматизированный инструмент может получать данные из поисковой системы, сортировать их с использованием рейтингов прироста информации на основе связанных поисковых запросов и предоставлять несколько наборов соответствующих результатов.

«Используя показатели прироста информации, мы могли бы предложить пользователю конкретные детали, найденные в некоторых недавно поступивших документах. Этот выбор будет основан на том, сколько полезной информации эти документы могут предоставить пользователю.»

Что общего у всех версий патента

В процессе приготовления грибной пиццы со временем постепенно добавляются дополнительные ингредиенты, такие как лук, причем каждый слой строится поверх предыдущего. Аналогичным образом, на протяжении всего развития патента в основе лежат общие сходства, а конкретные детали постепенно накладываются сверху. Следующие пункты обрисовывают общие черты, лежащие в основе всех версий патента.

Применение оценки получения информации

Проще говоря, все варианты патентов детализируются с использованием показателя прироста информации для отдельной группы файлов, которые содержат дополнительные данные по сравнению с исходным набором. Важно отметить, что невозможно предсказать, что будет искать пользователь в начале сеанса, поэтому показатели прироста информации не применяются к первоначальным результатам поиска.

<ул>

  • Идентифицирован второй набор документов, который также связан с темой первого набора документов, но еще не просматривался пользователем.
  • Для каждого нового документа во втором наборе документов определяется показатель прироста информации, который указывает для нового документа, включает ли новый документ информацию, которая не содержалась в документах первого набора документов…
  • Автоматизированные помощники

    Как эксперт по SEO, я бы сказал, что все четыре патента, над которыми я работаю, связаны с созданием интеллектуальных диалоговых систем искусственного интеллекта. Эти системы реагируют на поиск на естественном языке, автоматически отображая релевантные результаты.

    В редакциях патента 2018 и 2023 годов упоминаются поисковые системы в 25 случаях. В издании 2018 года термин «автоматизированный помощник» используется 74 раза, а в самой последней версии он упоминается 69 раз.

    Все эти термины относятся к одному и тому же: цифровым помощникам, которые могут участвовать в разговорах, отвечать на вопросы и выполнять задачи по команде, например Siri, Alexa, Google Assistant или Cortana.

    Опытному веб-мастеру очевидно, что основное внимание в этом патенте уделяется разработке автоматизированных помощников, а не органически генерируемым результатам поиска.

    Диалог поворачивается

    Примечание: В повседневной речи мы используем слово диалог. При вычислениях они пишут диалог.

    Все варианты патентов описывают метод взаимодействия с системой посредством диалога, в частности диалогов. Поворот диалога включает в себя возвратно-поступательное взаимодействие, которое происходит, когда пользователь задает вопрос, используя повседневный язык, получает ответ, а затем задает другой вопрос или совершенно новый. Этот разговор может происходить в письменной форме, в режиме преобразования текста в речь (TTS) или вслух.

    Одной общей чертой всех патентов является повторяющийся обмен мнениями, часто называемый «раундом диалога». Это взаимодействие присутствует в каждой версии патента.

    «Клиентский автоматизированный помощник (106) и удаленный автоматизированный помощник (115) способны понимать устную или письменную речь пользователей и отвечать на них в двустороннем разговоре. Каждый обмен между пользователем и помощником известен как «поворот диалога», который может состоять из любого ввода пользователя, за которым следует ответ помощника».

    Таким образом, можно создать интерактивный диалог между пользователем и автоматическим помощником, позволяющий пользователям взаимодействовать с ИИ в форме чата.

    Проблемы, которые решают результаты получения информации

    Один из ключевых аспектов этого патента заключается в улучшении взаимодействия с пользователем путем определения дополнительной ценности нового документа по сравнению с теми, с которыми пользователь ранее сталкивался. Эту добавленную стоимость часто называют «приростом информации».

    Как человек, который много работал с системами преобразования текста в речь, я могу подтвердить важность получения информации при оптимизации аудиоответов для более естественного и увлекательного взаимодействия с пользователем. За годы своего опыта я своими глазами видел, как длинный и запутанный ответ может отпугнуть пользователей, привести к замешательству или даже разочарованию. Сосредоточив внимание на получении информации и адаптируя ответы так, чтобы они включали только самые важные детали, мы можем создать более упорядоченное и эффективное взаимодействие как для человеческого, так и для машинного общения в контексте TTS. Такой подход не только повышает удовлетворенность пользователей, но и способствует общему успеху любого проекта или приложения.

    «Пользователи могут ожидать, пока будет доставлена ​​большая часть, если не весь ответ, прежде чем двигаться дальше. В отличие от чтения, пользователь получает аудиоданные пассивно, но для вывода звука требуется больше времени, и они ограниченный контроль для быстрого просмотра или навигации по информации.»

    В патенте впоследствии уточняется, что использование получения информации может быстро предоставлять ответы, пропуская ненужные, повторяющиеся ответы или в ситуациях, когда первоначальный ответ недостаточен, что побуждает пользователя к дальнейшему диалогу.

    Как опытный веб-разработчик с многолетним опытом создания эффективных и удобных интерфейсов, я могу с уверенностью сказать, что плотность информации играет решающую роль в создании эффективного онлайн-контента. На своем личном опыте я понял, что предоставление кратких, точных и актуальных ответов является ключом к поддержанию заинтересованности и удовлетворенности пользователей. Это особенно важно для аудио- или устных ответов, где важны краткость и ясность. Сосредоточив внимание на плотности информации на веб-странице, мы можем гарантировать, что наш контент не только легко воспринимается, но и быстро потребляется, что в целом делает работу пользователя более приятной.

    Чтобы обеспечить четкое и эффективное воспроизведение звука, представленные данные должны быть актуальными, точными и правдивыми. Это помогает избежать ненужной длины, повторов или дополнительных поворотов диалога.

    Информационная плотность выводимой информации становится особенно важной для повышения эффективности диалогового сеанса. Описанные здесь методы решают эти проблемы за счет сокращения и/или исключения представления информации, которая уже была предоставлена ​​пользователю, в том числе в контексте аудиодиалога между человеком и компьютером».

    Концепция «плотности информации» имеет большое значение, поскольку она улучшает общение пользователей. Однако его актуальность становится еще большей, если применить его к результатам поиска чат-ботов, независимо от того, говорят они или нет. В таких контекстах предоставление информации в сжатой форме имеет решающее значение, поскольку этот подход сохраняет целенаправленность обсуждения и облегчает понимание поисковыми системами, позволяя им эффективно воспринимать контент. Обзоры Google AI демонстрируют это, предоставляя краткие выдержки из веб-страниц, но что не менее важно, так это важность краткого общения, помогающего поисковым системам понять основные моменты контента.

    Интерфейс результатов поиска

    Патенты на получение информации ясно дают понять, что это изобретение не применимо к результатам обычного поиска; вместо этого его применение лежит в области ранжирования веб-страниц в интерфейсе на естественном языке, используемом автоматизированными помощниками и чат-ботами с искусственным интеллектом.

    Как эксперт по SEO, я бы перефразировал это следующим образом: когда пользователь встречает ответ, который он находит интригующим и хочет углубиться в связанную тему, в патенте описывается метод, при котором другой набор результатов поиска представляется в виде «результатов поиска». интерфейс.»

    «В определенных сценариях метод, используемый для отображения новых документов из второй группы, может зависеть от сохраненных значений прироста информации. Например, некоторые из новых документов могут быть интегрированы в страницу результатов поиска, которая появляется после запроса пользователя. соответствует теме документов (например, ссылки на конкретные документы). В этих реализациях на релевантность или ранжирование результатов поиска могут влиять, по крайней мере частично, соответствующие им показатели прироста информации.»

    После выбора ссылки из результатов поиска система покажет вам детали выбранного документа. Позже, если вы решите вернуться к результатам поиска, ссылки на этот конкретный документ будут отображаться снова, но на этот раз с обновленными оценками, основанными на вновь полученной информации о ссылочных документах.

    В некоторых сценариях порядок результатов или даже некоторых документов может быть изменен или им может быть присвоен более низкий приоритет в результатах поиска, в зависимости от вновь вычисленных показателей релевантности, которые учитывают документ, ранее просмотренный пользователем.

    >

    Что такое интерфейс результатов поиска? Я думаю, что это просто интерфейс, который показывает результаты поиска.

    Чтобы не возникло путаницы, позвольте мне подчеркнуть, что обсуждаемый нами патент не касается организации веб-страниц с точки зрения полноты информации по конкретному предмету. Вместо этого он фокусируется на отображении документов в автоматизированной вспомогательной системе.

    Интерфейс результатов поиска — это просто интерфейс, его никогда не называют обычными результатами поиска, это просто интерфейс.

    Во всех патентах есть общие элементы, которые остаются неизменными, однако ключевые моменты и общий контекст, о которых я упоминал ранее, выделяются как особенно важные.

    Требования к патенту

    В разделе «Претензии» подробно расписаны особенности нововведения, на которые запрашивают законные права. Эта часть в первую очередь концентрируется на самом изобретении, а не на его окружающем контексте. Таким образом, вы не найдете ссылок на поисковые системы, автоматические помощники, звуковые ответы или преобразование текста в речь (TTS) в разделе «Претензии». Вместо этого оно обычно относится к более широкому контексту интерфейса результатов поиска, охватывающему все связанные контексты.

    Контекст: первый комплект документов

    Процесс начинается с установления предпосылок изобретения. Это включает в себя понимание запроса, определение его предмета и сбор предварительного набора веб-страниц (документов), которые могут быть релевантными. По крайней мере, один из этих документов затем определяется как весьма релевантный, и пользователю предоставляется либо полный документ, либо краткое изложение его содержания.

    Система, использующая один или несколько процессоров, работает следующим образом: она получает запрос от пользователя по определенной теме. Затем он находит группу документов (первый набор), связанных с этим запросом, и ранжирует эти документы в соответствии с их релевантностью теме. Из этой группы он выбирает наиболее релевантный документ и передает часть информации пользователю.

    Контекст: второй комплект документов

    После этого мы переходим к сортировке еще одной группы документов, содержащих дополнительную информацию. Мы ранжируем эти дополнительные документы на основе их показателей прироста информации, предоставляя дополнительную информацию после отображения соответствующего документа из исходного набора.

    Как опытный исследователь с многолетним опытом работы за плечами, я осознал ценность предоставления пользователям точной и полной информации. Когда пользователь запрашивает более подробную информацию по определенной теме, я знаю, насколько важно предоставить релевантный и познавательный контент. В таких ситуациях мне часто приходится работать над процессом, который включает в себя идентификацию дополнительных документов, связанных с исходным запросом. Эти второстепенные документы могут иметь некоторое сходство с наиболее важным документом, но они не должны включать сам основной документ.

    Подробные детали

    Оставшаяся часть этого раздела посвящена особенностям принципа получения информации — системы организации документов на основе того, что пользователь ранее просматривал и потенциально считает релевантным. Эта информация служит для ее юридической защиты в контексте изобретения, поскольку она относится к концепции.

    В пункте 1 процесс включает в себя:

    Переводя аналогию, это все равно, что объяснять процесс приготовления пиццы: замешивать тесто, чистить и нарезать грибы и так далее. Специфика не имеет решающего значения для наших нужд; вместо этого мы фокусируемся на более широкой перспективе, которая дает нам представление о том, к чему относится патент.

    Патент на получение информации

    В социальных сетях было распространено мнение, что этот патент как-то связан с рейтингом веб-страниц в результатах обычного поиска. Я увидел это, прочитал патент и обнаружил, что патент работает не так. Это хороший патент и важно его правильно понять. Я проанализировал несколько версий патента, чтобы увидеть, что в них общего и что различается.

    Как опытный веб-мастер, я внимательно изучил этот патент, и стало совершенно очевидно, что его основная цель — предсказать, что пользователи могут найти интересным в дальнейшем, на основе их предыдущих взаимодействий. Для достижения этой цели в патенте описывается применение оценки прироста информации. Эта оценка используется для ранжирования релевантных веб-страниц, которые относятся к темам, связанным с первоначальным поисковым запросом, но могут не иметь к нему прямого отношения.

    Проще говоря, когда мы говорим об изобретениях, связанных с помощниками, такими как чат-боты, важно отметить, что, хотя поисковая система может использоваться для поиска подходящих документов, основное внимание уделяется не только традиционным поисковым системам, которые возвращают органические результаты. Вместо этого контекст охватывает более широкий спектр инструментов, предназначенных для этой цели.

    Другими словами, этот патент может иметь отношение к обсуждению обзоров ИИ, но его применение этим не ограничивается. Например, концепция оценки прироста информации также потенциально может быть применима в таких областях, как разговорная речь и избранные фрагменты. Однако в патенте прямо не указано, можно ли его использовать в этих дополнительных контекстах.

    Ознакомьтесь с последней версией патента на получение информации:

    Контекстная оценка прироста информации о ссылке

    Смотрите также

    2024-08-15 22:21