Прорыв в системе рекомендаций Google обнаруживает семантический смысл.

Компания Google недавно опубликовала исследование, в котором подробно описан новый способ улучшения интерпретации пользовательских намерений системами рекомендаций. Исследование направлено на преодоление ограничений текущих систем, позволяя им лучше понимать конкретные предпочтения каждого пользователя в отношении таких вещей, как статьи, музыка или видео.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Персонализированная Семантика

Рекомендательные системы предлагают вещи, которые могут понравиться пользователям, например, что почитать или посмотреть. Популярные примеры включают YouTube, Google Discover и Google News, которые все предлагают контент. Эти системы также работают для покупок, помогая вам найти продукты, которые могут вам понравиться.

Рекомендательные системы изучают ваши предпочтения, отслеживая такие вещи, как ваши клики, оценки, покупки и историю просмотров. Затем они используют эту информацию, чтобы предложить контент, который вам может понравиться.

Как SEO-эксперт, я часто вижу данные, которые называют «примитивной обратной связью от пользователей». Что это на самом деле означает, так это то, что они не очень хорошо понимают, *почему* кому-то что-то нравится. Такие вещи, как простые клики, не говорят нам, нашёл ли пользователь что-то по-настоящему забавным, милым или интересным – они просто показывают, что он отреагировал. Это отправная точка, но нам нужны более тонкие сигналы, чтобы действительно персонализировать рекомендации и понимать предпочтения пользователей.

Это исследование изучает, как большие языковые модели могут улучшить понимание потребностей пользователей, анализируя смысл, стоящий за их запросами на естественном языке. По сути, оно направлено на то, чтобы выяснить, *что* хотят пользователи, а не только *как* они это говорят.

Традиционные системы рекомендаций полагаются на простую обратную связь, такую как клики или оценки, что может быть ограничивающим фактором. Интерактивные системы рекомендаций – это новый подход, который позволяет пользователям более подробно выражать свои желания – используя естественный язык, конкретные требования или даже разговор – чтобы получать более качественные рекомендации.

Необходимы дальнейшие исследования, чтобы определить наилучшие методы использования этой обратной связи от пользователей. Ключевая сложность заключается в понимании того, что пользователь *имеет в виду* по своим описаниям того, чего он хочет, особенно когда он использует общие термины. Это понимание имеет решающее значение для систем рекомендаций, стремящихся естественно реагировать на то, как люди выражают свои потребности на повседневном языке, и улучшать результаты поиска.

The Soft Attributes Challenge

Как SEO-эксперт, я часто задумываюсь о том, как работают рекомендательные системы, и недавно наткнулся на интересные исследования. Они обнаружили, что этим системам легко обрабатывать «жёсткие» атрибуты – такие вещи, как жанр, исполнитель или режиссёр, потому что они фактические и легко определяются. Настоящая же сложность заключается в «мягких» атрибутах – вещах, которые субъективны, таких как «настроение» или «тон». Трудно надёжно сопоставлять такие качества с конкретными фильмами, контентом или продуктами, потому что каждый воспринимает их по-разному.

В исследовательской работе указаны следующие характеристики мягких атрибутов:

  • Сами атрибуты могут иметь неточные интерпретации
  • И они могут быть субъективными по своей природе (то есть разные пользователи могут интерпретировать их по-разному)

Эта исследовательская работа под названием «Открытие персонализированной семантики для мягких атрибутов в рекомендательных системах с использованием векторов активации концепций» рассматривает проблему понимания и работы с «мягкими атрибутами» — качествами, которые являются субъективными или открыты для интерпретации.

Новое использование векторов активации концепций (CAVs)

Векторы активации концепций, или CAV, помогают нам понять, как ИИ-модели ‘думают’, раскрывая внутренние математические закономерности, которые они используют. По сути, они позволяют нам связать эти закономерности с реальными концепциями таким образом, чтобы люди могли их понять.

Традиционно, проверка разговорного ИИ (CAV) фокусируется на понимании того, как работают модели ИИ. Эти исследователи перевернули этот подход, стремясь вместо этого понять *пользователей*. Они переводят такие вещи, как личные предпочтения и чувства, в данные, которые могут использовать рекомендательные системы. Сосредоточившись на пользователях, они создали систему, которая помогает ИИ лучше понимать, чего на самом деле хотят люди – даже когда это не указано явно – и адаптировать рекомендации к каждому конкретному человеку.

Мы показываем, что наш метод эффективно понимает, что имеют в виду пользователи, даже когда это не указано явно, и также может улучшить рекомендации, позволяя пользователям давать обратную связь по элементам.

Как SEO-эксперт, я очень рад тому, как развиваются AI-модели. Теперь они способны понимать, что слова, такие как ‘funny’, могут иметь разные значения для разных людей. Это огромно, потому что это означает, что рекомендации могут стать гораздо более персонализированными и релевантными, в конечном итоге приводя к повышению вовлеченности пользователей и, да, к улучшению позиций в поисковой выдаче!

Исследователи работают над преодолением разрыва между тем, как люди естественно выражают свои предпочтения, и тем, как системы рекомендаций интерпретируют эти предпочтения.

Люди мыслят концепциями, используя расплывчатые или субъективные описания (называемые мягкими атрибутами).

Рекомендательные системы используют математические вычисления для работы. Они представляют информацию в виде списков чисел и функционируют в сложной многомерной системе, чтобы делать предложения.

Задача заключается в том, чтобы уточнить устные запросы, не прибегая к полной переработке или переобучению системы рекомендаций для понимания каждой мелочи. Автомобили разговорного ИИ справляются с этой сложной задачей.

Мы определяем значение общих описаний атрибутов, используя то, что система рекомендаций уже узнала о пользователях и элементах.

Эта система рекомендаций фокусируется исключительно на предсказании того, какие предметы понравятся пользователям, а не на попытках предсказать дополнительные детали, такие как теги. Добавление этой дополнительной информации обычно не улучшает рекомендации.

Как вебмастер, я нашёл способ действительно точно определить, что нужно пользователям. Мой подход позволяет мне тестировать, какие тонкие качества – такие вещи, как стиль или тон – действительно влияют на то, что предпочитают люди. Это означает, что я могу сосредоточиться на *самых* важных атрибутах, когда пытаюсь понять цели пользователя, будь то объяснение того, почему я что-то порекомендовал, выяснение того, что ему нравится, или даже запрос обратной связи.

Возможно научить компьютеры значению описательных характеристик, или тегов, используя только небольшое количество обучающих данных, подобно тому, как работают предварительное обучение и обучение с небольшим количеством примеров.

«На высоком уровне, наш подход работает следующим образом. Мы предполагаем, что нам дано:

Это включает в себя рекомендательную модель – как вероятностная матричная факторизация или двойной кодировщик – которая представляет как элементы, так и пользователей как точки в скрытом, многомерном пространстве, используя закономерности из того, как пользователи оценивали элементы.

Ограниченное количество тегов, или описательных меток, предоставленных некоторыми пользователями для описания определенных элементов.

Наш подход определяет, насколько каждый элемент связан с определенной характеристикой, помогая нам понять, что эта характеристика означает для системы. Мы достигаем этого, используя технику, называемую векторами активации концепций (CAV) – изначально разработанную для понимания того, как работают модели машинного обучения – чтобы увидеть, действительно ли наша рекомендательная система научилась распознавать эту характеристику.

Отображая эту характеристику в концептуальное пространство, мы можем понять ее значение в различных контекстах и применить это понимание как к элементам, так и к пользователям. Этот метод также показывает, как личные мнения влияют на интерпретацию характеристики – понимают ли разные люди тег или атрибут по-разному. Понимание этих персонализированных значений имеет решающее значение для точного определения того, что пользователь действительно хочет или предпочитает.

Работает ли эта система?

Ключевым открытием стало то, что при тестировании с искусственной меткой (используя нечётные годы) точность системы была лишь немного лучше, чем случайная. Это подтвердило их идею о том, что подключенные автономные транспортные средства (CAVs) могут помочь определить предпочтения или связанные характеристики.

Исследователи обнаружили, что включение Разговорных Агентов (CAV) в системы рекомендаций помогло им лучше понять, как пользователи предоставляют обратную связь, и в конечном итоге улучшило производительность этих систем.

Сначала система определяет наиболее важные характеристики для формирования рекомендаций, анализируя взаимодействие пользователей с элементами и друг с другом.

(ii) разграничение объективного и субъективного использования тегов;

(iii) определение персонализированной, специфичной для пользователя семантики для субъективных атрибутов; и

Это предполагает установление связи между тем, как описываются характеристики, и тем, что предпочитают люди, что позволяет взаимодействовать с системами, используя общие характеристики или теги – например, при предоставлении обратной связи или выражении своих предпочтений.

Исследователи обнаружили, что их метод хорошо работает при рекомендации товаров, основанной на менее очевидных качествах. Они планируют изучить, может ли этот же подход улучшить рекомендации продуктов, которые обычно фокусируются на конкретных функциях, также учитывая более тонкие характеристики.

Основные выводы

Недавно я наткнулся на исследовательскую работу, опубликованную в 2024 году, и, честно говоря, потребовались некоторые усилия, чтобы ее найти. Возможно, поэтому она не получила особого внимания в мире поискового маркетинга – сложно обсуждать то, что люди не могут легко найти!

Google воплотил эту идею в жизнь, протестировав её с WALS, что расшифровывается как Weighted Alternating Least Squares. WALS — это реальный алгоритм, используемый в продукте Google Cloud, который помогает разработчикам.

Две заметки в сноске и в приложении объясняют:

Алгоритмы коллаборативной фильтрации (CAVs), используемые с набором данных MovieLens20M и линейными признаками, полагаются на внедрения, созданные с помощью внутреннего, проприетарного процесса (WALS), которым мы не можем поделиться.

Мы обучили линейные внедрения, используя внутреннюю производственную систему (подробности в Приложении A.3.1), но, к сожалению, мы не можем поделиться этим кодом публично.

Как цифровой маркетолог, я часто имею дело с технологиями, лежащими в основе рекомендаций. Когда мы говорим о ‘production code’ здесь, в Google Cloud, мы имеем в виду программное обеспечение, которое *фактически* работает и обслуживает наших пользователей. Это не ядро чего-то вроде Google Discover, но это важно, поскольку демонстрирует, насколько плавно эту технологию можно добавить к системам, которые у нас уже есть. Речь идет о бесшовной интеграции, которая является ключевым фактором для улучшения пользовательского опыта.

Система оценивалась с использованием общедоступного набора данных MovieLens20M, который содержит 20 миллионов оценок фильмов. Некоторые тесты также сравнивали её производительность с рекомендательной системой WALS от Google. Эти результаты позволяют предположить, что код может быть реализован в реальном приложении без необходимости дополнительного обучения или корректировок.

Это исследование показывает, что рекомендательные системы могут извлечь выгоду из использования информации о менее осязаемых качествах, таких как предпочтения пользователя. Google Discover, который Google считает частью своей поисковой системы, использует историю поиска для предложения контента. Хотя Google этого и не подтвердил, многообещающие результаты этого исследования позволяют предположить, что они могут использовать аналогичный подход для улучшения своих рекомендаций. Если это так, это может означать, что Google лучше понимает и реагирует на то, что пользователи *имеют в виду*, а не только на то, что они ищут.

Эта исследовательская работа признает вклад из нескольких источников, причем большая часть (60%) приходится на Google Research. Amazon, Midjourney и Meta AI также внесли вклад в работу.

Это исследование изучает новый способ улучшения рекомендаций, понимая, что пользователи на самом деле имеют в виду, когда выражают предпочтения к таким вещам, как ‘уютный’ или ‘романтичный’ – качествам, которые открыты для интерпретации. В нем используется метод, называемый Concept Activation Vectors, для определения конкретных характеристик, которые движут этими субъективными предпочтениями, что позволяет системам рекомендаций предоставлять более индивидуальные и релевантные предложения.

Смотрите также

2026-01-06 14:12