Тесты поиска видео Bing по категоризации видео

Как опытный специалист по цифровому маркетингу с более чем двадцатилетним опытом работы за плечами, я должен сказать, что последнее обновление от Microsoft о результатах видеопоиска Bing возбудило мое любопытство. Будучи свидетелем многочисленных изменений в цифровом мире на протяжении многих лет, интересно наблюдать, как платформы продолжают внедрять инновации и адаптироваться к потребностям пользователей.


Microsoft экспериментирует с организацией видео в результатах поиска видео Bing. Макет поиска видео Bing может отображать выделенное видео вверху по запросу, за которым следуют популярные видео, связанные с запросом, короткие видеоролики, раздел со связанными категориями видео и, наконец, традиционные миниатюры видео.

Фрэнк Сандтманн отметил, что Bing, похоже, экспериментирует с новым форматом результатов видео. Теперь четыре поля отображаются на видном месте вверху результатов поиска. В первом блоке отображается основной результат, а в трех других блоках представлены результаты по три подтемы. Фрэнк считает эту схему несколько подавляющей из-за обилия первоначально представленной информации.

Вот тест — мне удалось это повторить:

Вот что обычно показывает:

Так много для Bing попыток упростить ситуацию?

Смотрите также

2024-11-20 15:44

Доля ChatGPT в поисковом маркетинге по сравнению с Google

Как опытный специалист по цифровому маркетингу с более чем двадцатилетним опытом работы за плечами, я видел взлет и падение многих цифровых гигантов. Появление ChatGPT от OpenAI действительно вызвало ажиотаж в отрасли, и интересно видеть его потенциальное влияние на долю рынка, особенно на доминирование Google.


Похоже, что сервис ChatGPT OpenAI может посягать на долю рынка Google, считает Рэнд Фишкин из Sparktoro, который представил некоторые предположения, основанные на сочетании данных из LikeWeb и Datos. Согласно этим данным по состоянию на октябрь 2024 года, доля рынка ChatGPT составляет примерно 4,33%.

На долю chatGPT приходится примерно 4,33%, а лидирует Google со значительной долей 83,54%. Следом за ним следует YouTube с долей около 6,79%, а Bing занимает около 1,97%. Остальные платформы, включая Facebook, Twitter, LinkedIn, Reddit, Pinterest и Perplexity вместе взятые, составляют примерно 3,37% доли рынка.

По словам Рэнда, если мы рассматриваем каждое приглашение LLM как «запрос», предположим, что настольный и мобильный веб-трафик, не принимая во внимание приложения, аналогичны, и предположим, что объединение данных из различных источников приемлемо, то вот представленный им график:

Позже на BrightonSEO Маркус Тобер из Semrush представил слайд, показывающий, что ежемесячный темп роста ChatGPT может сохраниться на уровне 13%. Если эта тенденция сохранится, ChatGPT может сравняться с Google примерно через четыре года.

Я немного скептически отношусь к этому, но, эй, мне бы хотелось ошибаться.

Вот эти посты:

Вот прогноз того, как это будет выглядеть на ближайшие 4 года

» Джон Дитрих (@John_Dietrich1), 20 ноября 2024 г.

Вот еще данные от Маркуса:

https://www.linkedin.com/watch?v=feed/update/urn:li:ugcPost:7264661259948584961

Как вы думаете, это возможно?

Смотрите также

2024-11-20 15:44

Google ясно дает понять, что у него есть сигналы ранжирования как на уровне сайта, так и на уровне страницы

Как опытный веб-мастер с более чем двадцатилетним стажем работы в постоянно меняющемся цифровом мире, я должен сказать, что недавние разъяснения Google относительно использования сигналов как на уровне страницы, так и на уровне всего сайта для поискового ранжирования не вызывают удивления. Это открытие, хотя и давно назревшее, является свидетельством стремления Google поддерживать прозрачность своих сложных алгоритмов.


Google недавно пересмотрела свое руководство по факторам ранжирования в поиске Google, подчеркнув, что для определения рейтинга в поисковых системах оно опирается как на показатели отдельной страницы (на уровне страницы), так и на общие показатели сайта (в масштабе всего сайта). Это разъяснение последовало за обсуждениями на саммите Google Creator Summit, где возникла некоторая неуверенность в том, использует ли Google исключительно сигналы уровня страницы для ранжирования, поэтому это обновление должно помочь дать более четкую картину.

Абзац вверху гласит:

Наши системы ранжирования разработаны для работы на уровне страниц и используют различные сигналы и системы, чтобы понять, как ранжировать отдельные страницы. Также используются общесайтовые сигналы и классификаторы, которые способствуют нашему пониманию страниц. Наличие хороших сигналов для всего сайта не означает, что весь контент сайта всегда будет иметь высокий рейтинг, равно как и наличие некоторых плохих сигналов для всего сайта не означает, что весь контент сайта будет иметь низкий рейтинг.

Google упомянул, что они внедрили эту настройку, чтобы через свою документацию уточнить, что они используют не только сигналы, специфичные для страницы, но и сигналы в целом по сайту при определении рейтинга в поисковых системах.

Проще говоря, эта информация следует за подробной публикацией Гленна Гейба, которая демонстрирует, что Google уже довольно давно использует сигналы для всего сайта. Это свидетельство подчеркивает тот факт, что Google продолжает использовать сигналы всего сайта в своих процессах ранжирования.

Конечно, как отметил в своем посте Гленн, мы обсуждали эту тему бесчисленное количество раз.

Вот обновленный контент:

Вчера Гленн отметил на X, что Google пересмотрел свое «Руководство по системам поискового ранжирования», включив в начало раздел об использовании общесайтовых сигналов и классификаторов. Это, несомненно, будет включено в мой пост, положив конец любым предположениям о том, что принимаются во внимание только сигналы уровня страницы.

Что касается более широких аспектов SEO, Google недавно пересмотрела свое руководство «Поисковые системы ранжирования», включив в него важный раздел, посвященный использованию общесайтовых сигналов и классификаторов. Эта информация, несомненно, будет ценна для моего поста, эффективно развеивая любые сомнения относительно важности сигналов, специфичных для конкретной страницы…

» Гленн Гейб (@glenngabe), 19 ноября 2024 г.

Смотрите также

2024-11-20 15:43

Кампании межканального ремаркетинга: полное руководство

Как профессионал в области цифрового маркетинга с многолетним опытом за плечами, я могу с уверенностью сказать, что многоканальный ремаркетинг — это не просто настройка кампаний и забвение о них. Это похоже на попытку добиться кого-то на нескольких платформах: вам нужно знать, когда отправить милое сообщение, когда поделиться забавным мемом, а когда предложить выгодную сделку.


В идеальном мире потребители совершали бы покупку после всего лишь одного взаимодействия с брендом.

Реальность такова, что мы живем не в идеальном мире.

К сожалению, многие бренды считают, что создание идеальной структуры кампании, тщательная организация ключевых слов и написание исключительно привлекательного рекламного контента сами по себе могут стимулировать продажи.

Это довольно редко, не так ли? Когда вы в последний раз покупали товар, не узнав о нем заранее?

Поскольку у каждого есть несколько устройств, неудивительно, что наша продолжительность концентрации внимания стала короче, чем когда-либо.

Из офиса мы перемещаемся домой, где продолжаем работать с экранами – сначала с большим на работе, теперь с таким же большим экраном телевизора, и на протяжении всего этого времени мы постоянно взаимодействуем с маленьким экраном в наших ладонях!

Именно здесь в игру вступает кросс-канальный ремаркетинг.

Ремаркетинг, охватывающий несколько каналов, позволяет восстановить связи с пользователями на различных платформах, расширяя возможности взаимодействия и, в конечном итоге, улучшая ваши результаты.

Независимо от вашего уровня PPC-маркетолога — будь то опытный профессионал или новичок в этой области — это руководство предлагает всестороннее изложение основных знаний, необходимых для создания успешных многоплатформенных рекламных кампаний по ретаргетингу.

Мы рассмотрим ключевые стратегии и советы, которые помогут вам создать и усовершенствовать эффективные кампании.

Что такое межканальный ремаркетинг?

Межканальный ремаркетинг — это практика повторного привлечения пользователей на нескольких цифровых платформах после их первоначального взаимодействия с вашим брендом.

Как опытный веб-мастер, я хотел бы подчеркнуть возможность диверсификации вашей последующей рекламы за пределы одного канала. Применяя кросс-канальный ремаркетинг, вы можете расширить охват своего сообщения на нескольких платформах, таких как Google Ads, Facebook, Instagram, LinkedIn и даже в сетях программной рекламы. Таким образом, ваша аудитория с большей вероятностью будет постоянно видеть вашу рекламу, независимо от того, какие места в Интернете они предпочитают.

Как эксперт по SEO, я бы сказал, что такой подход позволяет моему бренду оставаться в центре внимания потенциальных клиентов во всех их цифровых центрах.

Почему важен межканальный ремаркетинг?

Важно, чтобы ваша стратегия ремаркетинга не ограничивалась одной платформой, поскольку клиенты, как правило, используют несколько онлайн-каналов.

Вот несколько веских причин, почему многоканальный ремаркетинг необходим:

  • Расширенный охват и вовлечение. Используя несколько платформ, вы сможете охватить более широкую аудиторию и более эффективно усилить послание своего бренда.
  • Более высокий коэффициент конверсии. Ремаркетинг пользователей по разным каналам повышает вероятность их конверсии, поскольку они видят вашу рекламу в различных онлайн-средах.
  • Улучшенная персонализация. Каждая платформа имеет уникальные параметры таргетинга, которые позволяют адаптировать ваше сообщение к конкретным сегментам аудитории.
  • Лучшее использование данных. Вы можете объединять данные из разных каналов, чтобы получить полное представление о поведении пользователей и эффективности кампании.
  • Повышение запоминаемости бренда. Повторяющееся, но различное воздействие на нескольких платформах усиливает запоминаемость бренда, повышая вероятность того, что пользователи выберут ваш бренд, когда они будут готовы к конверсии.

Многоканальный и кросс-канальный ремаркетинг — это одно и то же?

Хотя они могут быть похожими, важно различать разницу между ними.

Проще говоря, многоканальный ремаркетинг — это стратегия охвата аудитории через несколько платформ. Иллюстрацией может служить маркетинговая кампания, которая привлекает зрителей как на медийной рекламе Google, так и на YouTube.

Каждый канал работает самостоятельно, без какого-либо взаимодействия или сотрудничества между ними, поскольку они фокусируются отдельно на разных платформах.

Вместо того, чтобы просто продвигать маркетинг на одном канале, кросс-канальный ремаркетинг поднимает его на ступеньку выше, связывая несколько платформ вместе. Таким образом, взаимодействие можно отслеживать и записывать более эффективно, что упрощает для клиентов завершение процесса покупки.

Как настроить собственную стратегию многоканального ремаркетинга

Для опытного веб-мастера разработка эффективного и всеобъемлющего плана многоканального ремаркетинга требует тщательного планирования и исполнения.

При создании стратегии ремаркетинга вашего бренда рассмотрите следующие шаги:

1. Определите свои цели

Для начала очень важно четко сформулировать свою цель. Вы стремитесь повысить коэффициент конверсии, повысить узнаваемость бренда или стимулировать взаимодействие с пользователем?

Определение основных и резервных целей будет определять ваш творческий подход и выбор аудитории на каждой платформе.

Совет для профессионалов: согласуйте свои цели с маркетинговой воронкой. Например, используйте каналы верхней части воронки, такие как контекстно-медийные сети, для повышения узнаваемости бренда, а также каналы средней и низкой воронки, такие как поиск и социальные сети, для конверсий.

2. Выбирайте платформы с умом

Каждая платформа не идеально подходит для каждой ситуации. Крайне важно выбрать те, которые соответствуют цифровому поведению вашей аудитории и сути того, что вы предлагаете. Например:

  • Google Реклама: отлично подходит для поисковых целей и медийной рекламы.
  • Facebook и Instagram: идеально подходят для визуально привлекательных кампаний.
  • LinkedIn: идеально подходит для B2B-аудитории.
  • Программные сети: отлично подходят для масштабирования и динамичных творческих возможностей.

Крайне важно выбрать правильные платформы в зависимости от отрасли и убедиться, что вы присутствуете там, где проживает ваша целевая аудитория. Общайтесь с ними в местах, которые они часто посещают, и это естественно. Вот несколько примеров:

  • Электронная коммерция. Контекстно-медийная сеть Google, Facebook, Instagram, TikTok и программные платформы могут демонстрировать изображения продуктов и товарную рекламу.
  • B2B-услуги: LinkedIn, Google Search и ремаркетинг через отраслевые платформы (например, Capterra) могут обеспечить высокий уровень вовлеченности.
  • Гостиничный бизнес и путешествия: истории в Instagram, видеореклама в Facebook и Pinterest могут вдохновлять пользователей, а поиск Google привлекает путешественников с высокими намерениями.

3. Сегментируйте свою аудиторию соответствующим образом

Сегментация аудитории имеет решающее значение для эффективного ремаркетинга.

Создавайте уникальные группы пользователей на основе их действий, например тех, кто посетил ваш сайт, просмотрел определенные продукты или ранее совершил покупки.

Использование информации, собранной из вашей системы управления взаимоотношениями с клиентами, статистики веб-сайта и рекламных инструментов, позволяет вам эффективно разделить аудиторию и соответствующим образом настроить свое общение.

Если вы хотите усовершенствовать свою стратегию сегментации аудитории, попробуйте следующие идеи:

  • Сегменты по времени: таргетинг на пользователей, которые посещали ваш сайт в течение последних 7, 30 или 90 дней.
  • Сегменты ценности клиентов: различайте клиентов с высокой и низкой ценностью, чтобы эффективно распределять бюджет.

Как интегрировать свою творческую стратегию

Чтобы провести эффективную мультиплатформенную маркетинговую кампанию, которая отслеживает потенциальных клиентов по различным каналам, важно иметь единый, творческий план. Поэтому я подчеркиваю важность выделения в этом контексте отдельного сегмента творчеству.

Если вы не уверены в реализации своей творческой стратегии, вот несколько шагов, которые помогут вам на этом пути.

1. Поддерживайте единый брендинг

Убедитесь, что вся ваша реклама, независимо от канала, отражает тон и визуальный стиль вашего бренда. Поступая так, вы создадите в умах вашей аудитории чувство доверия и знакомства.

Пользователи с большей вероятностью будут идентифицировать ваш бренд на разных платформах после нескольких встреч с ним.

Вот несколько советов по визуальному единообразию вашего объявления:

  • Используйте одну и ту же цветовую палитру, размещение логотипа и типографику на всех каналах.
  • Сохраняйте одинаковый тон в тексте объявления, даже если формулировка варьируется в зависимости от ограничений на количество символов на платформе.

2. Адаптируйте креатив для каждой платформы

Хотя последовательность является ключевым моментом, каждая платформа имеет уникальные форматы рекламы и лучшие практики.

Например:

  • Медийная реклама Google: используйте простые визуальные эффекты и четкий призыв к действию.
  • Реклама в Facebook и Instagram: используйте форматы видео и карусели для повышения вовлеченности.
  • Спонсорский контент LinkedIn: сосредоточьтесь на профессиональном, основанном на знаниях контенте.

Это не означает, что вам нужно полностью воссоздать колесо (без каламбура) для каждого творческого ресурса в зависимости от платформы!

Чтобы обеспечить согласованность на всех платформах и при этом адаптировать свой творческий потенциал для каждого уникального канала, рассмотрите следующие простые стратегии:

  • Статические изображения или видео. Используйте привлекательные изображения для статической рекламы и коротких интересных видеороликов для таких платформ, как Instagram и TikTok.
  • Интерактивные элементы. Используйте карусели или опросы на таких платформах, как Instagram, чтобы повысить взаимодействие с пользователем.

3. Используйте динамическую рекламу

Динамическая реклама автоматически персонализирует рекламный контент на основе прошлых взаимодействий пользователей.

Использование этой стратегии может значительно улучшить результаты, особенно в рекламных акциях электронной коммерции, где предложения продуктов играют решающую роль.

Двумя самыми большими преимуществами динамической рекламы являются персонализация и масштабируемость.

Адаптируя рекламный контент в соответствии с продуктами, которые они ранее просматривали или помещали в корзину, пользователи, как правило, более склонны взаимодействовать с такой рекламой.

Кроме того, использование динамической рекламы позволяет упростить масштабирование персонализированного контента без необходимости создания множества различных версий рекламы.

Как отслеживать и измерять успех

Отслеживание эффективности перекрестных каналов необходимо для совершенствования ваших стратегий с течением времени.

Чтобы эффективно отслеживать и оценивать ваши кампании, выполните следующие действия.

1. Внедрить унифицированное отслеживание

Убедитесь, что у вас есть комплексные механизмы отслеживания по всем каналам.

Используя такие ресурсы, как Google Analytics, Менеджер тегов и уникальные пиксели отслеживания для различных платформ, вы можете собирать информацию о действиях пользователей и последовательности шагов, которые они предпринимают, приводя к конверсиям.

Использование Google Tag Manager (GTM) в качестве единого оптимизированного инструмента отслеживания может значительно упростить процесс размещения рекламы на различных платформах. Он объединяет управление тегами в единую и эффективную систему.

Кроме того, существуют кроссплатформенные программные решения для атрибуции, которые позволяют лучше понять роль каждой платформы в общем успехе.

2. Используйте модели мультитач-атрибуции

Как опытный эксперт по SEO, я часто сталкиваюсь с ситуациями, когда модели атрибуции одним касанием, такие как метод последнего клика, не обеспечивают комплексного представления взаимодействия пользователей по различным каналам. Эти модели склонны приписывать всю ценность конверсий конечной точке контакта, часто игнорируя ценную роль, которую другие каналы играют в пути клиента.

Другие доступные модели атрибуции включают:

Лучшие практики для многоканального ремаркетинга

Постоянное совершенствование ваших мультиплатформенных маркетинговых усилий — это важная задача, а не предполагать, что это разовая работа по настройке. Существует множество переменных, которые могут существенно повлиять на результаты, делая их либо очень успешными, либо менее эффективными.

Вот несколько рекомендаций, с которых можно начать.

1. Установите соответствующее ограничение частоты показов

Чтобы пользователи не чувствовали себя перегруженными, установите ограничения на то, как часто они будут видеть вашу рекламу в течение определенного периода времени.

На большинстве платформ ограничение показов находится в настройках кампании или группы объявлений.

Более того, некоторые платформы обеспечивают повышенную гибкость благодаря ограничению частоты показов, позволяя осуществлять это на почасовой, ежедневной или общей основе.

2. Согласуйте свои сообщения с путешествием пользователя

Убедитесь, что ваши сообщения ремаркетинга соответствуют этапу пути пользователя к покупателю.

Новичок на сайте может увидеть рекламу, подчеркивающую преимущества продукта, тогда как тому, кто оставил товары в корзине без покупки, может быть показано объявление с кодом скидки.

Самый простой пример согласования сообщений о пути пользователя может быть следующим:

  • Начало последовательности (TOFU): демонстрируйте образовательный контент или истории брендов.
  • Середина воронки продаж (MOFU). Сосредоточьтесь на характеристиках продукта, отзывах клиентов и тематических исследованиях.
  • Низ воронки (BOFU). Включите рекламные акции, ограниченные по времени предложения или бесплатные пробные версии.
  • После покупки (удержание).  Предоставляйте вознаграждения за обзоры продуктов, рекламные акции «Пригласи друга» или партнерские сообщения.

3. Мониторинг и оптимизация производительности

Отслеживайте ключевые показатели, такие как рейтинг кликов (CTR), коэффициент конверсии и рентабельность инвестиций в рекламу (ROAS).

Используйте A/B-тестирование, чтобы найти наиболее эффективные креативы и внести корректировки на основе данных.

Вот некоторые советы по оптимизации:

  • Регулярно чередуйте креативы. Меняйте рекламные креативы каждые несколько недель, чтобы избежать усталости от рекламы.
  • Проверьте перекрытие аудиторий. Убедитесь, что ваши аудитории на разных платформах не пересекаются слишком сильно, что приводит к неэффективности.
  • Анализ стратегий конкурентов. Используйте сторонние инструменты, чтобы просмотреть многоканальные стратегии конкурентов и соответствующим образом скорректировать свою.

Межканальные проблемы и способы их преодоления

Успех межканального ремаркетинга не обходится без препятствий.

Несколько распространенных проблем (и решений), которые следует учитывать при реализации многоканальной стратегии:

  • Сложность атрибуции. Определить, какой канал заслуживает внимания за конверсию, может быть непросто. Используйте модели мультитач-атрибуции, чтобы лучше понять, как каждый канал влияет на действия пользователя.
  • Управление бюджетом. Эффективное распределение бюджета по каналам может оказаться непростой задачей. Регулярно проверяйте распределение бюджета и корректируйте его в зависимости от эффективности.
  • Творческая усталость. Пользователи могут устать от неоднократного просмотра одной и той же рекламы. Регулярно меняйте креативы, чтобы контент оставался свежим и интересным.

Межканальный маркетинг требует баланса

Межканальный ремаркетинг — мощный инструмент для привлечения пользователей и повышения коэффициента конверсии.

Адаптируя контент для вашей целевой аудитории, распространяя его по нескольким каналам и совершенствуя свой подход к творчеству, вы можете вести потенциальных клиентов по плавному пути — от признания до ответа.

Внедрите эти методы, чтобы ваши кампании находили отклик у вашей аудитории и максимизировали рентабельность инвестиций.

Реальность такова, что кросс-канальный маркетинг требует баланса стратегии, тестирования и мониторинга.

Оставайтесь гибкими, следите за тем, что находит отклик у пользователей, и будьте готовы усовершенствовать свой подход.

Смотрите также

2024-11-20 15:39

Обновление GraphRAG улучшает результаты поиска AI

Разница между RAG и GraphRAG

Как опытный веб-мастер, ставший свидетелем эволюции поисковых систем с момента их скромного зарождения, я должен сказать, что GraphRAG выделяется как революционная инновация в этой области. Идея использования диаграммы знаний для организации и обобщения данных является не чем иным, как революционной. Это похоже на переход от пыльного библиотечного каталога к динамичной интерактивной карте информации, и все это на кончиках ваших пальцев.


Проще говоря, RAG (Поисковая расширенная генерация) работает, используя мощную языковую модель вместе с поисковой базой данных. Такая настройка позволяет более точно выдавать ответы на поисковые запросы. Извлекая текущие и актуальные данные из поискового индекса, он сводит к минимуму риск того, что поисковая система ИИ предоставит устаревшие или сфабрикованные ответы.

GraphRAG расширяет возможности традиционных RAG (готов, ожидает ответа и завершен), создавая граф знаний на основе поискового индекса, который впоследствии создает сводки, известные как «отчеты сообщества». Проще говоря, вместо того, чтобы полагаться исключительно на обновления вручную или отдельные ответы, GraphRAG использует данные из поискового индекса для создания взаимосвязанной сети (граф знаний), а затем генерирует краткие сводки по конкретным темам или областям (отчеты сообщества).

GraphRAG использует двухэтапный процесс:

Шаг 1. Создание структуры тематического индекса

Принято считать, что GraphRAG работает с графами знаний, но это еще не все. В действительности, на этапе механизма индексирования GraphRAG создает эти графы знаний из неорганизованных данных, таких как веб-страницы. В отличие от RAG, который просто собирает и обобщает информацию без создания иерархического графика, GraphRAG выделяется тем, что превращает необработанные данные в структурированные знания.

На шаге 2 GraphRAG использует построенный им граф знаний, чтобы предложить соответствующий контекст модели изучения языка (LLM), что позволяет ей давать более точные ответы на вопросы.

По словам Microsoft, проблема с функцией Retrival Augmented Generation (RAG) заключается в том, что ей трудно извлекать данные, относящиеся к конкретным темам, поскольку она в первую очередь фокусируется на понимании семантических связей.

Один из способов перефразирования данного текста заключается в следующем: вместо RAG, который использует семантические связи для поиска ответов, GraphRAG выделяется тем, что сначала преобразует все документы в своей поисковой базе данных в иерархический граф знаний, который классифицирует темы и подтемы (темы) постепенно от общее к частному. Это позволяет GraphRAG находить решения, даже если релевантные ключевые слова не связаны семантически в документе, благодаря фокусу на тематическом сходстве.

Система Baseline RAG испытывает трудности с обработкой запросов, которые требуют сбора данных из различных частей набора данных для получения ответа, например, таких вопросов, как «Каковы 5 основных тем в данных?» работает плохо, поскольку Baseline RAG работает путем поиска семантически связанного текста в наборе данных. Поскольку в запросе нет конкретных указаний, позволяющих направить его на получение соответствующей информации, он может не дать точных результатов.

С помощью GraphRAG мы можем решать такие вопросы, поскольку структура графа знаний, созданная LLM, дает представление об общей организации (и, следовательно, повторяющихся темах) в наборе данных. Таким образом, частный набор данных группируется в соответствующие семантические группы, которые были предварительно обобщены. Затем LLM привлекает эти группы для обобщения и обсуждения этих тем при ответе на запрос пользователя.

Обновление для GraphRAG

Таким образом, GraphRAG создает граф знаний, используя свой индекс поиска. «Сообщество» представляет собой совокупность связанных разделов или документов, сгруппированных вместе из-за их тематического сходства. С другой стороны, «отчет сообщества» представляет собой краткий обзор, созданный LLM для каждого конкретного сообщества.

В первоначальной конструкции GraphRAG он обрабатывал все отчеты сообщества, даже те, которые содержали низкоуровневые сводки, не имеющие прямого отношения к поисковому запросу. Microsoft называет эту методологию «статической», поскольку она не включает динамическую фильтрацию или настройку на основе релевантности запроса.

В обновленном GraphRAG представлен «динамический выбор сообщества», который оценивает актуальность каждого отчета сообщества. Нерелевантные отчеты и их подсообщества удаляются, что повышает эффективность и точность за счет сосредоточения внимания только на актуальной информации.

При таком подходе мы включаем в наш алгоритм глобального поиска метод, называемый динамическим выбором сообщества. Этот метод использует преимущества структуры графа знаний, найденного в нашем наборе данных. Мы начинаем с оценки соответствия отчета сообщества вопросу пользователя с помощью модели большого языка (LLM). Если отчет считается нерелевантным, он и любые связанные с ним узлы или подсообщества исключаются из процесса поиска. И наоборот, если отчет считается релевантным, мы исследуем его дочерние узлы и повторяем один и тот же процесс. Конечным результатом является то, что только соответствующие отчеты попадают в операцию уменьшения карты, которая генерирует окончательный ответ для пользователя.

Выводы: результаты обновления GraphRAG

Microsoft обнаружила, что последняя версия GraphRAG значительно сократила вычислительные затраты примерно на 77%. Это снижение было особенно заметно в стоимости токена во время обработки языковой моделью (LLM). Проще говоря, токены — это фундаментальные компоненты текста, которые обрабатываются LLM. Для расширенного GraphRAG теперь требуется меньший LLM, что означает снижение затрат без ущерба для качества результатов.

Положительное влияние на качество результатов поиска:

  • Динамический поиск предоставляет ответы, содержащие более конкретную информацию.
  • Результаты более полные и специфичные для запроса пользователя, что помогает избежать предоставления слишком большого количества информации.

GraphRAG: улучшение глобального поиска за счет динамического выбора сообщества

Смотрите также

2024-11-20 13:38