Измерение расхождений между ИИ-помощниками и поисковыми системами.

Предупреждаем перед началом: в этой статье будет немного математики! Если уравнения обычно вызывают у вас перегрузку или желание перекусить, будьте готовы (может быть, держите под рукой немного торта). Но если вы любите математику и даже втайне думаете, что k равно N, вас ждет приятный сюрприз, когда мы углубимся в гибридный поиск.

Долгое время SEO следовало простой схеме: мы вносили улучшения, смотрели, где оказались наши позиции в рейтинге, и отслеживали результаты. Всё работало хорошо, потому что Google чётко показывал нам наши показатели. (На самом деле, это было *не совсем* так просто, но это общая идея.)

Искусственные интеллекты теперь работают поверх результатов поиска. Они могут быстро обобщать информацию, предоставлять источники и отвечать на вопросы напрямую, часто *до того*, как вам потребуется перейти по ссылке. Это означает, что ваш контент может быть использован, перефразирован или полностью пропущен – и вы не увидите никакой этой активности, отраженной в вашей обычной веб-аналитике.

SEO не становится неважным. Вместо этого, наряду с ним, появляется другой тип онлайн-видимости. Эта статья исследует способы отслеживания этой видимости без необходимости программировать, иметь специальные разрешения или полагаться на разработчика – помогая вам сосредоточиться на том, что вы можете уверенно измерить.

Почему это важно

Большая часть интернет-трафика по-прежнему поступает из поисковых систем. Google обрабатывает почти 4 миллиарда поисковых запросов каждый день. Хотя это и значительное число, Perplexity обрабатывает около 10 миллиардов поисковых запросов в год, что намного меньше, чем ежедневный объём Google.

Маркетологам в настоящее время не хватает централизованного места для отслеживания частоты появления их контента в новых поисковых результатах Google с поддержкой искусственного интеллекта. Google начала решать эту проблему, добавив данные о производительности для AI Mode – включая показы, клики и позиции в рейтинге – непосредственно в Search Console. Эти данные теперь интегрированы со стандартными данными поисковых результатов «Web».

Как эксперт по SEO, я внимательно слежу за трафиком, генерируемым искусственным интеллектом, и хотя он *и* включается в нашу аналитику, в настоящее время он смешан со всем остальным. Прямо сейчас мы не можем выделить его отдельно, чтобы увидеть, как искусственный интеллект конкретно влияет на производительность. Данные существуют, но все они объединены – у нас нет разбивке, показывающей, какой процент трафика поступает от искусственного интеллекта, или способа отслеживать его тенденции. Но мы работаем над этим – я ожидаю увидеть эти аналитические данные в ближайшее время!

Пока мы не сможем получить более чёткое представление о том, как всё работает, давайте используем прокси-тест, чтобы увидеть, где ИИ-помощники и результаты поиска совпадают, а где расходятся.

Две Системы Получения, Два Способа Быть Найденным

Большинство поисковых систем работают путем прямого сопоставления слов, которые вы вводите, со словами на веб-страницах. Популярный метод под названием BM25 был ключевой частью поисковой технологии, обеспечивая работу систем, таких как Elasticsearch и многих поисковых систем, которые мы используем каждый день.

ИИ-помощники не просто ищут конкретные слова; они понимают смысл. Они используют нечто под названием ’embeddings’ – по сути, математические представления текста – для сопоставления концепций. Это позволяет им находить релевантную информацию, даже если она сформулирована по-другому.

Различные методы поиска имеют разные недостатки. Поиск точных слов может пропустить связанные термины, в то время как поиск по смыслу иногда может связывать нерелевантные концепции. Однако использование обоих методов вместе приводит к более точным и всесторонним результатам.

Большинство гибридных систем поиска объединяют результаты из различных методов, используя технику, называемую Reciprocal Rank Fusion, или RRF. Вам не нужно знать, как это *сделать* на самом деле, но понимание основной идеи поможет вам понять результаты, которые мы рассмотрим позже.

RRF на простом языке

Гибридный поиск объединяет результаты из разных поисковых запросов в единый, всесторонний список. Метод, используемый для этого объединения, называется RRF.

Система подсчёта баллов проста: оценка вычисляется как 1, делённое на сумму ‘k’ и ранга предмета (выражается как 1 / (k + rank)). Если предмет появляется в нескольких списках, его оценки из каждого списка суммируются для получения общей оценки.

В данном контексте, ‘rank’ относится к позиции элемента в списке, где 1 — наивысшая. ‘k’ — это значение, используемое для уменьшения разницы в оценке между элементами в верхней части и теми, которые имеют более низкий ранг. Хотя многие системы используют значение около 60 для ‘k’, его можно настроить в соответствии с конкретными потребностями.

Векторные модели не находят результаты, просто подсчитывая, как часто встречаются слова. Вместо этого они представляют как документы, так и ваш поисковый запрос как точки в многомерном пространстве. Затем модель вычисляет, насколько похожа каждая точка документа на точку вашего запроса, и ранжирует результаты на основе этой схожести. Это создает ранжированный список, который *выглядит* как традиционный рейтинг поиска, но на самом деле основан на измерении *расстояния* между этими точками, а не просто на количестве появлений ключевых слов.

Как человек, который годами создавал и управлял веб-сайтами, я считаю, что действительно помогает иллюстрировать вещи конкретными примерами. Итак, давайте посмотрим, как работает релевантность поиска, используя небольшие числа и два разных метода ранжирования. Мы будем использовать значение ‘k’ равное 10 – то есть мы рассмотрим топ 10 результатов – чтобы упростить задачу. Один рейтинг будет основан на BM25, который фокусируется на сопоставлении ключевых слов, а другой будет использовать векторную модель, которая понимает *значение* за поисковыми терминами.

Документ A является лучшим результатом согласно системе ранжирования BM25 и третьим в списке векторного ранжирования. Его оценка BM25 рассчитывается как 1, деленное на (10 + 1), что равно 0.0909. Его оценка в векторном списке составляет 1, деленное на (10 + 3), что дает 0.0769. При объединении этих оценок, общая сумма составляет 0.1678.

Документ B является документом с самым высоким рейтингом в векторном списке и вторым в BM25. Его оценка BM25 рассчитывается как 1, делённое на (10 + 2), что равно 0.0833. Его оценка в векторном списке составляет 1, делённое на (10 + 1), что даёт 0.0909. При объединении этих оценок, общая сумма составляет 0.1742.

Как SEO-эксперт, я анализировал оценки ранжирования документов. Документ C в настоящее время занимает 3-е место на основе алгоритма BM25 и 2-е место в результатах векторного поиска. Рассчитывая взаимный ранг, BM25 дает нам 1, деленное на (10 + 3), что примерно равно 0.0769. Векторный список дает 1, деленное на (10 + 2), или около 0.0833. Сложив эти два результата, мы получаем комбинированную оценку 0.1602.

Документ B показывает лучшие общие результаты, появляясь в верхней части обоих рейтинговых списков. Увеличение значения ‘k’ до 60 уменьшает различия между списками, создавая более сбалансированную и естественную комбинацию результатов.

Просто для ясности, это упрощенный пример, чтобы помочь объяснить концепцию. Каждый поисковик и платформа социальных сетей обрабатывает свои факторы ранжирования уникальным образом, и они не публикуют точное *как* эти факторы взвешиваются. Я люблю думать об этом как о способе визуализации того, как различные сигналы объединяются для определения общих результатов – это аналогия, а не точная формула.

Где эта математика на самом деле применяется

Они все работают схожим образом: сначала они находят релевантные результаты, используя метод под названием BM25, затем находят больше, используя векторный поиск. Далее они ранжируют эти результаты с помощью RRF, и, наконец, объединяют все вместе. Уравнения, показанные здесь, призваны помочь понять идею, а не представлять точные расчеты, используемые в каждой системе.

Наблюдение за гибридным поиском в реальных условиях

Маркетологи не имеют доступа к спискам, которые Google использует внутри компании, но мы все еще можем анализировать, как результаты поиска и ответы ассистента отображаются публично. Сравнивая то, что Google показывает в поисковой выдаче, с тем, что предоставляет его ассистент, а затем ища сходства, новую информацию и частоту совпадений результатов, мы можем получить оценку того, что Google считает важным. Этот метод не совсем такой, как Google определяет рейтинги внутри компании, но он дает нам полезное приближение.

Шаг 1. Соберите Данные

Выберите 10 запросов, которые важны для вашего бизнеса.

Для каждого запроса:

  1. Запустите поиск в Google и скопируйте первые 10 органических URL-адресов.
  2. Запустите это в ассистенте, который показывает цитаты, таком как Perplexity или ChatGPT Search, и скопируйте каждый процитированный URL или домен.

Теперь у вас есть два списка для каждого запроса: Google Top 10 и Assistant Citations.

Шаг 2. Посчитайте Три Вещи

  1. Пересечение (I): количество URL-адресов или доменов, которые появляются в обоих списках.
  2. Новизна (N): количество цитат ассистента, которые не появляются в топ-10 Google.
    Если у ассистента шесть цитат, и три из них пересекаются, N = 6 − 3 = 3.
  3. Частота (F): как часто каждый домен появляется во всех 10 запросах.

Шаг 3. Преобразуйте количество в быстрые метрики.

Для каждого набора запросов:

Коэффициент общей видимости (SVR) рассчитывается путем деления количества цитирований на 10. Он показывает, как часто результаты из топ-10 поисковой выдачи Google также включаются в цитаты, используемые ассистентом.

Как веб-мастер, я обнаружил действительно полезную метрику под названием Unique Assistant Visibility Rate, или UAVR. По сути, она говорит мне, насколько оригинален ответ ассистента. Мы рассчитываем ее, деля количество *новых* фрагментов информации, предоставляемых ассистентом, на общее количество источников, на которые он ссылается для данного поиска. Более высокий UAVR означает, что ассистент лучше справляется с синтезом информации и предоставляет мне действительно уникальный контент, а не просто повторяет то, что уже существует.

Повторяемость Цитирования (RCC) рассчитывается путем суммирования частоты цитирования для домена во всех результатах поиска, а затем деления на общее количество поисковых запросов. Он показывает, как часто конкретный домен появляется в качестве источника в нескольких ответах.

Пример:

При поиске в топ-10 результатов Google, ассистент предоставил 6 цитат. Три из этих цитат были найдены в топ-10 результатов Google. Ассистент цитировал ‘I’ три раза, ‘N’ три раза и ‘example.com’ четыре раза. Это приводит к показателю перекрытия результатов поиска (SVR) 0.30, показателю уникальной проверки ассистента (UAVR) 0.50 и коэффициенту согласованности ссылок (RCC) 0.40.

Теперь у вас есть числовой снимок того, насколько близко помощники отражают или расходятся с поиском.

Шаг 4. Интерпретация

Эти оценки — всего лишь предложения, чтобы помочь вам начать, а не официальные отраслевые стандарты. Не стесняйтесь изменять их в соответствии с вашими конкретными потребностями.

  • Высокий SVR (> 0.6) означает, что ваш контент соответствует обеим системам. Лексическая и семантическая релевантность синхронизированы.
  • Умеренный SVR (0.3 – 0.6) с высоким RCC указывает на то, что ваши страницы семантически надежны, но требуют более четкой разметки или более сильных ссылок.
  • Высокий RCC для конкурентов указывает на то, что модель неоднократно ссылается на их домены, поэтому стоит изучить это для получения подсказок по схеме или дизайну контента.

Шаг 5. Действуй.

Если ваш коэффициент видимости сайта (SVR) низок, сосредоточьтесь на том, чтобы сделать заголовки более понятными, улучшить общую читабельность и убедиться, что поисковые системы могут легко сканировать ваш сайт. Если ваш коэффициент относительного создания контента (RCC) низок, убедитесь, что информация об авторе, структурированные данные (schema) и временные метки соответствуют вашему контенту. Если ваш коэффициент неожиданной скорости появления аудитории (UAVR) высок, отслеживайте новые домены – они могут уже иметь устоявшийся авторитет в вашей отрасли.

Этот метод не гарантирует идеальную работу каждый раз. У некоторых AI-помощников есть ограничения на количество отображаемых источников, и они могут меняться в зависимости от вашего местоположения. Вы также можете увидеть разные результаты в зависимости от того, где вы находитесь и что ищете. Рассматривайте это как способ исследовать возможности, а не как строгий набор правил.

Почему эта математика важна

Этот паттерн раскрывает лежащую в основе сложную систему, которая работает – это как понимание погоды, наблюдая за тем, как качаются деревья. Вы видите результаты системы, а не саму систему.

Работа на странице, которая помогает гибридному поиску.

Как только вы увидите, как проявляются перекрытия и новизна, следующим шагом будет ужесточение структуры и ясности.

  • Пишите короткими блоками аргументов и доказательств объемом 200-300 слов.
  • Используйте чёткие заголовки, маркеры и стабильные якоря, чтобы BM25 мог находить точные термины.
  • Добавьте структурированные данные (FAQ, HowTo, Product, TechArticle), чтобы векторы и помощники понимали контекст.
  • Сохраняйте канонические URL стабильными и отмечайте время обновления контента.
  • Публикуйте канонические PDF-версии для тем с высоким уровнем доверия; помощники часто ссылаются сначала на фиксированные, проверяемые форматы.

Эти шаги поддерживают как краулеров, так и LLM, поскольку они используют язык структуры.

Отчетность и исполнительное оформление

Руководители гораздо больше заинтересованы в том, насколько легко они могут увидеть результаты и насколько они могут доверять данным, чем в технических деталях, таких как алгоритмы поиска или методы представления данных.

Эти новые метрики – SVR, UAVR и RCC – покажут вам, насколько эффективны ваши текущие усилия по SEO в AI-powered поиске, и выявят возможности, где ваши конкуренты выделяются вместо вас.

Объедините эти результаты с данными о производительности из AI Mode Search Console, но имейте в виду, что в настоящее время невозможно отличить данные, сгенерированные ИИ, от стандартных веб-кликов. Поэтому любые цифры, относящиеся конкретно к ИИ, следует рассматривать как приближение, а не точное измерение. Доступность данных также может варьироваться в зависимости от вашего местоположения.

Эти ограничения не уменьшают ценность этих расчётов. Вместо этого, они гарантируют, что у нас будут разумные ожидания и предоставляют чёткий способ обсуждения аналитических данных, основанных на искусственном интеллекте, с руководителями компании.

Подводя итоги

Поисковые системы и ИИ-помощники принципиально не отличаются — дело в *том, когда* они находят информацию. Поисковые системы определяют лучшие результаты *после* того, как вы уже задали вопрос. Помощники, с другой стороны, собирают потенциальную информацию *до* того, как они даже узнают, что вы собираетесь спросить.

Расчёты в этой статье предлагают способ понять изменения без необходимости использования технических инструментов. Речь идёт не о внутренней работе платформы, а скорее об упрощённом методе для маркетологов, помогающем визуализировать происходящее за кулисами.

Как цифровой маркетолог, я видел много изменений, но некоторые вещи остаются неизменными. В конечном счете, успешный контент по-прежнему сводится к ясности, хорошей организации и установлению себя как надежного источника. Эти основные принципы никогда не выйдут из моды.

Теперь вы можете отслеживать, насколько хорошо рейтинг сайта переносится между различными поисковыми системами и поисковиками, и делать это с практическими, достижимыми целями.

Эта видимость, подсчитанная и контекстуализированная, является тем, как современный SEO остаётся привязанным к реальности.

Смотрите также

2025-10-23 16:43

Время, когда мы действительно начинаем измерять релевантность, когда говорим о «Relevant Traffic».

Как человек, который разрабатывает веб-сайты и занимается SEO уже много лет, я вижу фразу ‘relevant traffic’ (релевантный трафик) упоминаемую *постоянно*. Честно говоря, это стало немного модным словом. Мы все отслеживаем такие вещи, как органические сеансы и конверсии, и предполагаем, что это означает, что наше SEO успешно, но мы редко останавливаемся, чтобы действительно *определить*, что ‘relevant’ (релевантный) вообще означает на практике. Я обнаружил, что важно углубляться глубже, чем просто эти основные цифры.

Однако, способ, которым мы обычно измеряем, была ли посещение ‘релевантным’ – просматривая, привело ли оно к окончательной покупке или лиду – не объясняет, *почему* это посещение было важным, или *как* оно помогло клиенту на этом пути.

Чтобы улучшить способы измерения успеха SEO, нам нужно переосмыслить, что на самом деле означает «релевантность», и измерять её напрямую, а не просто гадать на её основе, основываясь на том, совершают ли люди покупку или выполняют другое действие.

Как человек, который годами разрабатывает веб-сайты и ориентируется в поисковых системах, я вижу огромные изменения, происходящие с использованием ИИ. Он меняет то, как пользователи находят информацию, и, откровенно говоря, становится все труднее отслеживать, что *действительно* работает, особенно с новыми функциями ИИ от Google. Именно поэтому я переосмысливаю, как измерять успех SEO. Для меня все сводится к фокусировке на ‘релевантном трафике’ – обеспечению того, чтобы люди, попадающие на мои сайты, были искренне заинтересованы в том, что я предлагаю. Наступила новая эра, и нам нужен новый подход.

Иллюзия Актуальности

В большинстве отчётов о производительности «релевантный трафик» является сокращением для «трафика, который конвертируется».

Это определение не совсем работает, потому что оно фокусируется не на тех вещах. Современные метрики празднуют, когда кто-то совершает покупку или действие, но они не показывают, соответствовало ли контент тому, что искал пользователь. Они говорят нам, насколько хорошо что-то *продаётся*, а не насколько хорошо это *связывается* с потребностями пользователей.

Кто-то может найти статью в блоге через поисковую систему, прочитать её несколько минут, сохранить на потом, а затем вернуться через две недели, перейдя по платной рекламе, и совершить покупку. Традиционные способы измерения успеха маркетинга часто не учитывают этот первоначальный, органический визит, хотя он мог быть ключевым моментом, когда клиент понял, что ваш бренд может решить его проблему.

С Universal Analytics мы могли видеть, как различные этапы приводили к конверсии. Однако в Google Analytics 4 эти подробные отчёты о путях конверсии теперь доступны только в инструментах Рекламы.

Даже несмотря на то, что мы могли видеть, как люди становятся клиентами, мы часто упускали из виду роль органического поиска в этих конверсиях, особенно когда заслуга приписывалась исключительно последнему каналу, по которому кликнул пользователь.

Если мы измеряем успех в SEO только по продажам или прямой прибыли, мы ограничиваем его потенциал. SEO — это не только транзакции; это также крайне важно для повышения узнаваемости бренда, влияния на то, как люди понимают бренд, и завоевания их доверия.

Проблема с мышлением «последнего клика»

Несмотря на то, что известно, что это не идеально, большинство SEO-отчётов по-прежнему в основном полагаются на атрибуцию последнего клика для измерения успеха.

Эта идея продолжает распространяться не потому, что она верна, а потому, что она проста. Она поддерживает легко понятные истории, такие как: «Органические усилия принесли X количество дохода в этом месяце». Однако эта легкость понимания достигается за счет истинного понимания.

Люди больше не следуют простым, пошаговым инструкциям, когда ищут информацию. Поиск становится чем-то большим, чем просто набор текста – он развивается, включая такие вещи, как изображения и голос, изменение, которое происходит последние десять лет и сейчас ускоряется благодаря более совершенным технологиям и искусственному интеллекту.

Современные онлайн-поиски – это не просто – это часто серия шагов, разбитых и направляемых ИИ, который обобщает информацию и предлагает новые направления. Одно решение может включать множество быстрых проверок, уточнений и исследований. Опираться исключительно на окончательный клик для измерения успешности поисковых результатов вводит в заблуждение, это как судить о книге только по её последней странице.

Когда мы слишком сильно сосредотачиваемся на SEO как простом способе получения немедленных конверсий, мы теряем из виду то, что действительно заставляет людей выбирать нас: позитивный пользовательский опыт, построенный на последовательных сигналах, которые создают узнаваемость, понимание и уверенность.

Что на самом деле измеряет Релевантность.

После многих лет создания веб-сайтов я усвоил, что действительно релевантный контент – это не просто о ключевых словах. Это точка соприкосновения, где сходятся три вещи: понимание *что* пытается достичь пользователь (его намерение), обеспечение того, чтобы опыт был действительно хорошим и полезным, и гарантия того, что этот фрагмент контента вписывается в их общий путь к решению. Речь идет не только об одном взаимодействии; речь идет о том, как он помогает им по пути.

1. Согласование намерений

  • Соответствует ли контент тому, что пользователь пытался понять или достичь?
  • Решаем ли мы реальную проблему пользователя, а не просто подбираем его ключевые слова?
  • Актуальность начинается, когда контекст пользователя пересекается с компетенцией бренда.

2. Качество игрового опыта

  • Насколько хорошо контент способствует прогрессу, а не просто потреблению?
  • Изучают ли пользователи связанный контент, выполняют ли микро-взаимодействия или возвращаются позже?
  • Глубина вовлечения, поведение прокрутки и продолжение пути — это не пустые метрики; это прокси-показатели удовлетворенности.

3. Вклад в путешествие

  • Какую роль играет взаимодействие в более широкой сюжетной дуге?
  • Информировал ли он, влиял ли или успокаивал, даже если не приводил к завершению?
  • Помощь в конверсиях, повторные сеансы и метрики узнаваемости бренда могут зафиксировать это более эффективно, чем доход в одиночку.

Нам нужно начать меньше фокусироваться на простых цифрах, таких как посещения веб-сайта или продажи, и больше на том, чего пользователи фактически достигают – прогрессируют ли они, чувствуют ли уверенность в своем выборе и находят ли всю необходимую информацию.

Другими словами, от «сколько» к «как хорошо

Измерение релевантности за пределами клика.

Если мы признаем, что просто быть актуальным не автоматически ведет к прибыли, нам нужно начать измерять вещи по-новому. Вот некоторые возможности:

  • Показатели соответствия: Использование поведенческих данных (глубина прокрутки, время пребывания, вторичная навигация) для количественной оценки того, взаимодействуют ли пользователи так, как ожидается, учитывая тип намерения.
    Пример: информационные запросы, которые приводят к исследованию и добавлению в закладки, получают высокие баллы по релевантности, даже если они не приводят к немедленному результату.
  • Анализ прогресса запросов: Отслеживание того, продолжают ли пользователи уточнять свой запрос после посещения вашей страницы. Если они прекращают поиск или переходят к брендовым терминам, это свидетельствует о разрешенном намерении.
  • Сопоставление вклада сеансов: Моделирование совокупного влияния органических посещений на несколько сеансов и точек контакта. Инструменты, такие как data-driven атрибуция GA4, могут быть расширены для отображения глубины помощи, а не ценности последнего касания.
  • Сегментация по уровню опыта: Группировка трафика по цели пользователя (например, исследование, сравнение, принятие решения) и оценка результатов вовлечения по сравнению с ожидаемым поведением для этой цели.

Эти модели не заменяют стандартные бизнес-метрики; они предоставляют дополнительное понимание этих метрик. Они помогают компаниям понять не только, какой трафик приводит к немедленным продажам, но и какой трафик выстраивает отношения для будущих продаж.

Дело не в том, что SEO не должно быть сосредоточено на бизнес-результатах, а в том, что SEO сейчас более сложное, и его ценность шире, чем раньше, поэтому нам нужно переосмыслить, как мы измеряем его успех.

Почему это важно сейчас

Новые инструменты поиска на базе ИИ, такие как AI Overviews от Google, ChatGPT и Perplexity, меняют подход маркетологов к релевантности. Эти инструменты используют алгоритмы для определения наиболее важной информации, что означает, что маркетологам необходимо сосредоточиться на удовлетворении этих алгоритмов, чтобы обеспечить видимость своего контента.

Результаты поиска – это уже не просто списки ссылок. Теперь пользователи видят более разговорные, обобщенные ответы. Из-за этого контенту необходимо делать больше, чем просто занимать высокие позиции в поисковой выдаче – он должен действительно соответствовать тому, что ищут пользователи, как по смыслу, так и по опыту, чтобы быть включенным в эти новые результаты.

Следующее поколение SEO-измерений должно спрашивать:

Помогает ли этот контент пользователю принять лучшее решение быстрее? Не просто, принес ли он нам деньги?

От Performance Marketing к Performance Understanding

Переход от отслеживания доходов к отслеживанию релевантности отражает то, как маркетинг изменился в целом, эволюционируя от простого сосредоточения на результатах к истинному пониманию того, что движет этими результатами.

Традиционно маркетинг был сосредоточен на атрибуции – определении того, какие взаимодействия заслуживают признания за результаты. Однако, простого отслеживания этих точек касания недостаточно. Без более глубокого понимания это всего лишь бухгалтерия, а не реальное понимание.

Как SEO-эксперт, я всегда говорю, что понимание релевантности – это ключ к успеху. Речь идет о том, чтобы выйти за рамки простого отслеживания *что* происходит с вашими кампаниями и разобраться в *почему* это происходит. Это связывает брендовые сообщения с реальными показателями, давая вам реальные представления о том, что находит отклик у вашей аудитории и приводит к результатам. Недостаточно просто видеть, как растут цифры; вам нужно знать *почему* они выросли, и метрики релевантности помогают мне это сделать.

Этот подход рассматривает SEO как создание положительного пользовательского опыта, а не просто привлечение большего числа посетителей на веб-сайт. Он также предлагает более веское и долгосрочное обоснование для инвестиций в SEO, демонстрируя, как полезные результаты органического поиска улучшают то, что пользователи получают от бренда, укрепляя доверие и положительные эмоции – а не просто совершая быстрые продажи.

Переопределение «Релевантного Трафика» для Новой Эры Поиска

Нам следует прекратить использовать термин ‘relevant traffic’ как простой способ утверждать, что SEO работает. Истинная релевантность – это не то, что можно просто заявить – её необходимо доказывать, показывая, что пользователи добиваются прогресса и находят то, что им нужно.

Современный SEO-отчёт должен быть похож не на учётную книгу продаж, а на диагностику опыта:

  • Какие намерения мы удовлетворили лучше всего?
  • Какие форматы контента вызывают доверие?
  • Где заканчивается наша актуальность?

Только тогда мы можем с уверенностью заявить, что наш трафик действительно релевантен.

Финальная мысль

Актуальность не измеряется на странице оформления заказа. Предполагается, что сейчас пользователь чувствует, что его понимают.

Пока мы не начнем измерять это, «релевантный трафик» остается лозунгом, а не стратегией.

Смотрите также

2025-10-23 15:41

Google’s New BlockRank Democratizes Advanced Semantic Search

Недавнее исследование от Google DeepMind представляет BlockRank, новый алгоритм ИИ для ранжирования результатов поиска. Он настолько эффективен, что может сделать сложные поисковые технологии доступными каждому, а не только крупным организациям. Исследователи считают, что это ‘выровняет игровое поле’ в вопросе поиска информации.

In-Context Ranking (ICR)

Эта исследовательская работа описывает новое достижение: использование способности большой языковой модели понимать контекст для более эффективного ранжирования веб-страниц. Этот метод называется In-Context Ranking (ICR).

  1. Инструкции для задачи (например, «ранжируйте эти веб-страницы»)
  2. Кандидатские документы (страницы для ранжирования)
  3. И поисковый запрос.

В 2024 году исследователи из Google DeepMind и Google Research представили новую технику под названием ICR. Их первоначальные исследования показали, что ICR может работать так же хорошо, как традиционные поисковые системы, разработанные для информационного поиска.

Хотя это и улучшило ситуацию, это также означает, что требуется все больше и больше вычислительной мощности компьютера по мере роста количества ранжируемых веб-страниц.

Большим языковым моделям необходимо тщательно анализировать каждое слово в наборе документов, чтобы найти наиболее релевантные для поиска. Однако этот процесс становится значительно медленнее по мере увеличения количества документов, поскольку объем работы, который требуется выполнить, очень быстро растет.

Это новое исследование посвящено решению задачи повышения эффективности In-context Ranking (ICR). Исследование, под названием ‘Scalable In-context Ranking with Generative Models’, описывает метод под названием BlockRank, который позволяет эффективно масштабировать ICR.

Как разрабатывался BlockRank

Исследователи изучили, как модель фокусируется во время In-Context Retrieval и обнаружили два устойчивых поведения.

  • Разреженность междокументных блоков:
    Исследователи обнаружили, что когда модель читает группу документов, она склонна сосредотачиваться в основном на каждом документе по отдельности, вместо того чтобы сравнивать их все друг с другом. Они называют это «блочной разреженностью», что означает, что прямое сравнение между разными документами минимально. Основываясь на этом понимании, они изменили способ чтения входных данных моделью, чтобы она рассматривала каждый документ по отдельности, но при этом сравнивала их все с заданным вопросом. Это сохраняет важную часть — сопоставление документов с запросом — и пропускает ненужные сравнения между документами. Результатом является система, которая работает намного быстрее без потери точности.
  • Релевантность блока запроса-документа:
    Когда LLM читает запрос, он не рассматривает каждое слово в этом вопросе как равнозначно важное. Некоторые части вопроса, такие как конкретные ключевые слова или пунктуация, сигнализирующая о намерении, помогают модели решить, какой документ заслуживает больше внимания. Исследователи обнаружили, что внутренние паттерны внимания модели, в частности, то, как определенные слова в запросе фокусируются на конкретных документах, часто совпадают с тем, какие документы являются релевантными. Это поведение, которое они назвали «релевантность блока запроса-документа», стало тем, что исследователи могли обучить модель использовать более эффективно.

Исследовательская группа обнаружила два ключевых способа, которыми модель фокусировала своё внимание. Во-первых, они обнаружили, что модель неэффективно сравнивала документы, когда это не требовалось – закономерность, которую они назвали ‘inter-document block sparsity’. Во-вторых, они заметили, что определённые части поискового запроса часто указывали на наиболее релевантный документ – закономерность, названная ‘query-document block relevance’. Основываясь на этих выводах, они разработали новый, более эффективный подход.

Используя эти результаты, команда улучшила способность модели сосредотачиваться на важной информации и то, как она обучается. Это привело к созданию BlockRank, более быстрого и эффективного способа поиска релевантной информации за счёт устранения нерелевантных сравнений и помощи модели в расстановке приоритетов того, что имеет значение.

Оценка точности Benchmarking BlockRank

Исследователи протестировали BlockRank, чтобы оценить, насколько хорошо он ранжирует документы на трёх основных эталонных показателях:

  • BEIR
    Набор из множества различных поисковых и задач по ответам на вопросы, используемый для тестирования того, насколько хорошо система может находить и ранжировать релевантную информацию по широкому кругу тем.
  • MS MARCO
    Большой набор данных реальных поисковых запросов Bing и отрывков текста, используемый для измерения того, насколько точно система может ранжировать отрывки, которые наилучшим образом отвечают на вопрос пользователя.
  • Natural Questions (NQ)
    Эталонная задача, созданная на основе реальных поисковых запросов Google, предназначенная для проверки того, может ли система идентифицировать и ранжировать отрывки из Wikipedia, которые напрямую отвечают на эти вопросы.

Исследователи протестировали BlockRank, используя мощную языковую модель под названием Mistral, которая имеет 7 миллиардов параметров. Они сравнили её производительность с несколькими другими ведущими моделями ранжирования – FIRST, RankZephyr, RankVicuna и версией Mistral, которая была полностью дообучена для этой задачи.

BlockRank достиг результатов, равных или превосходящих другие системы во всех трех тестах. Он показал схожие результаты на MS MARCO и Natural Questions, и продемонстрировал небольшое улучшение на BEIR.

Тестирование на наборах данных MSMarco и NQ показало, что BlockRank (использующий модель Mistral-7B) работает так же хорошо, или даже лучше, чем традиционные методы тонкой настройки. Важно отметить, что он значительно быстрее и требует меньше вычислительной мощности как во время обучения, так и при использовании. Это обеспечивает практичный и эффективный способ создания систем поиска информации с использованием больших языковых моделей.

Они также отметили, что их тестирование было ограничено Mistral 7B и не включало другие большие языковые модели, что означает, что выводы применимы только к этой конкретной модели.

Использует ли Google BlockRank?

Исследование не упоминает никакого реального применения этой технологии, поэтому любые утверждения о её использовании – лишь спекуляции. Хотя понятно, почему возникает вопрос о том, как BlockRank связан с функциями, такими как AI Mode или AI Overviews, принцип работы этих функций – в частности, FastSearch и RankEmbed – значительно отличается от BlockRank. Следовательно, вероятно, он с ними не связан.

Почему BlockRank — это прорыв

Это исследование демонстрирует новую технологию, которая делает сложные системы ранжирования доступными для частных лиц и организаций, которые ранее не могли себе их позволить. Это значительный прогресс в расширении доступности высококачественных технологий ранжирования.

BlockRank улучшает способ, которым Большие Языковые Модели (LLMs) находят информацию, делая продвинутые поиски более быстрыми и эффективными. Это делает мощные инструменты поиска информации доступными для большего числа людей, потенциально ускоряя исследования, улучшая образование благодаря более быстрому доступу к релевантным материалам и помогая отдельным лицам и организациям принимать более обоснованные решения.

Поскольку эта технология более эффективна, она потребляет меньше энергии при поиске информации в приложениях больших языковых моделей. Это помогает сделать разработку и использование ИИ более экологичными.

Как SEO-эксперт, я видел много споров о том, использует ли Google это на самом деле. Честно говоря, я не нашёл никаких конкретных доказательств того, что они это делают, но было бы действительно ценно получить подтверждение непосредственно от кого-то из Google. Это то, о чём я хотел бы спросить их напрямую.

Google, похоже, готовится к выпуску BlockRank на GitHub, хотя код пока там недоступен.

Прочитайте о BlockRank здесь:
Масштабируемое контекстное ранжирование с использованием генеративных моделей

Смотрите также

2025-10-23 13:10

ИИ-помощники демонстрируют значительные проблемы в 45% новостных ответов.

Недавнее исследование, проведенное Европейским вещательным союзом (EBU) и BBC, показало, что лучшие AI-помощники давали неверные факты или некорректно обрабатывали новостную информацию почти в половине своих ответов.

Как человек, который годами создавал и отслеживал веб-сайты, я внимательно следил за развитием этих AI-чатботов. Недавно я изучил, насколько хорошо бесплатные версии ChatGPT, Copilot, Gemini и Perplexity справляются с текущими событиями. Я протестировал их, задавая вопросы, связанные с новостями, на 14 разных языках, и работал с общественными вещательными организациями из 18 стран – в общей сложности 22 организации – чтобы убедиться, что вопросы были уместными и точными.

EBU заявила в своем объявлении о результатах:

«Систематическое искажение новостей искусственным интеллектом является последовательным во всех языках и регионах.»

Что показало исследование

Мы проанализировали 2 709 основных ответа, а также изучили примеры из конкретных вопросов, чтобы получить более глубокое понимание.

Почти половина всех ответов (45%) содержала серьезную проблему, в то время как подавляющее большинство (81%) имело ту или иную проблему. Наиболее частой проблемой был поиск источников, что существенно повлияло примерно на треть ответов (31%).

Как каждый помощник выступил

Результаты различались в зависимости от используемой платформы. У Google Gemini было больше всего проблем, при этом 76% его ответов содержали значительные ошибки. Эти ошибки в основном были связаны с проблемами с источниками, что затронуло 72% ответов Gemini.

Другие ассистенты имели показатели от или ниже 37% по основным проблемам в целом и ниже 25% по проблемам с поиском источников.

Примеры Ошибок

Проблемы с точностью включали устаревшую или неверную информацию.

Недавно некоторые AI-помощники допустили ошибки: они утверждали, что Папа Франциск всё ещё жив, даже после сообщений о его смерти в апреле, и Gemini предоставил неточную информацию о правилах, касающихся одноразовых вейпов.

Методологические заметки

С 24 мая по 10 июня участники ответили на стандартный набор из 30 вопросов, а также могли ответить на вопросы, специфичные для их местоположения.

Исследование было сосредоточено на бесплатных/потребительских версиях каждого помощника, чтобы отразить типичное использование.

Многие организации изначально имели меры безопасности, которые предотвращали доступ ИИ-помощникам к их информации. Эти ограничения были временно сняты, чтобы разрешить создание контента, а затем восстановлены после этого.

Почему это важно

Это может повлиять на то, как ваши статьи отображаются в ответах, генерируемых ИИ. Поскольку ИИ иногда допускает ошибки, существует более высокая вероятность того, что он может неправильно процитировать или неточно представить информацию из вашего контента при создании резюме.

Заглядывая в будущее

EBU и BBC опубликовали набор инструментов под названием ‘News Integrity in AI Assistants‘ вместе со своим отчетом, предоставляя полезные советы технологическим компаниям, новостным организациям и тем, кто проводит исследования в этой области.

По данным Reuters, Европейский вещательный союз обеспокоен тем, что всё больше людей получают новости от цифровых помощников, что может подорвать общественное доверие к средствам массовой информации.

Как выразился директор EBU по медиа Жан Филипп Де Тендер:

Когда люди теряют веру в то, что заслуживает доверия, они часто перестают доверять чему-либо, что может оттолкнуть их от участия в демократии.

Смотрите также

2025-10-22 20:09

YouTube расширяет обнаружение подобия на все монетизированные каналы.

В течение следующих нескольких месяцев YouTube предоставит всем каналам, участвующим в YouTube Partner Program, инструмент для выявления копий голосов и внешности авторов.

Эта технология обнаруживает видео, где кто-то использовал ИИ для изменения вашего лица или создания фейковой версии вас без вашего разрешения.

YouTube объявил о расширении после тестирования инструмента с небольшой группой создателей контента.

Этот инструмент решает растущую проблему: по мере того, как ИИ становится лучше в создании контента, любому становится легче его использовать.

Как работает обнаружение сходства

Авторы могут найти этот инструмент в YouTube Studio, в частности в разделе обнаружения контента, в новом разделе ‘Подобие’.

Чтобы начать, нам нужно подтвердить вашу личность. Вы просканируете QR-код с помощью камеры своего телефона, затем загрузите фотографию своего удостоверения личности и короткое видео с вами, выполняющим простые инструкции.

YouTube обрабатывает эту информацию на серверах Google, обычно предоставляя доступ в течение нескольких дней.

После подтверждения своей личности создатели могут получить доступ к панели управления, показывающей видео, в которых появляется их лицо. На этой панели отображаются такие сведения, как название видео, дата загрузки, канал, который его загрузил, количество просмотров и количество подписчиков канала. YouTube также выделяет определенные совпадения, требующие первоначальной проверки.

Принятие мер в отношении обнаруженного контента

У вас есть три варианта при просмотре матчей.

У вас есть несколько вариантов, если вы хотите удалить видео с YouTube: вы можете запросить его удаление, основываясь на проблемах конфиденциальности, подать иск о нарушении авторских прав или просто заархивировать его. Когда вы запустите процесс удаления, инструмент автоматически включит ваше юридическое имя и адрес электронной почты.

YouTube удалит измененный или поддельный контент, если он соответствует определенным требованиям. Например, они удалят видео, созданные ИИ, которые ложно показывают, как люди поддерживают политических кандидатов, а также видео, которые используют лицо человека в рекламе, сгенерированной ИИ, без его разрешения.

Авторские права и конфиденциальность обрабатываются по-разному. В то время как видеоролик может не нарушать чью-либо конфиденциальность, используя небольшую часть их контента, он все равно может быть подвергнут претензиям по авторским правам. Использование коротких фрагментов не автоматически защищает вас от проблем с авторскими правами.

Посмотрите демонстрацию в видео ниже:

https://www.youtube.com/watch?v=zVqQiBb0F-w

Различия в политике

YouTube подчеркнул различие между политиками конфиденциальности и авторских прав.

Нарушения нашей политики конфиденциальности происходят, когда контент изменяется или искусственно создается и не соответствует нашим рекомендациям относительно таких вещей, как пародия, сатира или надлежащее раскрытие информации об использовании ИИ. Нарушение авторских прав происходит, когда оригинальный контент используется без разрешения, даже если он был изменен – например, путем обрезки видео или изменения аудио – чтобы попытаться избежать обнаружения.

Этот инструмент показывает короткие отрывки из видео создателей. Хотя эти отрывки не будут удалены по соображениям конфиденциальности, могут быть поданы претензии по авторским правам, если они не подпадают под принципы добросовестного использования.

Почему это важно

Эта новая функция позволяет авторам YouTube в Партнёрской программе решать, использовать ли и как искусственный интеллект их внешность в сгенерированном контенте.

Как вебмастер, видевший много контента в сети, я рад видеть, что платформы наконец-то борются с дипфейками. Теперь, если вы ведете монетизированный канал, вы можете следить за видео, которые ложно утверждают, что вы одобрили что-либо или сказали что-то, чего не говорили. И самое лучшее, что вы действительно можете запросить удаление этих вводящих в заблуждение дипфейков – что является огромным шагом в защите как вашей репутации, так и вашей аудитории.

Заглядывая в будущее

Эта новая функция станет доступна квалифицированным авторам в течение следующих нескольких месяцев. Если инструмент не обнаружит совпадений для вас, не волнуйтесь — это просто означает, что YouTube не обнаружил, что кто-то другой использует ваш контент без разрешения.

Вы можете прекратить использование этого инструмента и отозвать своё согласие в любое время, изменив настройки определения сходства.

Смотрите также

2025-10-22 19:09