
Предупреждаем перед началом: в этой статье будет немного математики! Если уравнения обычно вызывают у вас перегрузку или желание перекусить, будьте готовы (может быть, держите под рукой немного торта). Но если вы любите математику и даже втайне думаете, что k равно N, вас ждет приятный сюрприз, когда мы углубимся в гибридный поиск.
Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.
Купить на падении (нет)
Долгое время SEO следовало простой схеме: мы вносили улучшения, смотрели, где оказались наши позиции в рейтинге, и отслеживали результаты. Всё работало хорошо, потому что Google чётко показывал нам наши показатели. (На самом деле, это было *не совсем* так просто, но это общая идея.)
Искусственные интеллекты теперь работают поверх результатов поиска. Они могут быстро обобщать информацию, предоставлять источники и отвечать на вопросы напрямую, часто *до того*, как вам потребуется перейти по ссылке. Это означает, что ваш контент может быть использован, перефразирован или полностью пропущен – и вы не увидите никакой этой активности, отраженной в вашей обычной веб-аналитике.
SEO не становится неважным. Вместо этого, наряду с ним, появляется другой тип онлайн-видимости. Эта статья исследует способы отслеживания этой видимости без необходимости программировать, иметь специальные разрешения или полагаться на разработчика – помогая вам сосредоточиться на том, что вы можете уверенно измерить.
Почему это важно
Большая часть интернет-трафика по-прежнему поступает из поисковых систем. Google обрабатывает почти 4 миллиарда поисковых запросов каждый день. Хотя это и значительное число, Perplexity обрабатывает около 10 миллиардов поисковых запросов в год, что намного меньше, чем ежедневный объём Google.
Маркетологам в настоящее время не хватает централизованного места для отслеживания частоты появления их контента в новых поисковых результатах Google с поддержкой искусственного интеллекта. Google начала решать эту проблему, добавив данные о производительности для AI Mode – включая показы, клики и позиции в рейтинге – непосредственно в Search Console. Эти данные теперь интегрированы со стандартными данными поисковых результатов «Web».
Как эксперт по SEO, я внимательно слежу за трафиком, генерируемым искусственным интеллектом, и хотя он *и* включается в нашу аналитику, в настоящее время он смешан со всем остальным. Прямо сейчас мы не можем выделить его отдельно, чтобы увидеть, как искусственный интеллект конкретно влияет на производительность. Данные существуют, но все они объединены – у нас нет разбивке, показывающей, какой процент трафика поступает от искусственного интеллекта, или способа отслеживать его тенденции. Но мы работаем над этим – я ожидаю увидеть эти аналитические данные в ближайшее время!
Пока мы не сможем получить более чёткое представление о том, как всё работает, давайте используем прокси-тест, чтобы увидеть, где ИИ-помощники и результаты поиска совпадают, а где расходятся.
Две Системы Получения, Два Способа Быть Найденным
Большинство поисковых систем работают путем прямого сопоставления слов, которые вы вводите, со словами на веб-страницах. Популярный метод под названием BM25 был ключевой частью поисковой технологии, обеспечивая работу систем, таких как Elasticsearch и многих поисковых систем, которые мы используем каждый день.
ИИ-помощники не просто ищут конкретные слова; они понимают смысл. Они используют нечто под названием ’embeddings’ – по сути, математические представления текста – для сопоставления концепций. Это позволяет им находить релевантную информацию, даже если она сформулирована по-другому.
Различные методы поиска имеют разные недостатки. Поиск точных слов может пропустить связанные термины, в то время как поиск по смыслу иногда может связывать нерелевантные концепции. Однако использование обоих методов вместе приводит к более точным и всесторонним результатам.
Большинство гибридных систем поиска объединяют результаты из различных методов, используя технику, называемую Reciprocal Rank Fusion, или RRF. Вам не нужно знать, как это *сделать* на самом деле, но понимание основной идеи поможет вам понять результаты, которые мы рассмотрим позже.
RRF на простом языке
Гибридный поиск объединяет результаты из разных поисковых запросов в единый, всесторонний список. Метод, используемый для этого объединения, называется RRF.
Система подсчёта баллов проста: оценка вычисляется как 1, делённое на сумму ‘k’ и ранга предмета (выражается как 1 / (k + rank)). Если предмет появляется в нескольких списках, его оценки из каждого списка суммируются для получения общей оценки.
В данном контексте, ‘rank’ относится к позиции элемента в списке, где 1 — наивысшая. ‘k’ — это значение, используемое для уменьшения разницы в оценке между элементами в верхней части и теми, которые имеют более низкий ранг. Хотя многие системы используют значение около 60 для ‘k’, его можно настроить в соответствии с конкретными потребностями.
Векторные модели не находят результаты, просто подсчитывая, как часто встречаются слова. Вместо этого они представляют как документы, так и ваш поисковый запрос как точки в многомерном пространстве. Затем модель вычисляет, насколько похожа каждая точка документа на точку вашего запроса, и ранжирует результаты на основе этой схожести. Это создает ранжированный список, который *выглядит* как традиционный рейтинг поиска, но на самом деле основан на измерении *расстояния* между этими точками, а не просто на количестве появлений ключевых слов.

Как человек, который годами создавал и управлял веб-сайтами, я считаю, что действительно помогает иллюстрировать вещи конкретными примерами. Итак, давайте посмотрим, как работает релевантность поиска, используя небольшие числа и два разных метода ранжирования. Мы будем использовать значение ‘k’ равное 10 – то есть мы рассмотрим топ 10 результатов – чтобы упростить задачу. Один рейтинг будет основан на BM25, который фокусируется на сопоставлении ключевых слов, а другой будет использовать векторную модель, которая понимает *значение* за поисковыми терминами.
Документ A является лучшим результатом согласно системе ранжирования BM25 и третьим в списке векторного ранжирования. Его оценка BM25 рассчитывается как 1, деленное на (10 + 1), что равно 0.0909. Его оценка в векторном списке составляет 1, деленное на (10 + 3), что дает 0.0769. При объединении этих оценок, общая сумма составляет 0.1678.
Документ B является документом с самым высоким рейтингом в векторном списке и вторым в BM25. Его оценка BM25 рассчитывается как 1, делённое на (10 + 2), что равно 0.0833. Его оценка в векторном списке составляет 1, делённое на (10 + 1), что даёт 0.0909. При объединении этих оценок, общая сумма составляет 0.1742.
Как SEO-эксперт, я анализировал оценки ранжирования документов. Документ C в настоящее время занимает 3-е место на основе алгоритма BM25 и 2-е место в результатах векторного поиска. Рассчитывая взаимный ранг, BM25 дает нам 1, деленное на (10 + 3), что примерно равно 0.0769. Векторный список дает 1, деленное на (10 + 2), или около 0.0833. Сложив эти два результата, мы получаем комбинированную оценку 0.1602.
Документ B показывает лучшие общие результаты, появляясь в верхней части обоих рейтинговых списков. Увеличение значения ‘k’ до 60 уменьшает различия между списками, создавая более сбалансированную и естественную комбинацию результатов.
Просто для ясности, это упрощенный пример, чтобы помочь объяснить концепцию. Каждый поисковик и платформа социальных сетей обрабатывает свои факторы ранжирования уникальным образом, и они не публикуют точное *как* эти факторы взвешиваются. Я люблю думать об этом как о способе визуализации того, как различные сигналы объединяются для определения общих результатов – это аналогия, а не точная формула.
Где эта математика на самом деле применяется
Они все работают схожим образом: сначала они находят релевантные результаты, используя метод под названием BM25, затем находят больше, используя векторный поиск. Далее они ранжируют эти результаты с помощью RRF, и, наконец, объединяют все вместе. Уравнения, показанные здесь, призваны помочь понять идею, а не представлять точные расчеты, используемые в каждой системе.
Наблюдение за гибридным поиском в реальных условиях
Маркетологи не имеют доступа к спискам, которые Google использует внутри компании, но мы все еще можем анализировать, как результаты поиска и ответы ассистента отображаются публично. Сравнивая то, что Google показывает в поисковой выдаче, с тем, что предоставляет его ассистент, а затем ища сходства, новую информацию и частоту совпадений результатов, мы можем получить оценку того, что Google считает важным. Этот метод не совсем такой, как Google определяет рейтинги внутри компании, но он дает нам полезное приближение.
Шаг 1. Соберите Данные
Выберите 10 запросов, которые важны для вашего бизнеса.
Для каждого запроса:
- Запустите поиск в Google и скопируйте первые 10 органических URL-адресов.
- Запустите это в ассистенте, который показывает цитаты, таком как Perplexity или ChatGPT Search, и скопируйте каждый процитированный URL или домен.
Теперь у вас есть два списка для каждого запроса: Google Top 10 и Assistant Citations.
Шаг 2. Посчитайте Три Вещи
- Пересечение (I): количество URL-адресов или доменов, которые появляются в обоих списках.
- Новизна (N): количество цитат ассистента, которые не появляются в топ-10 Google.
Если у ассистента шесть цитат, и три из них пересекаются, N = 6 − 3 = 3. - Частота (F): как часто каждый домен появляется во всех 10 запросах.
Шаг 3. Преобразуйте количество в быстрые метрики.
Для каждого набора запросов:
Коэффициент общей видимости (SVR) рассчитывается путем деления количества цитирований на 10. Он показывает, как часто результаты из топ-10 поисковой выдачи Google также включаются в цитаты, используемые ассистентом.
Как веб-мастер, я обнаружил действительно полезную метрику под названием Unique Assistant Visibility Rate, или UAVR. По сути, она говорит мне, насколько оригинален ответ ассистента. Мы рассчитываем ее, деля количество *новых* фрагментов информации, предоставляемых ассистентом, на общее количество источников, на которые он ссылается для данного поиска. Более высокий UAVR означает, что ассистент лучше справляется с синтезом информации и предоставляет мне действительно уникальный контент, а не просто повторяет то, что уже существует.
Повторяемость Цитирования (RCC) рассчитывается путем суммирования частоты цитирования для домена во всех результатах поиска, а затем деления на общее количество поисковых запросов. Он показывает, как часто конкретный домен появляется в качестве источника в нескольких ответах.
Пример:
При поиске в топ-10 результатов Google, ассистент предоставил 6 цитат. Три из этих цитат были найдены в топ-10 результатов Google. Ассистент цитировал ‘I’ три раза, ‘N’ три раза и ‘example.com’ четыре раза. Это приводит к показателю перекрытия результатов поиска (SVR) 0.30, показателю уникальной проверки ассистента (UAVR) 0.50 и коэффициенту согласованности ссылок (RCC) 0.40.
Теперь у вас есть числовой снимок того, насколько близко помощники отражают или расходятся с поиском.
Шаг 4. Интерпретация
Эти оценки — всего лишь предложения, чтобы помочь вам начать, а не официальные отраслевые стандарты. Не стесняйтесь изменять их в соответствии с вашими конкретными потребностями.
- Высокий SVR (> 0.6) означает, что ваш контент соответствует обеим системам. Лексическая и семантическая релевантность синхронизированы.
- Умеренный SVR (0.3 – 0.6) с высоким RCC указывает на то, что ваши страницы семантически надежны, но требуют более четкой разметки или более сильных ссылок.
- Высокий RCC для конкурентов указывает на то, что модель неоднократно ссылается на их домены, поэтому стоит изучить это для получения подсказок по схеме или дизайну контента.
Шаг 5. Действуй.
Если ваш коэффициент видимости сайта (SVR) низок, сосредоточьтесь на том, чтобы сделать заголовки более понятными, улучшить общую читабельность и убедиться, что поисковые системы могут легко сканировать ваш сайт. Если ваш коэффициент относительного создания контента (RCC) низок, убедитесь, что информация об авторе, структурированные данные (schema) и временные метки соответствуют вашему контенту. Если ваш коэффициент неожиданной скорости появления аудитории (UAVR) высок, отслеживайте новые домены – они могут уже иметь устоявшийся авторитет в вашей отрасли.
Этот метод не гарантирует идеальную работу каждый раз. У некоторых AI-помощников есть ограничения на количество отображаемых источников, и они могут меняться в зависимости от вашего местоположения. Вы также можете увидеть разные результаты в зависимости от того, где вы находитесь и что ищете. Рассматривайте это как способ исследовать возможности, а не как строгий набор правил.
Почему эта математика важна
Этот паттерн раскрывает лежащую в основе сложную систему, которая работает – это как понимание погоды, наблюдая за тем, как качаются деревья. Вы видите результаты системы, а не саму систему.
Работа на странице, которая помогает гибридному поиску.
Как только вы увидите, как проявляются перекрытия и новизна, следующим шагом будет ужесточение структуры и ясности.
- Пишите короткими блоками аргументов и доказательств объемом 200-300 слов.
- Используйте чёткие заголовки, маркеры и стабильные якоря, чтобы BM25 мог находить точные термины.
- Добавьте структурированные данные (FAQ, HowTo, Product, TechArticle), чтобы векторы и помощники понимали контекст.
- Сохраняйте канонические URL стабильными и отмечайте время обновления контента.
- Публикуйте канонические PDF-версии для тем с высоким уровнем доверия; помощники часто ссылаются сначала на фиксированные, проверяемые форматы.
Эти шаги поддерживают как краулеров, так и LLM, поскольку они используют язык структуры.
Отчетность и исполнительное оформление
Руководители гораздо больше заинтересованы в том, насколько легко они могут увидеть результаты и насколько они могут доверять данным, чем в технических деталях, таких как алгоритмы поиска или методы представления данных.
Эти новые метрики – SVR, UAVR и RCC – покажут вам, насколько эффективны ваши текущие усилия по SEO в AI-powered поиске, и выявят возможности, где ваши конкуренты выделяются вместо вас.
Объедините эти результаты с данными о производительности из AI Mode Search Console, но имейте в виду, что в настоящее время невозможно отличить данные, сгенерированные ИИ, от стандартных веб-кликов. Поэтому любые цифры, относящиеся конкретно к ИИ, следует рассматривать как приближение, а не точное измерение. Доступность данных также может варьироваться в зависимости от вашего местоположения.
Эти ограничения не уменьшают ценность этих расчётов. Вместо этого, они гарантируют, что у нас будут разумные ожидания и предоставляют чёткий способ обсуждения аналитических данных, основанных на искусственном интеллекте, с руководителями компании.
Подводя итоги
Поисковые системы и ИИ-помощники принципиально не отличаются — дело в *том, когда* они находят информацию. Поисковые системы определяют лучшие результаты *после* того, как вы уже задали вопрос. Помощники, с другой стороны, собирают потенциальную информацию *до* того, как они даже узнают, что вы собираетесь спросить.
Расчёты в этой статье предлагают способ понять изменения без необходимости использования технических инструментов. Речь идёт не о внутренней работе платформы, а скорее об упрощённом методе для маркетологов, помогающем визуализировать происходящее за кулисами.
Как цифровой маркетолог, я видел много изменений, но некоторые вещи остаются неизменными. В конечном счете, успешный контент по-прежнему сводится к ясности, хорошей организации и установлению себя как надежного источника. Эти основные принципы никогда не выйдут из моды.
Теперь вы можете отслеживать, насколько хорошо рейтинг сайта переносится между различными поисковыми системами и поисковиками, и делать это с практическими, достижимыми целями.
Эта видимость, подсчитанная и контекстуализированная, является тем, как современный SEO остаётся привязанным к реальности.
Смотрите также
- Анализ динамики цен на криптовалюту ETH: прогнозы эфириума
- Анализ динамики цен на криптовалюту ETH: прогнозы эфириума к рублю
- Прогноз нефти
- Акции PIKK. ПИК: прогноз акций.
- Золото прогноз
- Серебро прогноз
- Анализ динамики цен на криптовалюту WLD: прогнозы WLD
- Акции SBER. Сбербанк: прогноз акций.
- План AGI от Google DeepMind: что нужно знать маркетологам
- Акции привилегированные LNZLP. Лензолото: прогноз акций привилегированных.
2025-10-23 16:43