Почему несогласованность глобального поиска — это инженерная особенность и бизнес-ошибка

AI Overviews от Google знаменуют собой значительное изменение в работе поиска. Ранее Google сосредотачивался на поиске лучшей веб-страницы по вашему запросу. Теперь он использует ИИ для создания всестороннего и надёжного объяснения, объединяя информацию из различных источников.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Эта статья исследует, как генеративный поиск иногда может показывать результаты для неверных местоположений – распространенная проблема, которую мы называем «географическим вытеканием». В ней объясняется, почему стандартные методы исправления этой проблемы, такие как теги hreflang, плохо работают с поиском на базе искусственного интеллекта. Статья подчеркивает, как нечеткий язык и склонность ИИ к упрощению информации могут усугубить эту проблему, и представляет новый подход под названием Generative Engine Optimization (GEO), чтобы помочь компаниям добиться успеха в этой развивающейся среде.

Инженерный взгляд: особенность надежного извлечения.

1. Запрос, Разветвление и Техническая Точность

AI Overviews работают, разбивая ваш вопрос на несколько более мелких поисковых запросов. Вместо того, чтобы рассматривать только одну вещь, он исследует различные аспекты темы – например, что это значит, как это работает, какие-либо ограничения, юридические аспекты, как это используется в конкретных ситуациях и как это сравнивается с другими вещами.

2. Информационный поиск на разных языках (Cross-Language Information Retrieval (CLIR))

Современные большие языковые модели (LLM) могут понимать и работать со многими языками, не нуждаясь в прямом переводе между ними. Они преобразуют контент из разных языков в общее понимание, позволяя им генерировать ответы на основе полученной информации, а не только на том, что они видят на странице. Это означает, что язык не является препятствием, когда эти модели ищут информацию.

Семантический поиск против логики ранжирования: структурный разрыв

AI Overviews иногда показывает результаты со страниц, которые не являются лучшим соответствием для вашего местоположения, даже если существует вполне подходящая локальная страница. Это происходит потому, что способ, которым Google ранжирует результаты поиска, отличается от того, как его AI выбирает информацию для отображения.

Стандартный поиск Google работает путем поиска релевантных результатов и последующего определения, какую версию веб-страницы показывать пользователям, основываясь на таких факторах, как их местоположение, предпочтительный язык и языковые теги веб-сайта. Как только Google находит страницы, соответствующие вашему запросу, эти сигналы помогают ему выбрать наиболее подходящую региональную версию страницы.

Генеративные системы искусственного интеллекта работают, находя и используя релевантную информацию. Однако, во многих современных системах эта первоначальная информация часто упускается из виду или недооценивается, если она не соответствует тому, что ИИ считает наиболее релевантными результатами из его более широкого поиска.

Проблема векторной идентичности: когда рынки рушатся в бессмыслицу

В основе этого поведения лежит проблема векторной идентичности.

Современные системы искусственного интеллекта представляют информацию в виде списков чисел, которые улавливают смысл контента. Из-за этого, даже если у двух веб-страниц разный дизайн или они ориентированы на разную аудиторию, они могут быть распознаны как имеющие одинаковый смысл, если фактическое содержание очень похоже, и, следовательно, представлены почти идентичными числовыми значениями.

Модель рассматривает эти страницы как разные способы представления одной и той же основной информации. Такие вещи, как варианты доставки, валюта или возможность фактической покупки чего-либо, не являются частью того, что *означают* страницы; это просто дополнительные детали об адресе страницы в сети.

Свежесть как семантический мультипликатор

Поддержание информации в актуальном состоянии усугубляет эту проблему. Системы генерации с расширенным поиском часто предполагают, что более новая информация также более точна. Поскольку системы часто стандартизируют информацию на разных языках и в разных регионах, даже небольшое изменение на странице в одном месте может случайно привести к тому, что она будет ранжироваться выше, чем равноценные версии на других языках.

Даже небольшие изменения могут иметь большое значение – для этого необязательно предоставлять совершенно новую информацию. Простого перефразирования, добавления предложения для ясности или более прямого объяснения может быть достаточно. Следовательно, то, насколько свежий контент, является не просто нейтральным фактором; он фактически усиливает то, насколько сильно контент считается наилучшим результатом.

Неоднозначность как множитель силы в генеративном поиске.

Основная причина, по которой люди могут искать местные предприятия в интернете, но в итоге обращаются к другим, заключается в том, что их поисковые запросы нечеткие. Это часто упускается из виду.

Более старые методы поиска обычно определяли, что пользователи *имеют в виду*, позже в процессе – при отображении результатов. Они использовали подсказки, такие как местоположение пользователя, предпочтительный язык, тип устройства и предыдущие поиски, чтобы понять их намерения и показать релевантную информацию. Пользователи обычно ожидали, что Google поймет, что они ищут, и автоматически скорректирует результаты.

Генеративные системы поиска обрабатывают неясные запросы уникальным образом. Вместо того, чтобы сразу пытаться выяснить, что именно хочет пользователь, они расширяют поиск, чтобы учесть несколько возможных значений. Система исследует все разумные интерпретации одновременно, стремясь предоставить наиболее полный и исчерпывающий ответ.

Мы приняли это дизайнерское решение намеренно. Это помогает гарантировать, что ничего не будет упущено и делает наши ответы более надёжными. Однако это создаёт новую проблему: поскольку система сосредотачивается на тщательности, она может начать игнорировать правила о том, какую информацию следует, а какую не следует раскрывать, основываясь на местоположении или бизнес-потребностях – правила, которые мы ранее обрабатывали на более позднем этапе процесса.

Теперь, когда поиск не является однозначным, система избегает попыток угадать наилучший результат для каждого отдельного пользователя.

Почему правильный hreflang переопределяется?

Простое наличие правильно настроенных тегов hreflang не означает автоматически, что AI Overviews от Google будут показывать правильную версию вашей страницы для разных регионов. Hreflang и AI Overviews работают в отдельных частях системы Google.

Hreflang был изначально создан, чтобы помочь выбрать правильную языковую версию страницы *после* получения результатов поиска. Он работал путем замены на правильную региональную версию после того, как релевантная страница была идентифицирована. Однако, с AI Overviews, система определяет релевантность и правильную региональную версию гораздо раньше в процессе, во время первоначального поиска и сбора информации.

Мы используем только переведённую версию, если она предлагает значительно лучший и более точный ответ, чем оригинал.

Проще говоря, hreflang влияет на то, какая веб-страница *отображается* пользователям, но не на то, какая из них первоначально *найдена*. Когда дело доходит до AI Overviews, первоначальный поиск является ключевым шагом, который определяет результат.

Мандат разнообразия: Программный фактор утечек

Бизнес-перспектива: Коммерческий баг

Эти проблемы не вызваны неправильными настройками местоположения или неполными переводами. Они возникают из-за того, что система разработана для приоритета полного понимания смысла над практическими бизнес-потребностями, и эти проблемы являются естественным результатом этой разработки.

1. Коммерческая слепая зона

Если пользователи попадают на страницы, которые не соответствуют их запросам, они гораздо менее склонны достичь своей цели. Поскольку система не распознаёт эти неудачные исходы, она не учится на них и не вносит улучшения.

2. Географическая отмена сигнала

Традиционно, такие факторы, как местоположение пользователя, язык и валюта, помогали поисковым системам показывать релевантные результаты. Однако с развитием поисковых систем на базе ИИ эти сигналы теперь являются лишь предложениями. Система часто приоритизирует контент, который, по ее мнению, является наиболее семантически похожим, даже если он не соответствует исходным сигналам местоположения или языка.

3. Усиление без кликов

Процесс технического аудита генеративного поиска

Чтобы оставаться конкурентоспособными, компаниям необходимо выйти за рамки простого улучшения того, как вещи воспринимаются, и начать сосредотачиваться на Генеративном машинном обучении (GEO).

  1. Семантическое соответствие: Обеспечьте абсолютное соответствие на уровне фактических фрагментов данных на всех рынках. Незначительные асимметрии могут создать непреднамеренные преимущества при извлечении информации.
  2. Структурирование с учетом извлечения: структурируйте контент в атомарные, извлекаемые блоки, соответствующие вероятным ветвям распространения.
  3. Усиление полезного сигнала: предоставление явных, машиночитаемых индикаторов рыночной валидности и доступности для усиления ограничений, которые ИИ не может надежно вывести самостоятельно.

Заключение: Где функция становится ошибкой.

Географическая утечка не является признаком ухудшения поисковой выдачи. Она просто отражает изменение в работе поиска – переход от прямой перенаправки пользователей на конкретные веб-сайты к предоставлению более полных ответов и информации.

AI Overviews работают, как и предполагалось, с технической точки зрения. Если запрос неясен, обзор предоставит больше деталей. Система ориентирована на тщательность и предоставление информации, в которой она уверена в её актуальности.

Эта проблема затрагивает как бизнес, так и его пользователей, поскольку система относится ко всей информации как к равнозначной, не проводя различия между тем, что является правдой, и тем, что люди на самом деле считают интересным или полезным.

Как SEO-эксперт, я внимательно слежу за генеративным поиском и выявил основную проблему. То, что должно было сделать его великим – его способность предоставлять *полные* ответы – на самом деле может стать проблемой. Когда он пытается быть *слишком* всесторонним, он может упустить из виду то, что *действительно* нужно пользователю, делая опыт в целом менее полезным. Это сложный баланс!

Пока системы искусственного интеллекта не смогут надёжно доказать свою ценность и полезность в реальных ситуациях, предприятиям необходимо сосредоточиться на защите себя. В сегодняшнем ландшафте искусственного интеллекта, просто высокого рейтинга недостаточно – успех приходит от обеспечения того, чтобы наиболее точная информация была также наиболее практичной и простой в использовании.

Смотрите также

2026-01-07 17:41