Граф целостности: Отсутствующий слой в вашем аудите видимости ИИ

Как человек, который долгое время занимается созданием веб-сайтов, мне было очень интересно услышать о новом аудите видимости ИИ от Common Crawl. По сути, он проверяет, могут ли системы искусственного интеллекта действительно *найти* ваш контент. Звучит просто, но это огромное дело. Подумайте об этом: если ИИ не может сканировать ваш сайт и получить к нему доступ, он не сможет ничего сделать с информацией на нем – ни резюмировать, ни давать рекомендации, ни даже правильно цитировать вашу работу. Сначала он должен *найти* его, и этот аудит поможет вам увидеть, происходит ли это.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

В течение многих лет наглядность была основой поиска. Если Google не сможет просканировать страницу, он не сможет ее ранжировать. Если система ИИ не может получить доступ к информации, она не сможет включить эту информацию в ответы, рекомендации или решения.

Однако, прочитав объявление, я поймал себя на мысли совершенно о другой проблеме.

Именно поэтому мое внимание привлек аудит видимости ИИ.

Что происходит после того, как контент обнаружен?

Этот вопрос оказался в центре внимания при рассмотрении реализаций схемы на нескольких банковских веб-сайтах. На первый взгляд большинство из них выглядели достаточно зрелыми. Сайты содержали разметку организации, объекты BankOrCreditUnion, информацию о филиалах, схему продуктов, схему услуг и многие компоненты, которые можно было бы ожидать увидеть в крупных финансовых учреждениях.

Однако когда я перестал смотреть на отдельные страницы и начал смотреть на отношения между сущностями, возникла совсем другая картина. Я обнаружил, что у большинства банков есть фундаментальная схема, но лишь немногие построили граф знаний.

Разница между описанием страницы и описанием бизнеса

Одной из повторяющихся тем в индустрии SEO является важность полноты схемы. Проверяем наличие необходимых свойств. Мы проверяем разметку с помощью инструментов Google. Мы ищем недостающие поля и возможности для расширения охвата.

Основная проблема многих из этих обзоров заключается в том, что они рассматривают страницы индивидуально. Они оценивают страницу филиала отдельно, страницу продукта отдельно и страницу услуги отдельно. Этот подход часто упускает из виду более широкую картину – действительно ли эти разные части веб-сайта хорошо работают вместе и чувствуют себя связанными.

Как эксперт по SEO, я часто вижу, как веб-сайты рассматривают различные аспекты своего бизнеса как совершенно отдельные сущности. Недавно я просмотрел веб-сайты нескольких банков и заметил, что они перечисляют такие вещи, как расположение филиала, текущие счета, ставки по ипотечным кредитам и общую структуру компании, и все это в виде отдельных элементов. Проблема? Они не соединяли эти части! Они не объясняли, *как* филиал связан с текущими счетами, которые они предлагают, или как эти счета вписываются в более широкую картину самого банка. Из-за отсутствия связи пользователям и поисковым системам сложнее понять всю ценность предложения.

  • Какому юридическому лицу принадлежал бренд, ориентированный на потребителя?
  • Какие продукты и какие услуги предлагались?
  • Какие услуги были доступны в каких филиалах?
  • Какие предложения были доступны только на определенных рынках или юрисдикциях?
  • Какие продукты принадлежали к более широкому семейству финансовых решений?

Разметка описывала отдельные части, но редко описывала сам бизнес.

Сейчас эта разница может показаться не такой уж большой, но она становится все более важной по мере того, как поисковые системы и искусственный интеллект начинают лучше понимать конкретные вещи, а не только целые веб-страницы.

Проблема с валидатором

Одной из причин проблемы может быть то, как мы проверяем структурированные данные. Большинство инструментов просматривают каждую страницу только индивидуально. Они подтверждают, содержит ли страница правильную информацию в зависимости от ее типа и соответствует ли эта информация требуемым стандартам.

Этот метод довольно хорош для создания подробной информации или проверки отдельных фактов. Однако это не работает, когда вы пытаетесь создать сеть взаимосвязанных знаний.

Распространенной проблемой при построении сложных структур данных является то, что связи между различными частями информации не всегда работают должным образом, когда вы проверяете все на одной странице.

Проблема особенно очевидна, когда компании пытаются использовать графическую систему, которую предлагает Google. Например, страница определенного филиала может ссылаться на свою основную компанию с использованием специального идентификатора, но сведения об этой компании, такие как ее адрес, юридическая информация и ссылки на социальные сети, хранятся в другом месте системы, не обязательно на самой странице этого филиала.

Это немного парадоксально: Google предлагает методы для подключения связанной информации, но те же самые методы иногда могут вызывать предупреждения от инструментов тестирования веб-сайтов. Это происходит потому, что информация связана, а не копируется на каждую страницу. По сути, компании просят создать взаимосвязанный контент, но затем оценивают, как если бы каждая страница существовала изолированно.

Раньше, когда результаты поиска фокусировались на «расширенных фрагментах», не имело большого значения, содержалось ли на одной странице достаточно информации. Но теперь, когда поисковые системы, базы знаний и искусственный интеллект пытаются понять, как связаны разные части бизнеса, это различие становится гораздо более важным.

Эволюция Google показывает реальное направление

Сегодня многие из наиболее значительных инвестиций Google сосредоточены на отношениях и контексте. График продуктов, фиды Merchant Center, данные о совместимости, взаимосвязи вариантов, сверка объектов и атрибуты диалога — все указывает в одном направлении. В совокупности эти инициативы предполагают, что понимание отношений между сущностями становится все более важным, особенно когда эти отношения трудно выводить последовательно только на основе содержания.

Постоянные усилия Google по улучшению понимания взаимосвязей между вещами позволяют предположить, что это все еще сложная проблема, даже для их передовой технологии поиска. Они бы не инвестировали в способы, позволяющие предприятиям напрямую обмениваться информацией о своих продуктах, услугах и клиентах, если бы они уже решили эту проблему.

Общие меры сканирования Видимость. Отношения определяют понимание

Это возвращает нас к Common Crawl.

Аудит видимости ИИ помогает организациям решить ключевую проблему: узнать, доступен ли их контент для систем ИИ. Если ИИ не сможет найти ваш контент, он не будет отображаться в результатах поиска, использоваться в ответах, генерируемых ИИ, или включаться в рекомендации.

Видимость имеет значение. Однако видимость и понимание — не одно и то же. Во многих отношениях Common Crawl задает тот же вопрос, который команды SEO задавали десятилетиями: могут ли машины получить доступ к контенту?

Возникающая проблема ИИ — это то, что происходит после того, как машины получают доступ к контенту. Сканер может успешно обнаружить каждую страницу веб-сайта, но при этом изо всех сил пытается понять, как соединяются основные объекты. Исторически поисковые системы пытались сделать вывод об этих взаимосвязях на основе контента, ссылок, поведения пользователей и множества других сигналов. Во многих случаях им это удавалось на удивление хорошо. Однако недавние инвестиции Google показывают, что выводы имеют пределы.

Google теперь позволяет продавцам напрямую рассказывать им о ключевых функциях своих продуктов и о том, чем они отличаются от других. Раньше Google полагался на собственный искусственный интеллект, чтобы выяснить, какие проблемы решает продукт, какие аналогичные варианты существуют и какие функции являются наиболее важными. Теперь Google просит продавцов предоставить эту информацию самостоятельно.

Причина проста. Выводы могут быть действенными, но знания из первых рук зачастую более точны.

Производители понимают, какие из их продуктов хорошо сочетаются друг с другом. Розничные торговцы отслеживают, какие товары покупатели чаще всего покупают одновременно. Банки ведут учет услуг, предлагаемых в каждом из своих отделений. А крупные международные компании знают, какие версии их продуктов лучше всего подходят для разных стран.

Хотя системы искусственного интеллекта могут попытаться реконструировать эти отношения на основе содержания, организации уже обладают ответами. Таким образом, вопрос не в том, может ли ИИ делать выводы об отношениях. Более важный вопрос заключается в том, смогут ли организации, владеющие этими отношениями, предоставить машинам надежный способ их понимания.

Готовы ли мы к агентской машине хайпа?

В последнее время в отрасли активно обсуждаются такие темы, как многосторонние вычисления (MCP), веб-MCP, возможности агентов, профили агентов, списки API, стандарты связи между приложениями и файлы конфигурации для больших языковых моделей. Большая часть этих разговоров сосредоточена вокруг идеи о том, что Интернет быстро меняется, отдавая приоритет взаимодействию с интеллектуальными агентами.

Недавнее исследование агентской готовности, проведенное Бастианом Гриммом, предлагает полезную проверку реальности. Проведя сравнительный анализ широко известных веб-сайтов в США, Великобритании и Германии, он обнаружил, что внедрение этих агентно-ориентированных стандартов остается крайне ограниченным. Подавляющее большинство сайтов не выявило ни одного из механизмов обнаружения агентов, продвигаемых в настоящее время в отрасли.

Это открытие не означает, что сеть, готовая к использованию агентов, не важна, но предполагает, что мы, возможно, забегаем вперед. Что еще более важно, даже если завтра каждый крупный веб-сайт развернет llms.txt, манифесты WebMCP и каталоги API, та же самая основная проблема останется.

Какую информацию раскрывают эти системы?

Простое обеспечение доступа к информации с помощью технологий бесполезно, если эта информация не является правильной, хорошо организованной и не дает полной картины. Если связи между такими вещами, как продукты, бренды и местоположения, не поняты должным образом, то более легкий доступ просто означает более быстрый доступ к ошибочным или неполным данным.

Уровень доступа — не самая сложная часть. Уровень отношений.

Beyond Entity Graphs: введение в Integrity Graph

Большинство дискуссий о структурированных данных сосредоточено на построении Entity Graph, чтобы помочь машинам понять компанию, продукт, местоположение и то, как они связаны друг с другом. Эти возможности важны. Однако перед системами искусственного интеллекта стоит более сложная задача. Они должны определить, какие факты применимы в каком контексте. Я считаю, что именно здесь организациям следует задуматься о том, что я называю графиком целостности.

Граф целостности выходит за рамки идентификации объекта и сохраняет контекстуальную истину.

Это помогает установить, какое юридическое лицо владеет брендом, какие продукты относятся к семейству продуктов, какие услуги доступны на конкретных рынках, какие филиалы предлагают определенные услуги, какие правила применяются в конкретных юрисдикциях и какая информация применима глобально, а не локально.

Просто знать, *кто* ваши клиенты и партнеры, уже недостаточно. Теперь предприятиям необходимо сосредоточиться на поддержании с ними прочных и заслуживающих доверия связей.

Какие организации должны проводить аудит дальше

Растущее число проверок готовности ИИ показывает, насколько быстро развивается эта область. Один из аудитов, проведенный Common Crawl, фокусируется на том, может ли ИИ легко находить информацию в Интернете и получать к ней доступ. Другой, созданный Бастианом Гриммом, проверяет, спроектированы ли веб-сайты таким образом, чтобы агенты ИИ могли с ними взаимодействовать. Тем временем Диксон Джонс и команда Waikay изучают, сможет ли ИИ правильно идентифицировать бренды, понимать, что они представляют, и связывать их с нужными продуктами и идеями.

В совокупности эти новые системы аудита показывают, что отрасль оценивает несколько различных уровней машинного понимания.

Common Crawl отдает приоритет тому, могут ли компьютеры находить и использовать контент, уделяя особое внимание тому, насколько легко машины могут получить к нему доступ.

Структуры агентной готовности исследуют, могут ли системы ИИ понять, на что они способны, и эффективно работать с другими системами.

Оценки видимости предприятий позволяют оценить, могут ли системы искусственного интеллекта правильно идентифицировать бренды, организации и связанные с ними концепции.

Целостность отношений заключается в том, могут ли машины понять, как на самом деле работает организация, а не просто управлять данными.

Каждый слой основывается на предыдущем. Контент должен быть доступен для обнаружения, прежде чем к нему можно будет получить доступ. Он должен быть доступен, прежде чем его можно будет связать с сущностью. Он должен быть связан с объектом, прежде чем машины смогут точно понять отношения, которые придают информации смысл.

Почему это важно для глобальных организаций

Когда вы рассматриваете отношения в разных культурах, необходимость в честности и надежности становится еще очевиднее.

Как цифровой маркетолог, я часто работаю с крупными глобальными компаниями, контент которых распространяется во многих странах — иногда в двадцати и более! Что удивительно сейчас, так это то, что такие инструменты, как Common Crawl, могут найти *все* это. Затем системы искусственного интеллекта смогут извлекать этот контент, а поисковые системы могут его индексировать, а это означает, что мы, по сути, решили проблему доступности нашего контента по всему миру. Это огромная победа для международной известности.

Традиционно международное SEO было направлено на то, чтобы поисковые системы отображали нужную веб-страницу нужному человеку. С появлением искусственного интеллекта фокус сместился. Теперь нам нужно помочь системам искусственного интеллекта получить точную информацию для каждой конкретной аудитории, региона и ситуации.

Крайне важно иметь четкое представление о том, какие сведения о продукте подходят для Германии, какие правила применяются в Японии и какие услуги мы предлагаем в Канаде. Связанная с этим трудность состоит в том, чтобы выяснить, как местные торговые марки связаны с нашими продуктами по всему миру, и определить, какая информация является универсальной, а какая специфичной для каждой страны. Речь идет не о проблемах с поиском или доступом к данным, а о том, чтобы сами данные были точными и последовательными.

Будущее международное SEO, вероятно, будет больше сосредоточено на том, чтобы помочь поисковым системам *понять* значение контента, а не просто направлять пользователей на правильную языковую версию страницы. Он переходит от простого показа правильной страницы к доказательству правильной *информации* поисковым системам.

Следующее конкурентное преимущество

Эта статья основана на анализе нескольких банков, который выявил ключевую проблему. Хотя эти банки располагали на своих веб-сайтах большим количеством структурированных данных и различных типов схем, у них не было четкого и унифицированного способа представления своих основных бизнес-процессов. Важно, чтобы вас было легко найти в Интернете, но для успеха недостаточно просто быть доступным для обнаружения.

После многих лет веб-разработки я понял, что простого наличия большого количества контента или даже идеального технического SEO уже недостаточно. Я думаю, что веб-сайты, которые действительно преуспеют в будущем, будут не теми, на которых *больше всего* материалов, а теми, которые ясно объяснят *как все взаимосвязано*. Речь идет не только о том, чтобы рассказать Google, что *есть*, но и показать им, как на самом деле *работает* наш бизнес — как наши продукты связаны с нашими услугами, где мы работаем и кем мы являемся как бренд. Большой вопрос сейчас заключается в том, могут ли поисковые системы на самом деле *понять* эти сложные отношения — и это то, на чем нам нужно сосредоточиться.

Это изменение может быть более значительным, чем любые конкретные технические детали, например, как структурированы данные, как подключаются приложения или даже улучшения искусственного интеллекта. Поскольку поисковые системы и искусственный интеллект совершенствуются в поиске информации, предприятия добьются успеха, сосредоточив внимание на предоставлении четкого контекста, поддержании связей между информацией и обеспечении точности и надежности своих знаний.

Знать, что это такое, недостаточно. Настоящая польза заключается в понимании того, как оно связано со всем остальным, что его окружает.

Смотрите также

2026-06-10 16:41