
В моей предыдущей статье, «Наука о том, как ИИ обращает внимание», я изучил 1,2 миллиона ответов от ChatGPT, чтобы выяснить, как ИИ обрабатывает информацию на веб-странице. Эта статья является второй частью этого исследования.
Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.
Купить на падении (нет)В то время как часть 1 рассказала вам где на странице смотрит ИИ, эта часть рассказывает вам какие страницы ИИ регулярно рассматривает.
Данные проясняют:
- Почему около 30 доменов владеют 67% всех цитат по любой теме.
- Структура страницы, которая получает цитирования по более чем 50 различным запросам, против той, которая получает всего одно цитирование.
- Становится ли трамплин из первой части на самом деле круче или более пологим в твоей вертикальной плоскости?

Примерно 30 доменов владеют 67% всех цитирований по ИИ по каждой теме.
С традиционными поисковыми системами первый результат почти всегда получает подавляющее большинство внимания. Но с ChatGPT, верно ли то же самое? Склонны ли люди сосредотачиваться только на нескольких источниках, упомянутых в его ответах, или он черпает информацию из широкого спектра источников?
Подход:
- Вычислите долю цитирования по домену по вертикали.
- Рассчитайте совокупную долю, захваченную топ-10% доменов.
- Набор данных: 21 482 строки цитирования ChatGPT, 670 уникальных доменов, 2 344 уникальных URL-адреса, 127 уникальных запросов.
Результаты: Топ-10 доменов охватывают 46% всех цитирований по теме. Топ-30 — 67%.

Цитирование с помощью ИИ немного менее концентрированное, чем традиционный органический поиск, но все же экстремальное:
- Фактически, за цитационным столом для любой заданной темы есть около ~30 мест (доменов). Всё остальное практически невидимо.
Мы обнаружили, что эти результаты оставались верными при сравнении таких продуктов, как SaaS-инструменты и финансовые консультанты. Однако эта тенденция не была столь сильной в таких областях, как здравоохранение и общий веб-контент, где не было явного лидера с точки зрения онлайн-присутствия. Интересно, что сфера образования имела наибольшее количество упоминаний, связанных с AI, из всех рассмотренных нами отраслей.
Что показали отраслевые тенденции
Эти результаты получены в результате сравнения продуктов в таких областях, как программное обеспечение и финансовые консультации. Тенденция менее заметна в сфере здравоохранения и общего веб-контента, где ни один источник не выделяется. Однако она более выражена в образовании.

Образование — это игра, в которой побеждает сильнейший: топ-10% областей знаний получают 59,5% всех цитирований.
- Если вы ещё не входите в топ-5-10 доменов в образовании, достижение широты цитирования исключительно сложно.
- tefl.org в одиночку отвечает на 102 уникальных запроса и содержит 18,75% всех цитат по направлению Education.
Криптовалюта занимает второе место по концентрации – 43,0% для топ-10%.
- Небольшое количество сайтов технической документации и сравнений (alchemy.com, quicknode.com, chainstack.com) доминирует в запросах Solana RPC и инфраструктуры.
Финансы составляют 29,4% для топ-10%.
- Концентрация зависит от типа запроса: страницы поиска финансовых консультантов (forfiduciary.com с 139 уникальными запросами, smartasset.com с 168 уникальными запросами) доминируют в запросах консультантов на уровне городов.
- Но длинный хвост запросов по финансовым продуктам поддерживает умеренную концентрацию.
Здравоохранение имеет наименьшую концентрацию — 13,0% для топ-10%.
- Ни одна область не доминирует. Новым участникам открыт реалистичный путь к охвату цитирования.
- Покрытие цитирования распространяется на сотни доменов, каждый из которых охватывает небольшую часть телемедицины, соответствия требованиям HIPAA и запросов о приложениях для здравоохранения.
CRM/SaaS и HR Tech также довольно разрознены (16,1% и 14,4% в топ-10).
- Это многопродуктовые категории программного обеспечения, где десятки сравнительных сайтов, платформ обзоров и страниц поставщиков разделяют цитаты.
- Monday.com лидирует в CRM, набрав лишь 2,88% от всех упоминаний (37 уникальных запросов). Действительно открытое конкурентное поле.
Top Takeaways
Охват широкого спектра тем важнее, чем наличие популярного веб-сайта. Одна всеобъемлющая страница сравнения – как, например, на G2.com с 65 вопросами и 495 источниками – может фактически привлечь больше внимания, чем целый веб-сайт, принадлежащий известной компании. Фокус должен быть на предоставлении ответов на группу связанных вопросов, а не только на один конкретный поиск.
2. Преимущество цитирования начинается с 10 000 слов.
Традиционно, при использовании обычных поисковых систем, количество слов и длина веб-страницы могут дать вам общее представление о том, насколько хорошо она может ранжироваться, *при условии*, что контент качественный. Мне было интересно, применимо ли это к получению результатов, отображаемых в ответах ChatGPT.
Подход
- Измерьте необработанную длину текста каждой процитированной страницы.
- Разделите длину на семь сегментов.
- Для каждого бакета рассчитайте среднее количество цитирований на страницу.
Результаты: Действительно, больше слов коррелирует с большим количеством цитирований, но существует предел.

Наибольший рост цитирований происходит, когда страница увеличивается с 5 000 до 10 000 символов – влияние почти удваивается. Страницы с более чем 20 000 символов получают в среднем 10,18 цитирований, по сравнению с 2,39 цитированиями для страниц с менее чем 500 символами.
Что показали отраслевые тенденции.

В финансовых текстах количество цитат, как правило, наиболее высоко в работах объемом от 5 000 до 10 000 слов, в среднем около 10,9 цитат на страницу. Однако частота цитирования значительно снижается в более длинных работах, объемом от 10 000 до 20 000 слов, снижаясь примерно до 4,92 цитат на страницу.
- Финансы также демонстрируют наибольший абсолютный прирост: страницы объемом менее 500 слов получают всего 3,84 цитирования/страницу, в то время как страницы объемом 5 000–10 000 слов получают 10,9, что является 2,8-кратным увеличением только за счет оптимизации длины.
- Очень длинные финансовые страницы могут размыть контент, запускающий цитирование, излишними деталями.
Образование демонстрирует наиболее очевидную закономерность, где побеждает тот, кто учится дольше всего.
- Количество цитирований на странице стабильно растет от 1,85 (менее 500 слов) до 6,05 (20 000+ слов) без снижения.
Crypto и Product Analytics ведут себя аналогично Education.
- Длина последовательно окупается, достигая плато на уровне 10 000–20 000 (5,34 и 4,01 соответственно). Оба – это технические вертикали, где полнота сигнализирует об авторитете.
Как человек, который занимается разработкой веб-сайтов и отслеживанием эффективности контента на протяжении многих лет, я заметил действительно интересную тенденцию в контенте SaaS. В отличие от некоторых других тем, длина страницы SaaS не оказывает существенного влияния на количество получаемых обратных ссылок. Я видел страницы объемом от примерно 1000 до 2000 слов, получающие около 1,06 цитирований каждая, в то время как действительно длинный контент – мы говорим о 20 000 слов и более – получает около 2,77 цитирований. Таким образом, хотя более длинный контент *и* имеет тенденцию получать больше ссылок, разница не так велика, как в других нишах.
- Даже самые длинные CRM-страницы получают в среднем всего 2,77 цитирования на страницу.
- В этой вертикали, длина сама по себе не определяет цитирования. Формат, структура и авторитетность домена кажутся более важными.
Здравоохранение демонстрирует умеренный эффект длины (от 1,74 до 3,92 цитирований/страницы).
- Но с одной аномалией: 5 000–10 000 слов (2,80) показывают результаты хуже, чем 2 000–5 000 слов (3,36).
- Очень длинные страницы, посвященные здравоохранению, могут содержать слишком много клинических деталей, которые размывают контент, вызывающий цитирование.
Top Takeaways
Как правило, веб-страницы с очень малым содержанием (менее 1000 слов) показывают плохие результаты, независимо от темы. Хотя короткий контент постоянно испытывает трудности, преимущества наличия более длинных и подробных страниц варьируются в зависимости от отрасли или ниши.
Не сосредотачивайтесь на конкретном количестве слов при создании контента. Вместо этого адаптируйте длину к вашей отрасли, типу контента и тому, что ищут люди. Вот общее руководство: для финансовых тем стремитесь к статьям объемом от 5 000 до 10 000 слов. Для образования, криптовалюты и продуктовой аналитики создавайте максимально полный контент. При написании о CRM или SaaS сосредоточьтесь на четкой организации и структуре, а не на достижении определенного количества слов.
3. 58% упомянутых URL-адресов упоминаются только один раз.
При исследовании темы часто встречается, что ссылаются на несколько страниц с одного и того же веб-сайта. Это поднимает вопрос: сколько цитирований может получить одна отдельная веб-страница?
Подход
1. Подсчитайте количество уникальных запросов для каждой страницы.
- Классифицируйте количество цитирований следующим образом: 1, 2-5, 6-10, 11+.
- Изучите основные URL-адреса по вертикалям на предмет структурных шаблонов.
Результаты: В среднем, 67% указанных URL-адресов встречаются только в одном запросе.
После многих лет управления веб-сайтами я понял, что простого подсчета количества цитирований страницы недостаточно, чтобы получить полную картину. Это как отслеживание следов – высокое число просто показывает популярность. Что *действительно* важно, так это ‘широта цитирования’ – насколько широко страница появляется в различных поисковых запросах и темах. По-настоящему ценная, ‘вечнозеленая’ страница – особенно в быстро меняющейся области, как AI – не обязательно самая цитируемая, а та, которая последовательно появляется в качестве релевантного результата для различных вопросов и потребностей.

Наиболее популярные 4,8% веб-страниц – те, на которые ссылается 10 или более ссылок – обычно фокусируются на сравнении различных вариантов в рамках одной категории или объясняют, что это такое, для кого это предназначено, как это выбрать и сколько это стоит, всё на одной странице.
Что показали отраслевые тенденции.
Бассейн цитирований – это не меритократия лучших ответов, но степень этого сильно варьируется.
- CRM/SaaS имеет самый высокий процент успешных обращений с первого раза – 84,7%.
- Финансы создают страницы с самым широким охватом и актуальностью: forfiduciary.com охватывает 119 уникальных запросов.
- Крипто генерирует наиболее концентрированные вечнозеленые страницы на уровне 55.4% в техническом сегменте: chainstack.com/best-solana-rpc-providers-in-2026 (63 prompts), alchemy.com/overviews/solana-rpc (62 prompts) и rpcfast.com/blog/rpc-node-providers (61 prompts). Все три являются сравнительными страницами, охватывающими ландшафт провайдеров Solana RPC с немного разных точек зрения.
Top Takeaways
Страницы, которые постоянно актуальны, обычно следуют схожему формату: это часто руководства, охватывающие целую категорию (например, ‘Лучшие X для 2025/2026 годов’), подробно освещающие тему на одной странице (объясняя, что такое X, как его выбрать и перечисляя популярные варианты с ценами), и чётко указывают год их обновления в адресе страницы или заголовке. Поскольку они тщательно отвечают на распространенные вопросы, эти страницы, как правило, привлекают много ссылок с других веб-сайтов.
Наиболее популярные страницы по всем темам обычно представляют собой либо сравнительные статьи, углублённые руководства, либо списки/каталоги. Простые страницы, фокусирующиеся только на одной теме, не демонстрируют достаточной эффективности для высоких позиций в результатах поиска.
Тщательная, единая веб-страница, охватывающая множество различных поисковых запросов, более ценна для получения AI-цитирований, чем десять отдельных страниц, каждая из которых посвящена только одному запросу. Инвестирование в исчерпывающий контент быстро окупается: хорошо написанная страница продолжает привлекать цитирования с течением времени. Хотя существует множество нишевых поисков, небольшое количество наиболее эффективных страниц постоянно получает большинство цитирований.
4. Ски-рампа круче в некоторых вертикалях.
Исследования о том, как ИИ фокусирует своё внимание, показывают, что ChatGPT получает около 44% своей информации из наиболее важных 30% любой веб-страницы. Но сохраняется ли эта закономерность при просмотре различных типов контента?
Подход: Повторно запустить тот же позиционный анализ по 7 вертикалям с 42 460 сопоставленными цитатами.
Вот что показывают результаты: хотя закономерности различаются в зависимости от предмета, последовательным выводом является то, что нижние 10% любой страницы получают лишь около четверти цитирований по сравнению с самыми популярными разделами. Кроме того, ИИ последовательно упускает из виду заключительные разделы документов, независимо от области.

Что показали отраслевые тенденции
Наивысшая вовлечённость не возникает в самом начале. Алгоритмы ИИ на самом деле наиболее интенсивно фокусируются на контенте между 10% и 20% пути, для всех типов контента. Первоначальные 10% обычно состоят из вводных элементов, таких как навигация, заголовки и «пустышки», которые ИИ, как правило, игнорирует.
- Финансы – это крайний случай. 43,7% цитат попадают в первые 30% страницы. Страницы о финансах сразу же представляют данные о ставках, процентах и ключевых показателях. ИИ захватывает их и редко читает дальше середины страницы.
- Здравоохранение и HR-технологии имеют самые пологие кривые обучения. Полезный контент распределяется более равномерно по этим страницам.
- Обучение достигает пика на 30-40% дециле а не 10-20%, потому что образовательный контент, как правило, немного глубже прячет ключевой ответ после вступления.
Top Takeaways
Обязательно представьте свои наиболее важные выводы и подтверждающие данные в первые 30% вашего документа – это относится ко всем областям. Люди обычно не ссылаются на резюме или заключения, поэтому начинайте с основной информации.
2. Для финансовых брендов: Максимально выносите тезисы и статистику вперед.
Что это значит для построения видимости LLM
Веб-сайты, которые стабильно занимают высокие позиции в результатах поиска, достигли этого успеха не только благодаря хорошему написанию текстов. Они создали всесторонние страницы, которые тщательно освещают тему, отвечая на множество связанных вопросов в одном месте. Затем они расширили этот опыт на многочисленные подтемы, зарекомендовав себя как ведущий ресурс.
Чтобы фигурировать в качестве источника во многих ответах ИИ – в 30, 60 или даже 100 различных запросах – вам нужна контент-стратегия, ориентированная на всестороннее освещение тем. Вместо создания отдельных страниц для каждого ключевого слова, создавайте страницы, которые охватывают группы связанных вопросов и полностью исследуют целые темы. Команды, застрявшие со старым методом «одно ключевое слово на страницу», вероятно, пропустят цитирования ИИ, независимо от того, насколько хорошо написан их контент.
Однако, данные показывают, что не существует универсального подхода. Стратегии, успешные для общей CRM-платформы, могут фактически нанести вред компании в финансовой отрасли.
Методология
Мы изучили около 98 000 случаев, где упоминался ChatGPT, собранные из примерно 1,2 миллиона ответов, сгенерированных инструментом, и проанализированные Gauge.
Искусственный интеллект может давать разные результаты в зависимости от тематики. Чтобы получить точные результаты, мы проанализировали данные отдельно для семи различных, чётко определённых отраслей, предотвращая влияние какой-либо одной отрасли на общие выводы.
Проанализированные вертикали:
- B2B SaaS
- Финансы
- Здравоохранение
- Образование
- Crypto
- HR Tech
- Аналитика продукта
Чтобы реконструировать выбор цитирования, я прогнал данные через несколько слоев анализа:
- Структурный разбор: Я измерил необработанную длину символов каждой процитированной страницы и отобразил иерархии заголовков (H1, H2, H3), чтобы увидеть, как архитектура информации влияет на видимость.
- Позиционное сопоставление: Я использовал скользящее окно на основе схожести Жаккара, чтобы точно определить, откуда на странице ИИ извлек свои ответы, вплоть до конкретного дециля.
- Извлечение сущностей и тональности: Я пропустил открывающий текст уникальных цитируемых URL-адресов через Google Natural Language API для классификации именованных сущностей (даты, цены, продукты) и использовал TextBlob для оценки тональности, сравнивая производительность корпоративного контента с пользовательским контентом (UGC).
Смотрите также
- Акции PHOR. ФосАгро: прогноз акций.
- Полное руководство по вариантам таргетинга рекламы PPC
- Ошибка поиска Google: снова не индексируется и не отображается новый контент
- Волатильность рейтинга Google в поиске резко возросла после решения Министерства юстиции США о монополии
- Google: получайте определения и переводы при поиске
- Дифференциация: выделяйтесь, получайте клики
- Анализ динамики цен на криптовалюту METH: прогнозы METH
- Акции VKCO. ВК: прогноз акций.
- Акции AFKS. АФК Система: прогноз акций.
- Google представляет собственное решение для обработки данных для пользователей аналитики
2026-03-24 16:43