Новые судебные документы: взаимодействие пользователей с поиском Google, данные пользователей и данные Chrome.

После недавнего судебного решения, касающегося предполагаемой монополии Google, наблюдается приток судебных документов, предоставляющих дополнительные сведения об обработке Google действий пользователей, личных данных, деталей, связанных с Chrome, и других аспектах.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Помимо обсуждения ранее представленных документов Министерства юстиции и значительной утечки данных Google, на которую был получен ответ, вчера мы углубились в функцию FastSearch от Google, связанную с Gemini. Сегодня мы продолжили обсуждение различных аспектов поискового индекса Google, включая оценку спама, PageRank, качество страниц, Glue и другие соответствующие темы.

Как специалист по SEO, я развил результаты исследований Мари Хейнс, углубившись еще больше, чтобы обнаружить дополнительные ссылки, подтверждающие наш анализ.

Важно отметить, что в судебных записях содержатся эти конкретные заявления, но их использование в поиске Google сегодня не гарантируется, и следует отметить, что эти заявления могли быть сделаны людьми, которые в настоящее время не связаны с Google.

Данные пользователя

Упоминания ‘данных пользователей’ в представленном PDF-документе:

Данные пользователей определяют, какие веб-сайты Google сканирует и как часто. Мари Хейнс (@Marie_Haynes) 3 сентября 2025 г.

Вот еще упоминания:

Страница 87:
Google использует данные пользователей «на каждом этапе поискового процесса», от сканирования и индексации до извлечения и ранжирования. Данные пользователей также помогают Google понять, какая реклама привлекает внимание пользователей, что позволяет ему лучше оценивать качество рекламы и показывать более релевантную рекламу в будущем. (установив, что данные сессий пользователей «помогают адаптировать рекламу, которую Google показывает [им]»). Эти улучшения качества поиска и монетизации рекламы в конечном итоге приводят к увеличению доходов, поскольку превосходные результаты поиска привлекают дополнительных пользователей, а более таргетированная реклама генерирует больше кликов.

Страницы 87-88:

(1) Больше пользовательских данных позволяет поисковой системе улучшить качество поиска, (2) улучшенное качество поиска привлекает больше пользователей и повышает монетизацию, (3) больше пользователей и лучшая монетизация привлекают больше рекламодателей, (4) больше рекламодателей означает более высокий доход от рекламы, и (5) более высокий доход от рекламы позволяет поисковой системе тратить больше ресурсов на затраты на привлечение трафика (т.е. выплаты доли доходов) и инвестиции, что обеспечивает дальнейшее расширение масштаба.

Страницы 93-94:

Компания Google интегрирует данные пользователей на каждом этапе поискового процесса. Как ясно показали выводы суда на этапе определения ответственности, обширный сбор данных пользователей компанией Google не пылился на серверах компании в течение последнего десятилетия. Напротив, компания Google постоянно использовала данные пользователей, среди прочего, для определения того, какие веб-сайты сканировать, в каком порядке и с какой частотой; для построения и организации своего поискового индекса, чтобы обеспечить охват широкого спектра тем и источников (и, следовательно, разнообразия запросов); для повышения «свежести» результатов (то есть их актуализации); для создания сигналов и моделей, которые оценивают релевантность результатов и определяют их рейтинг; и для проведения масштабных экспериментов по разработке новых функций. Компания Google (отмечая, что запросы, отправленные с мобильных устройств, как правило, имеют «более локализованные намерения», чем запросы с настольных компьютеров, и, следовательно, «один из сигналов, который учитывается в Поиске Google, это… это запрос с настольного компьютера или с мобильного устройства»); («Google продолжает поддерживать значительные объемы данных», несмотря на дороговизну их хранения, потому что их ценность перевешивает эту стоимость»). По словам одного из представителей Google, «Поиск может казаться волшебством… Но на самом деле все дело в создании сигналов… для определения намерения пользователя и сопоставления его с релевантными документами». Поскольку знания, полученные из данных пользователей, предоставляют «сильный показатель намерения пользователя», такие данные являются «важным вкладом» для GSE, включая Google.

На странице 129: Google использовал этот дополнительный объём запросов с пользой. Компания ‘применила пользовательские данные для, среди прочего, обхода дополнительных веб-сайтов, расширения индекса, повторной ранжировки поисковой выдачи и улучшения ‘свежести’ результатов (то есть, обновления их до актуального состояния)’.

Однако, Граф знаний не извлекается напрямую из пользовательских данных. Его базовые данные поступают из множества источников и конвейеров, в том числе от третьих лиц.

Страница 152:

Простыми словами, Данные на стороне пользователя – это данные, которые Google собирает при сопоставлении запроса пользователя и возвращенного ответа. Их также можно рассматривать как данные о взаимодействии пользователя или данные «клики и запросы». Примеры таких данных включают веб-ссылку или вертикальную информацию, на которую нажимает пользователь, как долго пользователь наводит курсор на ссылку, и возвращается ли пользователь с веб-страницы и как быстро. Данные о взаимодействии с пользователем – это сырье, которое Google использует для улучшения поисковых сервисов. (‘На каждом этапе поискового процесса данные пользователей являются критически важным входом, который напрямую улучшает [качество] поиска.’)(описывая ‘передачу кликов и других вещей’ в алгоритмы для улучшения результатов поиска).

Страница 157:

Вспомните, Google обучает Navboost на 13 месяцах пользовательских данных, что эквивалентно более чем 17 годам данных, полученных Bing. (объяснение, что обучение на 13 месяцах пользовательских данных означает «запросы и клики», собранные от «всех пользователей» по всему миру); UPX0005 на -811 («Кэш склеивания (13 месяцев)»).

Взаимодействия пользователей

Упоминания о ‘взаимодействиях пользователей’ в правящем PDF-документе:

Google учится и совершенствуется, изучая взаимодействие пользователей с их платформой, что можно перефразировать как: ‘Каждое взаимодействие с пользователем служит возможностью для обучения, предоставляя Google дополнительные примеры или обучающие данные.’ Мари Хейнс (@Marie_Haynes) 3 сентября 2025 года

Обмен набором данных, лежащим в основе статистических моделей Glue, с другой стороны, представляет собой более весомый аргумент в пользу включения в окончательное решение. Снова, данные, о которых идет речь, представляют собой в основном необработанные данные о взаимодействии пользователей, которые связывают запросы и результаты с действиями пользователей, такими как клики, наведения и другие аспекты пути пользователя на и с поисковой выдачи. Это основа масштабного преимущества компании Google.

Данные Chrome

Упоминания ‘данных Chrome’ в судебном PDF-документе:

Как опытный вебмастер, я заметил, что документ не углубляется в детали, но, кажется, что два ключевых фактора влияют на ранжирование в Chrome: частота посещений пользователей (часто называемая ‘данными о посещениях Chrome’) и количество внешних ссылок, указывающих на сайт, также известных как ‘якоря’. Однако, дальнейшее обсуждение этой темы, несомненно, выявило бы больше полезной информации. ð¤ Мари Хейнс (@Marie_Haynes) 3 сентября 2025 г.

Страницы 143-144: Два представленных доказательства указывают на то, что популярность основывается на ‘данных посещений Chrome’ и ‘количестве ссылок’, что является показателем, количественно определяющим количество связей между страницами и используемым для продвижения хорошо связанных документов. (сигнал популярности (P*) ‘использует данные Chrome’). Первое, по-видимому, является типом данных о взаимодействии с пользователями, хотя и из посещений Chrome, а не через ключевые стандартные каналы распространения, но суд не может сказать больше, поскольку истцы не предоставили никаких показаний по этому вопросу. Суд не будет принуждать к обмену данными, основываясь на неопределенной информации.

Что ты можешь извлечь из этого?

Смотрите также

2025-09-04 16:20