Поиск ChatGPT показывает 76,5% ошибок в исследовании атрибуции

Как опытный веб-мастер, который уже более двух десятилетий ориентируется в постоянно меняющейся сфере цифрового контента, я видел свою долю инноваций в области искусственного интеллекта и их влияние на издательскую индустрию. Недавние выводы Центра цифровой журналистики Tow Колумбийского университета о поиске ChatGPT OpenAI вызывают, по меньшей мере, беспокойство.


Исследование, проведенное Центром цифровой журналистики Tow Колумбийского университета, показало, что функция поиска ChatGPT от OpenAI не всегда может правильно определять источники новостей.

В отчете были обнаружены частые неправильные цитаты и неверные указания, что вызвало обеспокоенность издателей по поводу видимости бренда и контроля над их контентом.

Более того, эти результаты ставят под сомнение приверженность OpenAI созданию этического ИИ в сфере журналистики.

Справочная информация о поиске ChatGPT

В прошлом месяце OpenAI представила ChatGPT Search, подчеркнув, что они тесно сотрудничали с различными новостными организациями и учли их вклад при разработке.

В отличие от первоначального выпуска ChatGPT в 2022 году, издатели обнаружили, что их контент использовался без предварительного уведомления или одобрения для обучения моделей ИИ, чего тогда не было.

В настоящее время OpenAI дает издателям возможность решать, будут ли они появляться в результатах поиска в ChatGPT, настраивая свои параметры через файл robots.txt.

Независимо от их решения участвовать или нет, исследование Tow Center показывает, что издатели потенциально могут столкнуться с проблемами из-за неправильной атрибуции и представления их контента.

Проблемы с точностью

Ключевые выводы включают в себя:

  • Из 200 запросов 153 ответа были неправильными.
  • ИИ редко признавал свои ошибки.
  • Фразы типа «возможно» использовались только в семи ответах.

Как эксперт по SEO, я заметил, что ChatGPT иногда ставит удовлетворенность пользователей выше фактической точности, что потенциально вводит читателей в заблуждение и подрывает доверие к издателям.

Более того, было замечено, что ответы ChatGPT могут быть непоследовательными, когда один и тот же запрос задается повторно, вероятно, из-за присущей языковой модели случайности.

Цитирование скопированного и синдицированного контента

Вероятно, это связано с ограничениями издателя или системными ограничениями.

Например, когда его попросили привести цитату из статьи New York Times (которая в настоящее время участвует в судебном процессе против OpenAI и блокировки его сканеров), ChatGPT ссылается на неавторизованную версию на другом сайте.

Несмотря на то, что MIT Technology Review предоставил доступ к веб-сканерам OpenAI, чат-бот на базе искусственного интеллекта ссылался на перепечатанную версию статьи вместо оригинальной.

Центр Tow обнаружил, что все издатели рискуют ввести в заблуждение поиск ChatGPT:

  • Включение сканеров не гарантирует видимости.
  • Блокировка сканеров не предотвращает отображение контента.

Текущие вопросы вызывают беспокойство по поводу того, как OpenAI управляет своей системой фильтрации контента и справляется с журналистскими практиками. Потенциально это может подтолкнуть пользователей к обходу поставщиков оригинального контента.

Ответ OpenAI

В ответ на отчет Tow Center OpenAI выразила готовность помочь издателям, обеспечив правильную атрибуцию и облегчив доступ пользователей к контенту посредством резюме, выдержек и ссылок.

Представитель OpenAI заявил:

Мы помогаем издателям и создателям контента, предоставляя более 250 миллионам пользователей ChatGPT еженедельно находить высококачественные материалы с помощью резюме, цитат, удобных для перехода ссылок и правильного указания авторства. Мы работали с партнерами, чтобы повысить точность текстовых цитат и уважать выбор издателей, например, то, как они отображаются в результатах поиска, управляя OAI-SearchBot в их файлах robots.txt. Мы продолжим совершенствовать результаты поиска, чтобы сделать их удобнее для пользователей.

Хотя компания прилагает усилия для повышения точности цитирования, OpenAI признает, что разрешение конкретных случаев неправильной атрибуции может оказаться сложной задачей.

OpenAI по-прежнему стремится улучшить свой поисковый продукт.

Заглядывая в будущее

Для поддержания надежного партнерства между OpenAI и новостной индустрией крайне важно, чтобы любая информация, полученная из контента издателя в поиске ChatGPT, точно отражала исходный контент.

В настоящее время издатели обладают относительно скромной степенью влияния, однако они сохраняют бдительность, следя за продолжающимися юридическими спорами, связанными с OpenAI. Результаты этих исков могут существенно изменить способ управления правами на использование контента, потенциально предоставляя издателям больший контроль над своими материалами.

Чтобы завоевать доверие пользователей, поскольку инструменты генеративного поиска, такие как ChatGPT, меняют способ взаимодействия людей с новостями, OpenAI необходимо продемонстрировать свою приверженность этическим и ответственным практикам журналистики.

Смотрите также

2024-11-30 03:08

Google удаляет дополнительные ссылки из окна поиска Документация

Как опытный специалист по цифровому маркетингу с более чем десятилетним опытом работы за плечами, я видел, как Google превратился из простой поисковой системы в сложную экосистему, которая формирует наш онлайн-мир. Удаление окна поиска дополнительных ссылок — это еще один шаг на этом пути, который вызывает у меня одновременно ностальгию и заинтригованность.


Google удалил руководство для окна поиска дополнительных ссылок и сохранил директиву nositelinkssearchbox, что означает, что они намерены прекратить работу этой функции в ноябре.

Еще в 2014 году Google представил инструмент, который позволял пользователям выполнять поиск, ориентированный на сайт, прямо со страниц результатов поиска, называемый окном поиска дополнительных ссылок. К сожалению, поскольку его популярность пошла на убыль, Google решил прекратить его поддержку в начале этого года.

Что меняется

Google подтвердил два изменения, связанных с документацией:

  • Полное удаление документации по окну поиска дополнительных ссылок.
  • Архивирование правила nositelinkssearchbox

Это изменение способствует выполнению миссии Google по обеспечению актуальности технических руководств, поскольку оно предполагает удаление информации, которая больше не актуальна и не точна.

Причины изменения

Первоначально Google объяснил, что они удалили окно поиска дополнительных ссылок главным образом потому, что оно больше не используется часто.

Мы используем окно поиска дополнительных ссылок в Google Поиске уже более десяти лет, но со временем его использование уменьшилось. Чтобы упростить результаты поиска и упростить навигацию по ним, мы планируем прекратить работу этой функции начиная с 21 ноября 2024 г.

Что это значит

Удаление документа означает, что вам не следует тратить больше времени на внедрение или поддержание функциональности окна поиска дополнительных ссылок на своих веб-сайтах.

Другими словами, в более раннем объявлении говорится, что дальнейшее использование текущих настроек структурированных данных не приведет к каким-либо техническим проблемам.

Начиная с 21 ноября 2024 г. мы постепенно прекращаем использование поля поиска дополнительных ссылок в результатах поиска Google, поскольку оно не получило широкого распространения. Это изменение не повлияет на рейтинг поиска или другие дополнительные ссылки. Соответствующая разметка по-прежнему будет присутствовать на вашем сайте, но не будет использоваться Google в будущем.

Чтобы гарантировать, что специалисты по SEO и администраторы сайтов поддерживают свои технические ресурсы в актуальном состоянии, эта заметка призвана побудить их удалить любые внутренние директивы или инструкции, относящиеся к функциям окна поиска дополнительных ссылок, поскольку эта конкретная функция полностью прекращена.

Смотрите также

2024-11-30 02:08

Google о предварительном уведомлении о штрафах за поиск

Как опытный специалист по цифровому маркетингу с более чем десятилетним опытом работы, я постоянно сталкиваюсь со сложностями обновлений алгоритмов Google и ручных действий. Хотя я ценю откровенность Джона Мюллера, должен признать, что его ответ заставил меня немного почесать затылок.


Джон Мюллер из Google в целом поддерживает идею информировать веб-сайты перед тем, как применять меры вручную, но признает, что это сложно сделать. Он объяснил, что алгоритм поиска Google направлен на вознаграждение подлинных сайтов, минимизируя при этом любые преимущества, предоставляемые сайтам со спамом, без прямого понижения их рейтинга. Однако его ответ, возможно, уходил от прямого ответа на вопрос.

Вопрос задал Влад Мельник на LinkedIn, который спросил:

Учитывая, насколько радикально действия, выполняемые вручную, могут повлиять на доходы и операции, какова вероятность того, что предупреждения могут быть реализованы в будущем, прежде чем действие будет выполнено или выполнено?

Не кажется чрезмерным требованием предоставить неделю времени на решение проблем, прежде чем полностью удалить домен со страниц результатов поисковых систем (SERP), учитывая потенциальное влияние, возможно, на гораздо большее количество людей, чем просто на несколько десятков человек, работающих там.

В отличие от того момента, когда это было первоначально реализовано, когда Google предоставил двухмесячное предупреждение, прежде чем ввести в действие политику злоупотребления репутацией, они не сделали никакого предварительного предупреждения о своем недавнем расширении. Вызывает недоумение, почему Google решил не предоставлять уведомление об этом обновлении политики.

Джон Мюллер из Google ответил на вопрос Влада Мельника, сказав:

Это хороший и сложный вопрос. В целом я за, но это сложно… Если мы делаем это для улучшения качества результатов поиска (цель не в том, чтобы наказать сайты, а в том, чтобы улучшить результаты), то было бы странно намеренно оставить результаты плохие в течение недели. Кроме того, часто мы надеемся нейтрализовать проблему (например, для ссылок: игнорировать плохие ссылки в наших системах), поэтому редко бывает так, что исправление проблемы (например, удаление плохих ссылок, которые искусственно повлияли на сайт) приведет к тому, что сайт останется на том же месте в поиске.

Позже Джон упомянул: «Однако я абсолютно восприимчив к идеям! Возможно, есть компромисс, который мог бы эффективно послужить нам всем.

Похоже, Джон ответил на вопрос так, как будто речь шла об алгоритмах, а не о ручных действиях. Однако я не уверен; возможно, есть шанс, что я неправильно это истолковываю.

Один из примеров, приведенный Джоном Мюллером, заключается в том, что с запуском Penguin 4.0 вместо того, чтобы наказывать или понижать рейтинг веб-сайтов с некачественными ссылками, он просто перестал учитывать эти некачественные ссылки при расчете рейтинга.

Но я не думаю, что ручные действия работают таким образом, по крайней мере, для большинства. Как и штраф за злоупотребление репутацией сайта, эти страницы полностью удаляются из индекса.

Тем не менее, я нашел весьма удивительным, что Google не уведомил за месяц или два, прежде чем пересмотреть свою политику в отношении спама, нарушающего репутацию сайта, включив в него участие третьих лиц или контроль над контентом. Изменение было значительным и сильно повлияло на многих издателей. По сути, это изменение требовало от издателей либо удалить затронутый контент самостоятельно, либо рискнуть удалить его Google в будущем. Если бы было предупреждение, эти компании могли бы за это время договориться о любых невыполненных соглашениях со своими сторонними партнерами.

Смотрите также

2024-11-29 16:44

Обновлены правила Google Business Profiles: витрины необходимы для товаров минимального возраста

Как опытный эксперт по SEO с более чем двадцатилетним опытом работы в постоянно меняющейся среде Google, я могу с уверенностью сказать, что это последнее обновление рекомендаций Google Business Profiles является еще одним напоминанием о том, насколько важно для бизнеса оставаться в курсе событий и адаптироваться.


Рекомендации Google по профилям компаний в Google были пересмотрены: в них говорится, что заведения, предлагающие товары или услуги, для клиентов которых требуется определенный минимальный возраст, не могут функционировать как предприятия в зоне обслуживания без физического местонахождения.

Гугл написал:

Компании, связанные с продуктами или услугами, требующими достижения клиентом определенного минимального возраста, например алкоголь, каннабис или оружие, не допускаются в качестве предприятий в зоне обслуживания без витрины.

Стефан Сомборак, внимательно следящий за местными правилами, заметил кое-что в среду и поделился на X: «Google использует термин «Бизнес, связанный с…» вместо «Бизнес, продающий…». Это тонкое различие расширяет потенциальный масштаб этого понятия. недавнее обновление.

Эти товары требуют наличия физического местоположения для бизнеса, позволяющего клиентам просматривать и покупать товары лично. Кроме того, крайне важно, чтобы сотрудники проверяли возраст клиента, прежде чем продавать товары или услуги, имеющие возрастные ограничения.

Интересно, включает ли это также сигареты? Думаю, да.

Вот скриншот добавления руководящих принципов — добавлен желтый цвет:

Google ввел новое требование в свои рекомендации по профилю бизнеса: предприятия, предлагающие товары или услуги, для которых требуется минимальный возраст (например, алкоголь и каннабис), теперь обязаны иметь физический магазин.

» Стефан Сомборак (@ Стефан Сомборак (@) СтефанСомборац) 27 ноября 2024 г.

Это новое постановление касается широко распространенных несанкционированных операций по доставке каннабиса на территории Онтарио.

» Стефан Сомборак (@StefanSomborac), 27 ноября 2024 г.

Смотрите также

2024-11-29 16:44

Google Maps добавляет отчет о деловом поведении к манипулированию обзором отчета

Как опытный веб-мастер с более чем двадцатилетним стажем работы, я видел, как цифровой ландшафт развивается с головокружительной скоростью. Последний шаг Google по введению формы отчета о деловом поведении в Google Maps — это столь необходимый шаг в правильном направлении.


Google представила в Картах Google новый механизм отчетности, позволяющий пользователям подавать жалобы на компании, занимающиеся подозрительной практикой проверки. Эта форма специально предназначена для пометки компаний, которые поощряют отзывы или заставляют людей их писать.

Шоичи Хасегава недавно рассказал мне о новом событии, которое, по его словам, произошло на X. Его сообщение гласило: «Я сообщил о проблеме, связанной с функцией Google Maps «Сообщить о деловом поведении».

Форму можно найти там, согласно записям Wayback Machine, она была загружена всего две недели назад.

Вот скриншот формы в ее сегодняшнем виде:

Я думаю, Google хочет расправиться с таким поведением…

Смотрите также

2024-11-29 16:44