Поиск ChatGPT показывает 76,5% ошибок в исследовании атрибуции

Как опытный веб-мастер, который уже более двух десятилетий ориентируется в постоянно меняющейся сфере цифрового контента, я видел свою долю инноваций в области искусственного интеллекта и их влияние на издательскую индустрию. Недавние выводы Центра цифровой журналистики Tow Колумбийского университета о поиске ChatGPT OpenAI вызывают, по меньшей мере, беспокойство.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Исследование, проведенное Центром цифровой журналистики Tow Колумбийского университета, показало, что функция поиска ChatGPT от OpenAI не всегда может правильно определять источники новостей.

В отчете были обнаружены частые неправильные цитаты и неверные указания, что вызвало обеспокоенность издателей по поводу видимости бренда и контроля над их контентом.

Более того, эти результаты ставят под сомнение приверженность OpenAI созданию этического ИИ в сфере журналистики.

Справочная информация о поиске ChatGPT

В прошлом месяце OpenAI представила ChatGPT Search, подчеркнув, что они тесно сотрудничали с различными новостными организациями и учли их вклад при разработке.

В отличие от первоначального выпуска ChatGPT в 2022 году, издатели обнаружили, что их контент использовался без предварительного уведомления или одобрения для обучения моделей ИИ, чего тогда не было.

В настоящее время OpenAI дает издателям возможность решать, будут ли они появляться в результатах поиска в ChatGPT, настраивая свои параметры через файл robots.txt.

Независимо от их решения участвовать или нет, исследование Tow Center показывает, что издатели потенциально могут столкнуться с проблемами из-за неправильной атрибуции и представления их контента.

Проблемы с точностью

Ключевые выводы включают в себя:

Из 200 запросов 153 ответа были неправильными.
ИИ редко признавал свои ошибки.
Фразы типа «возможно» использовались только в семи ответах.

Как эксперт по SEO, я заметил, что ChatGPT иногда ставит удовлетворенность пользователей выше фактической точности, что потенциально вводит читателей в заблуждение и подрывает доверие к издателям.

Более того, было замечено, что ответы ChatGPT могут быть непоследовательными, когда один и тот же запрос задается повторно, вероятно, из-за присущей языковой модели случайности.

Цитирование скопированного и синдицированного контента

Вероятно, это связано с ограничениями издателя или системными ограничениями.

Например, когда его попросили привести цитату из статьи New York Times (которая в настоящее время участвует в судебном процессе против OpenAI и блокировки его сканеров), ChatGPT ссылается на неавторизованную версию на другом сайте.

Несмотря на то, что MIT Technology Review предоставил доступ к веб-сканерам OpenAI, чат-бот на базе искусственного интеллекта ссылался на перепечатанную версию статьи вместо оригинальной.

Центр Tow обнаружил, что все издатели рискуют ввести в заблуждение поиск ChatGPT:

Включение сканеров не гарантирует видимости.
Блокировка сканеров не предотвращает отображение контента.

Текущие вопросы вызывают беспокойство по поводу того, как OpenAI управляет своей системой фильтрации контента и справляется с журналистскими практиками. Потенциально это может подтолкнуть пользователей к обходу поставщиков оригинального контента.

Ответ OpenAI

В ответ на отчет Tow Center OpenAI выразила готовность помочь издателям, обеспечив правильную атрибуцию и облегчив доступ пользователей к контенту посредством резюме, выдержек и ссылок.

Представитель OpenAI заявил:

Мы помогаем издателям и создателям контента, предоставляя более 250 миллионам пользователей ChatGPT еженедельно находить высококачественные материалы с помощью резюме, цитат, удобных для перехода ссылок и правильного указания авторства. Мы работали с партнерами, чтобы повысить точность текстовых цитат и уважать выбор издателей, например, то, как они отображаются в результатах поиска, управляя OAI-SearchBot в их файлах robots.txt. Мы продолжим совершенствовать результаты поиска, чтобы сделать их удобнее для пользователей.

Хотя компания прилагает усилия для повышения точности цитирования, OpenAI признает, что разрешение конкретных случаев неправильной атрибуции может оказаться сложной задачей.

OpenAI по-прежнему стремится улучшить свой поисковый продукт.

Заглядывая в будущее

Для поддержания надежного партнерства между OpenAI и новостной индустрией крайне важно, чтобы любая информация, полученная из контента издателя в поиске ChatGPT, точно отражала исходный контент.

В настоящее время издатели обладают относительно скромной степенью влияния, однако они сохраняют бдительность, следя за продолжающимися юридическими спорами, связанными с OpenAI. Результаты этих исков могут существенно изменить способ управления правами на использование контента, потенциально предоставляя издателям больший контроль над своими материалами.

Чтобы завоевать доверие пользователей, поскольку инструменты генеративного поиска, такие как ChatGPT, меняют способ взаимодействия людей с новостями, OpenAI необходимо продемонстрировать свою приверженность этическим и ответственным практикам журналистики.

Смотрите также

2024-11-30 03:08