Бюро авторского права США предупреждает о юридических рисках на каждом этапе создания генеративного искусственного интеллекта.

Проект отчета о использовании защищенного авторским правом контента для обучения искусственного интеллекта созданию нового материала был опубликован Бюро авторского права США. В этом документе представлены юридические аргументы и фактический анализ, подчеркивающие потенциальные проблемы с авторскими правами на всех этапах развития искусственного интеллекта, использующего технологии генерации.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Документ был подготовлен в ответ на опасения общественности и конгресса по поводу использования системами искусственного интеллекта материала под авторским правом, включая пиратские версии, без предварительного согласия. Хотя Управление авторского права не принимает судебных решений, его отчеты предоставляют юридическую и техническую консультацию, способную влиять на законодательство и судебные решения.

Отчет предлагает четыре причины, по которым компании-разработчики технологий искусственного интеллекта должны быть обеспокоены.

В докладе утверждается, что многие случаи приобретения данных (data acquisition) — процесса создания датасетов из работ, защищенных авторским правом, и обучения могли бы «представлять собой явное нарушение» (prima facie infringement).
Это бросает вызов общепринятому мнению индустрии о том, что обучение моделей не включает ‘копирование’, отмечая, что процесс создания датасетов предполагает создание множества копий и что улучшения в весах модели могут также содержать копии этих произведений. В отчете приводятся сообщения о случаях, когда искусственный интеллект воспроизводит защищенные авторским правом произведения либо слово в слово, либо почти идентичными копиями.
В документе говорится о том, что процесс обучения подразумевает право на воспроизведение — одно из исключительных прав, предоставляемых авторам. Подчеркивается, что запоминание и повторение защищенного авторским правом контента моделями может считаться нарушением авторских прав, даже если это произошло ненамеренно.
Преобразующее использование, где оно придает новый смысл оригинальному произведению, является важным фактором при анализе добросовестного использования. В отчете признается, что ‘некоторые виды использования защищенных авторским правом произведений в обучении ИИ могут быть преобразующими’, но он выражает несогласие с аргументом о том, что обучение ИИ является преобразующим просто потому, что напоминает ‘человеческое обучение’ — как, например, когда человек читает книгу и извлекает из нее уроки.

https://www.searchenginejournal.com/wp-json/sscats/v2/tk/Middle_Post_Text

Последствия авторского права на каждом этапе развития искусственного интеллекта

Особенно тревожащим аспектом отчета является обнаружение потенциальных проблем с авторскими правами на всех этапах разработки искусственного интеллекта, подробно описывая каждую фазу и связанные риски.

A. Сбор и обработка данных Процесс создания обучающего набора данных с материалами, защищенными авторским правом, похоже, включает акт репликации, что сильно указывает на то, что осуществляется право на копирование… B. Обучение Процедура обучения также предполагает право на репликацию данных. Изначально из-за потребности в быстром и крупномасштабном обучении разработчики должны скачать набор данных и перенести его на высокоскоростное хранилище перед началом обучения. Впоследствии во время фазы обучения значительные части или работы из набора данных временно дублируются, когда они представляются модели порциями. Дубликаты могут сохраняться в течение времени, что потенциально нарушает право на копирование репликации с учетом типа вовлеченной модели и конкретных программных и аппаратных решений, используемых создателями. 3-й пункт: Во время этапа обучения, включающего предоставление обучающих выборок, оценку выхода модели против ожидаемых результатов и постоянное корректирование весов для лучшего выполнения, возможно включение элементов тренировочных данных в веса модели. Если это происходит, то репликацию этих весов, даже организациями не прямо вовлеченными в процесс обучения, можно рассматривать как предварительное нарушение (primafacie infringement). C. RA G D. Выходные данные Генеративные системы искусственного интеллекта иногда могут создавать контент, поразительно похожий на материалы, защищенные авторским правом, такие как изображения из фильмов, уникальные персонажи или текст новостных статей. Это потенциально может нарушить права воспроизведения и создания производных работ, если речь идет об адаптации оригинальных произведений.

Исследование выявляет потенциальные юридические проблемы на каждом этапе создания генеративной технологии ИИ, хотя его заключения не имеют силы закона. Тем не менее эти выводы могут быть использованы при разработке новых законов и установлении судебных прецедентов.

Итоги

Обучение ИИ и нарушение авторских прав:
B докладе утверждается, что как сбор данных, так и обучение моделей могут включать несанкционированное копирование, возможно составляя «прима фации» (доказательство prima facie) нарушения авторских прав.
Отказ от защиты индустрии: Ведомство по авторским правам оспаривает общие заявления отрасли искусственного интеллекта о том, что обучение не предполагает копирование и что процесс обучения ИИ аналогичен человеческому обучению.
Справедливое использование и преобразующее использование: отчет выражает несогласие с широким применением преобразующего использования в качестве защиты, особенно когда это основано на сравнениях с человеческим познанием.
Обеспокоенность всеми этапами развития ИИ:
Защита авторских прав вызывает беспокойство на каждом этапе разработки ИИ, включая сбор данных, обучение, генерацию с усилением поиска (RAG) и выходные данные модели.
Запоминание и веса модели: Офисное предупреждение гласит, что модели искусственного интеллекта могут сохранять авторское право на контент в своих весах, поэтому даже использование или распространение этих весов может нарушать авторские права.
Возможность ИИ генерировать почти идентичные выходы (например, кадры из фильмов, персонажей или статьи) вызывает опасения относительно нарушений прав на воспроизведение и создание производных работ.

В отчёте Бюро авторского права США освещены несколько случаев, когда разработка генеративных AI может нарушать закон об авторском праве. Это происходит из-за того, что использование защищенных авторским правом материалов без разрешения вызывает вопросы на каждом техническом этапе, начиная от сбора данных для обучения и заканчивая созданием выходных данных модели. Отчёт отклоняет утверждение о том, что процесс обучения ИИ аналогичен человеческому обучению, как защиту, и критикует широко распространенное в индустрии применение добросовестного использования. Хотя этот отчет не является юридически обязательным, он может служить полезным руководством для законодателей и судей.

Смотрите также

2025-05-13 01:48