Perplexity отвечает на иск Reddit о доступе к данным.

Reddit подает в суд на Perplexity и три компании, занимающиеся сбором данных, утверждая, что они незаконно получили доступ и скопировали большое количество контента с Reddit. Иск, поданный в федеральный суд в Нью-Йорке, утверждает, что компании обошли меры безопасности Reddit, даже собирая информацию из результатов поиска Google для этого.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Perplexity публично заявила, что создает сводки обсуждений на Reddit, предоставляя источники своей информации, и что она не использует данные Reddit для обучения своего ИИ.

Эта позиция соответствует тому, что компания заявляла ранее. Пока неясно, является ли это прямым ответом на утверждения, содержащиеся в юридических документах Reddit.

Иск идентифицирует Oxylabs UAB, AWMProxy и SerpApi как вовлеченные компании. В нем утверждается, что Perplexity является клиентом SerpApi и использовал услуги SerpApi для обхода ограничений и сбора данных с Reddit.

Доказательства в жалобе

Perplexity делает ключевой технический момент: он не обучает свой ИИ напрямую на постах Reddit. Вместо этого он работает, суммируя и ссылаясь на существующие обсуждения.

Perplexity написала в своем ответе на Reddit:

Мы собираем информацию из обсуждений на Reddit и включаем ссылки на эти обсуждения в наши ответы, подобно тому, как люди делятся ссылками на статьи и посты в интернете.

Однако жалоба содержит технические утверждения, которые ставят эту структуру под сомнение.

Reddit тайно создал тестовую публикацию, предназначенную только для поисковой системы Google, и она не была общедоступна в интернете. Удивительно, но Perplexity обнаружил и включил этот скрытый контент в свои результаты поиска всего за несколько часов.

Согласно поданным документам, Perplexity начала ссылаться на Reddit гораздо чаще – примерно в сорок раз больше – после того, как Reddit направила юридическое уведомление с требованием прекратить это делать.

Схожие Обвинения От Издателей

Forbes ранее обвинил Perplexity в перепубликации эксклюзивного материала и пригрозил судебными исками.

Согласно Wired, Perplexity обошел ограничения веб-сайтов, используя скрытые IP-адреса и маскируя свою личность как обычного пользователя. В частности, они проигнорировали инструкции в файлах robots.txt, которые указывают поисковым системам, какие части веб-сайта не следует сканировать.

Cloudflare сообщила, что Perplexity использовала скрытых веб-краулеров в августе, которые игнорировали инструкции не сканировать их сайты.

Как Perplexity отреагировал.

Нам уже ранее высказывали опасения по поводу того, как Perplexity представляет информацию. В прошлом мы объясняли это как неизбежные трудности роста – вещи, происходящие по мере запуска новых функций. Мы взяли на себя обязательство чётко показывать, откуда берется наша информация, чтобы пользователи всегда могли проверить источник.

Компания также утверждает, что определенные новостные издания пытаются диктовать, какие факты представляются общественности.

Итак, я слежу за судебным иском Reddit против Perplexity, и, судя по всему, речь идет не столько о прямом юридическом противостоянии, сколько о попытке Reddit получить более выгодные условия использования своих данных для обучения ИИ. По сути, они используют иск как способ переговоров об условиях для всех, кто использует данные, собранные с их платформы. Это силовая операция в гораздо более широком разговоре о добросовестном использовании и правах на данные в мире ИИ.

«Мы подводим итоги обсуждений на Reddit… Мы не позволим себя шантажировать и не будем помогать Reddit шантажировать Google.»

Почему это важно

Это важно, потому что это влияет на то, как ИИ-помощники используют информацию из онлайн-форумов – мест, где люди читают контент, а издатели часто получают свои факты.

Правовые вопросы выходят за рамки простого обучения.

Суды могут рассмотреть, были ли обойдены меры безопасности, нарушает ли создание резюме авторские права и могут ли инструменты сбора данных из внешних источников создать юридические проблемы для продуктов, которые полагаются на эти данные.

Если суды согласятся с позицией Reddit по поводу избежания обходных путей, это может изменить способ, которым AI-помощники отображают или подключаются к обсуждениям на Reddit.

Однако, если суды примут сторону Perplexity, AI-помощники могут все чаще получать информацию из менее регулируемых онлайн-форумов и дискуссий.

Что мы пока не знаем

Иск утверждает, что Perplexity собирала информацию, используя как минимум одну компанию, которая собирает данные с веб-сайтов, но не называет конкретную компанию и не предоставляет подробностей о транзакциях.

Смотрите также

2025-10-24 08:39