
Генеральный директор Reddit, Стив Хаффман, считает, что большие языковые модели не достигли бы такого уровня развития, как сегодня, без огромного количества контента, созданного пользователями Reddit. Он описал эти пользовательские данные как важнейший ресурс для искусственного интеллекта, сравнив их с нефтью в современную эпоху.
Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.
Купить на падении (нет)Хаффман сделал эти комментарии во время интервью на саммите Fast Company’s Most Innovative Companies Summit.
Что Хаффман сказал о ценности Reddit для ИИ
Хаффман описал позицию, которую данные Reddit занимают в экосистеме ИИ.
Хьюфман сказал:
Он приписал утверждение о цитировании компании Profound, которая отслеживает данные о цитировании ИИ.
Хаффман объяснил, почему AI компании зависят от контента.
Истинный искусственный интеллект требует подлинного разума. В конечном счете, эти модели ИИ довольно базовые – они просто повторяют информацию, которую они получили из других источников, но в огромном масштабе. Значительная часть этого обучения происходит из естественных человеческих разговоров на Reddit, который охватывает практически любую тему, о которой вы можете подумать.
Сделки для одних, судебные иски для других.
В 2024 году Reddit заключил партнерство с Google и OpenAI для лицензирования своих данных для использования в искусственном интеллекте. По словам генерального директора Reddit Стива Хаффмана, это были первые и единственные соглашения о данных ИИ, объявленные на сегодняшний день.
Прошло более двух лет с тех пор, как мы впервые сотрудничали с Google и OpenAI, и многое изменилось с тех пор – для нас, для них и для всех в отрасли. Мы все получили гораздо лучшее понимание того, насколько ценными и полезными являются данные Reddit. По этой причине мы действуем очень осторожно и тщательно выбираем наших партнеров, но мы определенно открыты для новых деловых возможностей.
Reddit подает в суд на несколько компаний за использование его контента без разрешения. Они подали иск в Калифорнии против Anthropic, утверждая о несанкционированном использовании и нарушении правил Reddit. Кроме того, Reddit предпринял юридические действия в федеральном суде Нью-Йорка против Perplexity и трех компаний, собирающих данные, обвиняя их в нарушении законов об авторском праве и обходе мер безопасности.
Хаффман провёл черту между двумя группами.
Мы смогли достичь соглашений с такими компаниями, как Google и OpenAI, с которыми у нас уже были прочные отношения. Эти соглашения позволяют нам установить чёткие правила относительно того, как они используют и получают доступ к данным наших пользователей, а также позволяют нам работать вместе над созданием следующего поколения интернет-продуктов.
Он объяснил, что поскольку некоторые компании не желают с ними сотрудничать, им, к сожалению, приходится прибегать к юридическим действиям.
Хаффман объяснил, что правило Reddit об использовании его данных для бизнеса довольно простое: если вы используете данные Reddit для получения прибыли, вам необходимо согласиться с коммерческими условиями. Reddit начал взимать плату за коммерческий доступ к своему API в 2023 году, что произошло до недавних лицензионных соглашений.
Reddit продолжает предлагать исследователям и университетам бесплатный доступ к данным и стремится быть лояльным к некоммерческим проектам, по словам Хаффмана.
Что изменилось в открытости Reddit?
Хьюфман объясняет, что Reddit раньше свободно делился своими данными, но прекратил это делать, когда область искусственного интеллекта отошла от открытых исследований. Как отметило Search Engine Journal ранее, Reddit ограничил доступ к данным для большинства поисковых ботов, при этом Google являлось основным исключением.
Хаффман объяснил, что Reddit потерял возможность отслеживать, как используются его данные. ‘Мы не знаем, для чего люди используют наши данные’, — сказал он.
Помимо деловой стороны вопроса, Reddit объяснил, что они хотят прекратить использование своих данных для определения того, кто люди, показа им персонализированной рекламы или создания конкурирующего сервиса, который обходит Reddit полностью.
Собственные усилия Reddit в области ИИ
Хаффман отметил некоторое противоречие: контент Reddit используется для обучения моделей ИИ, разрабатываемых другими компаниями, в то время как сам Reddit также полагается на технологии ИИ.
Самой заметной новой функцией Reddit является Reddit Answers, инструмент поиска, работающий на большой языковой модели (LLM). Он работает, просматривая публикации и комментарии, а затем компилируя ответы непосредственно из слов пользователей. По словам Стива Хаффмана, он лучше всего подходит для вопросов, на которые нет простых и однозначных ответов.
Как SEO-эксперт, я действительно впечатлён тем, что делает Reddit Answers. Это уникально, потому что оно *только* извлекает ответы непосредственно от реальных пользователей Reddit – это все дословные цитаты. Но что еще более важно, оно демонстрирует множество точек зрения. Это ключевой момент, потому что когда люди обращаются к Reddit, они ищут подлинные человеческие перспективы, а не просто один ответ.
Reddit использует искусственный интеллект для управления и категоризации контента. Большие языковые модели (LLMs) теперь способны выявлять травлю в комментариях, задачу, которая ранее была сложной из-за её субъективного характера, по словам генерального директора Стива Хаффмана.
Хаффман объяснил, что AI-модерация призвана уменьшить количество вредоносного контента, который видят пользователи, но она не предназначена для замены того, как сообщества Reddit в настоящее время управляют собой.
По словам Хаффмана, одной из самых сложных задач в сети было ранее рецензирование крайне тревожного контента, чтобы определить, следует ли разрешить его оставаться в сети. Теперь эта работа больше не требуется.
Серые зоны постов, написанных ИИ
Хаффман объяснил, что пользователи, создающие контент с помощью ИИ, а затем публикующие его на Reddit, отличаются от автоматической активности ботов. Он подчеркнул разницу между этими двумя типами деятельности.
Действительно раздражает видеть посты и комментарии в сети – не только на Reddit – которые явно написаны ChatGPT. Это заставляет задуматься, взаимодействуете ли вы с ботом, даже если изначально идею придумал человек.
Хаффман подчеркнул важность человеческой креативности. Он объяснил, что они хотят убедиться, что реальный человек является движущей силой контента, которым делятся люди. Однако он также отметил, что посты, написанные целиком ИИ, как правило, плохо написаны.
Вместо того, чтобы устанавливать формальное правило относительно контента, созданного ИИ, генеральный директор Reddit Стив Хаффман заявил, что платформа будет полагаться на своих пользователей для решения этой проблемы. Он отметил, что пользователи уже используют пониженные оценки и комментарии для пометки постов, написанных ИИ, и Reddit планирует предоставить сообществам больше инструментов для отклонения этого типа контента.
Я много думал об инструментах для написания текстов с использованием ИИ, и честно говоря, это немного похоже на то, как появились калькуляторы на уроках математики. Люди спрашивают, что мы будем делать со студентами – или, в данном случае, со всеми – когда они научатся ими пользоваться. Мое мнение таково, что нам всем нужно разобраться в этом *вместе*. Мы все учимся работать с ИИ для написания текстов, и нам нужно адаптироваться по ходу дела.
Почему это важно
Заявления Хаффмана подтверждают утверждение Reddit о том, что разговоры на его платформе необходимы для обучения искусственного интеллекта.
Проблема контента, сгенерированного ИИ, как подчеркнул Хаффман, была частью более масштабного расследования Search Engine Journal о некачественном контенте, созданном ИИ, на YouTube. Reddit придерживается уникального подхода, полагаясь на свое сообщество для выявления постов, сгенерированных ИИ, вместо создания инструментов для их автоматического обнаружения, в отличие от других платформ, которые используют автоматические системы маркировки.
Заглядывая в будущее
Стив Хаффман из Reddit рассказал Fast Company, что они всегда обсуждают потенциальные партнерства по данным, но он не предоставил никаких подробностей о том, что новая сделка находится в разработке.
Reddit в настоящее время судится как с Anthropic, так и с Perplexity. Федеральный суд провел слушание в марте по делу против Anthropic.
Смотрите также
- Google: заманчиво оптимизировать показатели инструментов; Нет ярлыков для SEO
- Bing Поддерживает data-nosnippet для поисковых сниппетов и ответов ИИ.
- TIA/USD
- 11 лучших книг по SEO, которые вам стоит прочитать
- WordPress объявляет об AI Agent Skill для ускорения разработки
- 8 из 10 видеороликов брендов в TikTok не привлекают внимание
- Публикации в Google Business Profiles Объединяют изображения, улучшенные с помощью искусственного интеллекта
- Биткоин-киты становятся толще, но продолжают вести себя как нервные коровы – вот почему вам стоит об этом беспокоиться
- Резкое падение Bitcoin: утонет ли он в супе за $60k? 🍲💰
- Великий поворот: почему агентства заменяют PPC предсказуемым SEO
2026-05-25 15:41