OpenAI объявляет «Код Красного» для улучшения ChatGPT на фоне конкуренции с Google.

Этот меморандум описывает реакцию OpenAI на растущую конкуренцию со стороны Google. Новая модель Gemini 3 от Google показала более сильные результаты, чем ChatGPT, в различных тестах, согласно данным как Google, так и независимым рейтингам.

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Что нового

Сэм Альтман поделился с сотрудниками информацией о том, что ChatGPT необходимо сделать более удобным в повседневном использовании. Он подчеркнул улучшения в адаптации ответов к индивидуальным потребностям, повышении скорости и надежности чат-бота, а также расширении спектра вопросов, на которые он может отвечать.

Компания расставляет приоритеты задач, используя цветовую кодировку. В настоящее время улучшения для ChatGPT имеют наивысший приоритет – «code red» – что является повышением по сравнению с предыдущим обозначением «code orange».

Согласно внутреннему служебному меморандуму, OpenAI планирует выпустить новую модель рассуждений на следующей неделе, хотя публичного объявления пока не было.

Отложенные продукты

В результате несколько продуктовых инициатив откладываются.

OpenAI приостановила планы по включению рекламы в приложение ChatGPT после первоначального тестирования. Разработка AI-ассистентов для шопинга и здравоохранения также была приостановлена, наряду с обновлениями функции ChatGPT Pulse.

Сэм Альтман способствует более быстрому развитию ChatGPT, позволяя членам команды временно присоединяться к проекту и проводя ежедневные созвоны для тех, кто работает над улучшениями.

Соревновательный контекст

Модели Gemini 3 от Google показывают хорошие результаты на тестах, измеряющих их способности к рассуждению. Согласно Google, версия Gemini 3 ‘Deep Think’ значительно улучшена по сравнению с предыдущими версиями, особенно на сложных тестах, таких как ‘Humanity’s Last Exam’ – сложный эталон, разработанный экспертами по безопасности ИИ. Эти улучшения видны как на официальной странице производительности Google, так и в независимых рейтингах, сравнивающих различные модели ИИ.

OpenAI пока не поделилась данными о производительности своей новейшей модели рассуждений с общественностью. Поэтому любые сравнения основаны на том, как сейчас работает GPT-5, а не на будущей системе, упомянутой во внутренней записке.

Google всё ещё разрабатывает свои инструменты для создания изображений с помощью ИИ, включая Nano Banana и Nano Banana Pro, которые дополняют его модели Gemini 3 и являются частью более широкого набора ИИ-продуктов.

Контекст бенчмарка

Humanity’s Last Exam разработан, чтобы быть более сложным тестом, чем существующие AI-бенчмарки, такие как MMLU. Центр безопасности ИИ и Scale AI отвечают за его поддержание, а подробности о проекте можно найти на его веб-сайте. Результаты экзамена отслеживаются через различные таблицы лидеров, включая официальную таблицу лидеров Scale AI и независимые источники, такие как Artificial Analysis.

Google утверждает, что её модель Gemini 3 Pro показала более высокий балл на экзамене Humanity’s Last Exam, чем модели, такие как GPT-5. Этот результат является причиной того, что в отчётах говорится о том, что Gemini 3 превзошла ChatGPT на этом конкретном тесте.

Хотя GPT-5 от OpenAI показал хорошие результаты на различных тестах на рассуждения, это объявление кажется ответом на недавние данные, демонстрирующие производительность Google Gemini 3, а не основано на едином сравнении.

Трафик и контекст использования

Несмотря на техническое давление, OpenAI всё ещё имеет значительное преимущество в использовании ассистентов.

Я недавно видел пост Ника Терли, главы ChatGPT, в LinkedIn, в котором он поделился некоторыми впечатляющими статистическими данными. Он сказал, что ChatGPT в настоящее время является самым популярным AI-ассистентом в мире, с примерно 70% всего использования AI-ассистентов. Интересно, что он также отметил, что около 10% всей поисковой активности теперь происходит через ChatGPT. Вы можете найти все подробности в его посте здесь.

Недавние отчёты из источников, таких как Financial Times, показывают, что OpenAI имеет более 800 миллионов пользователей каждую неделю, причём большинство используют бесплатную версию. Google’s Gemini также быстро набирает пользователей, хотя и начал с меньшей базы.

В недавнем служебном меморандуме Олтман признал улучшения Google, но предупредил о краткосрочных экономических трудностях. Он также заявил, что OpenAI быстро сокращает отставание.

A Familiar Playbook

Обозначение «code red» перекликается с собственной реакцией Google на ChatGPT несколько лет назад.

После невероятно популярного релиза ChatGPT лидеры Google инициировали общекорпоративный экстренный ответ, названный «code red». Генеральный директор Сундар Пичаи поручил командам из различных отделов, включая исследования и безопасность, приоритизировать создание новых AI продуктов.

Это ощущение необходимости действовать быстро подстегнуло стремительное развитие AI-технологий Google, что в конечном итоге привело к выпуску Bard в начале 2023 года и его последующему обновлению до Gemini.

Ситуация изменилась. Продолжительные инвестиции Google в технологию искусственного интеллекта привели к модели, которая теперь превосходит ChatGPT в ключевых тестах. В результате, OpenAI реагирует на этот вызов подобно тому, как Google обычно поступает в подобных ситуациях со своими собственными AI продуктами.

Ответ компании

Ник Терли, возглавляющий ChatGPT в OpenAI, недавно заявил в LinkedIn и X, что ChatGPT в настоящее время является ведущим AI-ассистентом в мире.

Он отметил, что новые продукты выходят еженедельно, что является положительным моментом, объяснив, что конкуренция мотивирует OpenAI ускорять разработку и улучшать ChatGPT.

Он объяснил, что OpenAI работает над тем, чтобы сделать ChatGPT более мощным, простым в использовании и более адаптированным к индивидуальным пользователям, а также сделать его доступным для более широкой аудитории.

OpenAI публично не комментировал утечку меморандума.

Заглядывая в будущее

Предстоящий релиз новой модели рассуждений от OpenAI станет первым сигналом о том, как компания следует видению Сэма Альтмана. Тот факт, что они приостановили работу над рекламой и AI-ассистентами, указывает на то, что улучшение качества ChatGPT в настоящее время является их основной целью, по крайней мере, внутри компании.

Маркетологи и SEO-эксперты, вероятно, заметят самые большие изменения в том, как ChatGPT отвечает на сложные вопросы, проводит исследования и обрабатывает последующие запросы после выпуска обновленной модели. Важно отслеживать любые улучшения в качестве, скорости и персонализации его ответов, особенно поскольку Google продолжает запускать функции Gemini 3.

Смотрите также

2025-12-02 17:10