OpenAI расширяет создание изображений с помощью GPT-4o всем пользователям.

Как опытный вебмастер, я недавно стал свидетелем захватывающего запуска передовой системы генерации изображений, идеально интегрированной с GPT-4 от OpenAI. Этот инновационный инструмент позволяет ИИ использовать огромное количество информации и общаться с пользователями, одновременно создавая изображения. Это похоже на работу с цифровым художником, который понимает контекст и учится из каждого взаимодействия!

Купил акции на все деньги, а они упали? А Илон Маск снова написал твит? Знакомо. У нас тут клуб тех, кто пытается понять этот цирк и не сойти с ума.

Купить на падении (нет)

Эта интеграция, как утверждается, позволяет более контекстуально релевантные и точные визуальные результаты.

Объявление OpenAI гласит:

Генерация изображений в GPT-4o является исключительной по точности отображения текста, строгому следованию инструкциям и использованию встроенной базы знаний и контекста чата. Это позволяет ему как трансформировать загруженные изображения, так и вдохновляться ими, давая возможность легко создавать конкретные образы, которые вы представляете себе. Такое взаимодействие улучшает коммуникацию через визуальные средства и выводит генерацию изображений на новый уровень точности и мощи.

Вот всё остальное, что вам нужно знать.

Технические возможности

OpenAI обращает внимание на следующие возможности своей новой системы генерации изображений:

Он точно воспроизводит текст внутри изображений.
Это позволяет пользователям улучшать изображения через общение, сохраняя при этом единый стиль.
Он поддерживает сложные запросы с до 20 различными объектами.
Он может генерировать изображения на основе загруженных ссылок.
Он создает визуальные изображения, используя информацию из обучающих данных GPt-4o.

Так как создание изображения является встроенной функцией GPT-4o, вы можете детализировать изображение через естественный диалог. GPT-4o имеет возможность разрабатывать изображения и текст в рамках чат-сессии, сохраняя согласованность на всем протяжении процесса. Например, при разработке персонажа видеоигры его внешний вид будет оставаться постоянным во время различных пересмотров, когда вы исправляете или исследуете различные варианты.

Примеры

Чтобы проиллюстрировать последовательность характера, позвольте мне привести пример с котом вначале, а затем того же самого кота в шляпе и монокле.

Вот более практическое иллюстрация для маркетологов, демонстрирующая концепцию создания текста: полное меню ресторана, созданное на основе подробного описания или инструкции.

В официальном заявлении OpenAI вы найдете множество дополнительных иллюстраций. Многие из них демонстрируют использование нескольких первоначальных запросов и последующих ответов.

Ограничения

OpenAI признает:

Хотя наша модель не идеальна, мы признаем текущие недостатки. После ее дебюта планируем сосредоточиться на улучшении и доработке для преодоления этих проблем.

Компания отмечает следующие ограничения своей новой системы генерации изображений:

Обрезка: GPt-4o иногда обрезает длинные изображения, например, плакаты, слишком близко снизу.
Галлюцинации: Эта модель может создавать ложную информацию, особенно при неопределенных запросах.
Проблемы с высоким смешиванием: ему сложно точно отобразить более 10-20 концепций одновременно, как полную периодическую таблицу.
Текст на разных языках: Модель может иметь проблемы с отображением нелатинских символов, что приводит к ошибкам.
Редактирование отдельных частей изображения может изменить другие области или создать новые ошибки. Также сложно поддерживать согласованность лиц в загруженных изображениях.
Информационная плотность: модель испытывает трудности с отображением детальной информации при малых размерах.

Влияние на поиски

Как эксперт по SEO я бы сформулировал это так: Я наблюдаю изменение в применении изображений, созданных ИИ – от прежде всего декоративных функций к более практическим ролям в бизнесе и коммуникации.

Сайты могут использовать изображения, сгенерированные искусственным интеллектом, однако необходимо учесть важные соображения.

Правила Google не останавливают изображения, созданные искусственным интеллектом; скорее, они сосредотачиваются на том, представляет ли контент ценность независимо от его источника или метода создания.

Рекомендуется следовать этим лучшим практикам:

Использование метаданных C2PA (которые автоматически добавляются в ГПТ-4о) для поддержания прозрачности
Добавление корректного альтернативного текста для доступности и индексации
Обеспечение того, что изображения служат намерению пользователя, а не просто заполняют пространство
Создание уникальных визуальных эффектов вместо шаблонных шаблонов искусственного интеллекта.

Представитель Google Джон Мюллер поделился критическим взглядом на изображения, созданные искусственным интеллектом. Несмотря на то что личное мнение Мюллера не определяет алгоритмы Google, они могут отражать настроения других профессионалов в этой области относительно изображений, созданных ИИ.

Обратите внимание, что компания Google внедряет меры по маркировке изображений, созданных искусственным интеллектом в результатах поиска.

Доступность

Новая функция в настоящее время доступна пользователям с планами Плюс, Про, Тим или даже с бесплатным планом на ЧатГПТ. Для пользователей Энтерпрайз и Образовательных доступ к этой функции скоро станет возможным.

В ближайшие недели разработчики получат доступ к API. В среднем генерация изображения занимает около минуты из-за возросших требований к обработке.

Смотрите также

2025-03-26 01:09