Перейти к содержимому
OpenAI запустила ChatGPT Images 2.0 — генератор изображений с функцией «размышления»
AI2 мин
0

OpenAI запустила ChatGPT Images 2.0 — генератор изображений с функцией «размышления»

OpenAI представила ChatGPT Images 2.0 — модель генерации изображений, которая способна рассуждать перед созданием визуального контента и выдавать результаты с разрешением до 2K.

📝
Редакция
0
Редакция · 0 статей

OpenAI выпустила обновлённый генератор изображений ChatGPT Images 2.0, ключевой особенностью которого стала способность «размышлять» перед созданием визуального контента. Компания позиционирует продукт как передовую модель, решающую сложные визуальные задачи и формирующую готовые к использованию работы.

«Introducing ChatGPT Images 2.0 — A state-of-the-art image model that can take on complex visual tasks and produce precise, immediately usable visuals, with sharper editing, richer layouts, and thinking-level intelligence.» — OpenAI (@OpenAI), оригинальный пост

Почему это важно

ChatGPT Images 2.0 — первая модель OpenAI для работы с изображениями, которая проводит этап рассуждения до начала генерации. Это принципиально меняет подход к созданию визуального контента с помощью ИИ: модель не просто механически преобразует текстовый запрос в картинку, а анализирует контекст, самостоятельно заполняет пробелы в промпте и выдаёт более точный результат с меньшим числом итераций. Для профессионалов в области дизайна, маркетинга и разработки игр это означает существенное сокращение времени на доработку.

Точность и контроль над деталями

По заявлению OpenAI, в новой модели произошёл «качественный скачок» сразу в нескольких направлениях: следование инструкциям, точное расположение и соотношение объектов, а также визуализация плотного текста. ChatGPT Images 2.0 уверенно работает с несколькими языками и отображает мелкие элементы с разрешением до 2K.

«Greater Precision and Control — ChatGPT Images 2.0 can conceptualize more sophisticated images, and then actually bring that vision to life effectively. It's able to follow instructions, preserve requested details, and render the fine-grained elements that often break image…» — OpenAI (@OpenAI), оригинальный пост

Модель справляется со сложными концепциями и точно воплощает задуманное визуально, сохраняя указанные детали на всех уровнях — от общей композиции до мельчайших элементов.

Поддержка разнообразных визуальных стилей

Обновлённый генератор точнее воспроизводит характерные черты различных визуальных форматов:

  • Фотореалистичные снимки
  • Кинематографические кадры
  • Пиксельная графика
  • Манга
  • Другие стили и жанры

LLM обеспечивает высокую согласованность текстур, освещения, композиции и мелких деталей внутри выбранного стиля. OpenAI указывает, что подобная точность полезна при создании игровых прототипов, разработке сторибордов, подготовке маркетинговых материалов и работе в определённом медиаформате.

Функция рассуждения и практические возможности

В связке с ChatGPT модель получает ряд расширенных возможностей: поиск информации в интернете в реальном времени, создание нескольких вариантов по одному промпту, перепроверка результатов и генерация рабочих QR-кодов.

В OpenAI утверждают, что такой подход позволяет модели взять на себя основную часть работы между идеей и финальным изображением — особенно когда на первом месте стоят точность, актуальность данных, согласованность и визуальная целостность.

ChatGPT Images 2.0 поддерживает соотношения сторон в диапазоне от 3:1 (горизонтальное) до 1:3 (вертикальное). Модель доступна пользователям ChatGPT и Codex. Функция Images with thinking включена в тарифные планы ChatGPT Plus, Pro и Business.

Ранее в апреле OpenAI открыла ограниченному числу пользователей доступ к ИИ-модели GPT-5.4-Cyber.

ai-toolsartificial-intelligencechatgptimage-generationmachine-learningopenai

Часто задаваемые вопросы

Что такое ChatGPT Images 2.0?

ChatGPT Images 2.0 — это обновлённый генератор изображений от OpenAI, способный рассуждать перед созданием визуального контента. Модель выдаёт результаты с разрешением до 2K и поддерживает множество визуальных стилей.

Чем ChatGPT Images 2.0 отличается от предыдущих версий?

Это первая модель OpenAI для генерации изображений, которая проводит этап рассуждения перед созданием визуала. Она самостоятельно заполняет пробелы в запросе, опираясь на контекст, и требует меньше уточнений от пользователя.

Кому доступен ChatGPT Images 2.0?

Модель доступна пользователям ChatGPT и Codex. Функция Images with thinking включена в тарифные планы ChatGPT Plus, Pro и Business.

Какие стили поддерживает ChatGPT Images 2.0?

Модель точно воспроизводит фотореалистичные снимки, кинематографические кадры, пиксельную графику, мангу и другие визуальные форматы. LLM обеспечивает согласованность текстур, освещения и композиции.

Может ли ChatGPT Images 2.0 генерировать QR-коды?

Да, в связке с ChatGPT модель умеет генерировать рабочие QR-коды. Также она способна искать информацию в интернете в реальном времени и создавать несколько вариантов по одному промпту.

Читайте также

AI

Google представила нейросеть Nano Banana 2 и обновлённый видеосервис Flow

Google запустила модель Nano Banana 2 для генерации изображений на скорости Gemini Flash, а также масштабно обновила креативную платформу Flow.

3 мин·🔥 1
AI

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.

4 мин·🔥 1
AI

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.

3 мин·🔥 0
AI

Илон Маск дал первые показания в суде по делу против OpenAI

В Окленде начался судебный процесс по иску Маска к OpenAI, Сэму Альтману и Грегу Брокману. Миллиардер утверждает, что коммерциализация компании нарушила её изначальную миссию.

3 мин·🔥 0
AI

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.

3 мин·🔥 1
AI

Недельный обзор: биткоин штурмовал $74 000, майнеры распродают запасы, а пользователи бойкотируют ChatGPT

Биткоин кратковременно достиг $74 000, трейдеры массово торгуют нефтью и золотом на Hyperliquid, публичные майнеры за пять месяцев продали более 15 000 BTC, а движение против ChatGPT набирает обороты.

5 мин·🔥 1