OpenAI запустила ChatGPT Images 2.0 — генератор изображений с функцией «размышления»
OpenAI представила ChatGPT Images 2.0 — модель генерации изображений, которая способна рассуждать перед созданием визуального контента и выдавать результаты с разрешением до 2K.
OpenAI выпустила обновлённый генератор изображений ChatGPT Images 2.0, ключевой особенностью которого стала способность «размышлять» перед созданием визуального контента. Компания позиционирует продукт как передовую модель, решающую сложные визуальные задачи и формирующую готовые к использованию работы.
«Introducing ChatGPT Images 2.0 — A state-of-the-art image model that can take on complex visual tasks and produce precise, immediately usable visuals, with sharper editing, richer layouts, and thinking-level intelligence.» — OpenAI (@OpenAI), оригинальный пост
Почему это важно
ChatGPT Images 2.0 — первая модель OpenAI для работы с изображениями, которая проводит этап рассуждения до начала генерации. Это принципиально меняет подход к созданию визуального контента с помощью ИИ: модель не просто механически преобразует текстовый запрос в картинку, а анализирует контекст, самостоятельно заполняет пробелы в промпте и выдаёт более точный результат с меньшим числом итераций. Для профессионалов в области дизайна, маркетинга и разработки игр это означает существенное сокращение времени на доработку.
Точность и контроль над деталями
По заявлению OpenAI, в новой модели произошёл «качественный скачок» сразу в нескольких направлениях: следование инструкциям, точное расположение и соотношение объектов, а также визуализация плотного текста. ChatGPT Images 2.0 уверенно работает с несколькими языками и отображает мелкие элементы с разрешением до 2K.
«Greater Precision and Control — ChatGPT Images 2.0 can conceptualize more sophisticated images, and then actually bring that vision to life effectively. It's able to follow instructions, preserve requested details, and render the fine-grained elements that often break image…» — OpenAI (@OpenAI), оригинальный пост
Модель справляется со сложными концепциями и точно воплощает задуманное визуально, сохраняя указанные детали на всех уровнях — от общей композиции до мельчайших элементов.
Поддержка разнообразных визуальных стилей
Обновлённый генератор точнее воспроизводит характерные черты различных визуальных форматов:
- Фотореалистичные снимки
- Кинематографические кадры
- Пиксельная графика
- Манга
- Другие стили и жанры
LLM обеспечивает высокую согласованность текстур, освещения, композиции и мелких деталей внутри выбранного стиля. OpenAI указывает, что подобная точность полезна при создании игровых прототипов, разработке сторибордов, подготовке маркетинговых материалов и работе в определённом медиаформате.
Функция рассуждения и практические возможности
В связке с ChatGPT модель получает ряд расширенных возможностей: поиск информации в интернете в реальном времени, создание нескольких вариантов по одному промпту, перепроверка результатов и генерация рабочих QR-кодов.
В OpenAI утверждают, что такой подход позволяет модели взять на себя основную часть работы между идеей и финальным изображением — особенно когда на первом месте стоят точность, актуальность данных, согласованность и визуальная целостность.
ChatGPT Images 2.0 поддерживает соотношения сторон в диапазоне от 3:1 (горизонтальное) до 1:3 (вертикальное). Модель доступна пользователям ChatGPT и Codex. Функция Images with thinking включена в тарифные планы ChatGPT Plus, Pro и Business.
Ранее в апреле OpenAI открыла ограниченному числу пользователей доступ к ИИ-модели GPT-5.4-Cyber.
Часто задаваемые вопросы
Что такое ChatGPT Images 2.0?
ChatGPT Images 2.0 — это обновлённый генератор изображений от OpenAI, способный рассуждать перед созданием визуального контента. Модель выдаёт результаты с разрешением до 2K и поддерживает множество визуальных стилей.
Чем ChatGPT Images 2.0 отличается от предыдущих версий?
Это первая модель OpenAI для генерации изображений, которая проводит этап рассуждения перед созданием визуала. Она самостоятельно заполняет пробелы в запросе, опираясь на контекст, и требует меньше уточнений от пользователя.
Кому доступен ChatGPT Images 2.0?
Модель доступна пользователям ChatGPT и Codex. Функция Images with thinking включена в тарифные планы ChatGPT Plus, Pro и Business.
Какие стили поддерживает ChatGPT Images 2.0?
Модель точно воспроизводит фотореалистичные снимки, кинематографические кадры, пиксельную графику, мангу и другие визуальные форматы. LLM обеспечивает согласованность текстур, освещения и композиции.
Может ли ChatGPT Images 2.0 генерировать QR-коды?
Да, в связке с ChatGPT модель умеет генерировать рабочие QR-коды. Также она способна искать информацию в интернете в реальном времени и создавать несколько вариантов по одному промпту.
Читайте также
Google представила нейросеть Nano Banana 2 и обновлённый видеосервис Flow
Google запустила модель Nano Banana 2 для генерации изображений на скорости Gemini Flash, а также масштабно обновила креативную платформу Flow.
OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд
OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.
DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4
Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.
Илон Маск дал первые показания в суде по делу против OpenAI
В Окленде начался судебный процесс по иску Маска к OpenAI, Сэму Альтману и Грегу Брокману. Миллиардер утверждает, что коммерциализация компании нарушила её изначальную миссию.
ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind
ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.
Недельный обзор: биткоин штурмовал $74 000, майнеры распродают запасы, а пользователи бойкотируют ChatGPT
Биткоин кратковременно достиг $74 000, трейдеры массово торгуют нефтью и золотом на Hyperliquid, публичные майнеры за пять месяцев продали более 15 000 BTC, а движение против ChatGPT набирает обороты.
