Перейти к содержимому
OpenAI запустила GPT-5.5 — флагманскую модель для агентной работы и сложных задач
AI3 мин
4

OpenAI запустила GPT-5.5 — флагманскую модель для агентной работы и сложных задач

AnthropicAnthropicSTARTUP

OpenAI выпустила GPT-5.5 — нейросеть нового поколения, предназначенную для автономного решения многоэтапных задач, управления агентами и работы с инструментами. Модель доступна в ChatGPT и Codex.

📝
Редакция
0
Редакция · 0 статей

OpenAI 23 апреля выпустила GPT-5.5 — свою новую флагманскую модель искусственного интеллекта, которая позиционируется как качественный скачок в области автономного выполнения задач и управления агентами. Нейросеть уже доступна пользователям ChatGPT и Codex.

«Introducing GPT-5.5 — A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done. Now available in ChatGPT and Codex.» — OpenAI (@OpenAI), оригинальный пост

Почему это важно

Выход GPT-5.5 обозначает переход от модели, которой нужен постоянный контроль пользователя, к нейросети, способной самостоятельно планировать многоэтапную работу, подбирать инструменты, проверять собственные результаты и доводить задачи до конца. Для индустрии ИИ это сигнал о дальнейшем развитии агентного подхода — когда модель берёт на себя не отдельные запросы, а полноценные рабочие процессы.

Согласно заявлению компании, GPT-5.5 обеспечивает рост интеллектуальных возможностей без потери скорости: латентность на токен сопоставима с GPT-5.4 в реальных условиях, а уровень решения задач значительно выше. При работе в Codex модель расходует существенно меньше токенов, чем предшественница.

Результаты тестов GPT-5.5 в различных бенчмарках
Результаты тестов GPT-5.5 в различных бенчмарках. Источник: OpenAI

Агентное программирование и работа с кодом

GPT-5.5 — наиболее мощное решение OpenAI в области агентного программирования. На бенчмарке Terminal-Bench 2.0, оценивающем сложные сценарии работы в командной строке, модель показала точность 82,7%. Результат в SWE-Bench Pro составил 58,6%, а в Expert-SWE новинка превзошла GPT-5.4. Во всех трёх тестах расход токенов оказался ниже, чем у предыдущего поколения.

Показатели GPT-5.5 в программировании
Показатели GPT-5.5 в задачах программирования. Источник: OpenAI

В Codex модель выполняет инженерные задачи от реализации и рефакторинга до отладки, тестирования и валидации. По данным OpenAI, GPT-5.5 лучше разбирается в архитектуре системы: понимает, почему что-то не работает, где нужны исправления и какие участки кода будут затронуты.

Сравнение GPT-5.5 с предшественниками в программировании
Сравнение GPT-5.5 с конкурентами по затратам на программирование. Источник: OpenAI

Модель значительно превосходит GPT-5.4 и Claude Opus 4.7 по логическому мышлению и автономности: заранее выявляет проблемы, прогнозирует необходимость тестирования и рецензирования без явных указаний пользователя.

Результаты в интеллектуальных и профессиональных задачах

В бенчмарке GDPval, проверяющем работу агентов в 44 профессиях, GPT-5.5 набрала 84,9%. В OSWorld-Verified — 78,7%, в Tau2-bench — 98%. Помимо этого, модель продемонстрировала 60% в FinanceAgent, 88,5% в задачах моделирования инвестиционного банкинга и 54,1% в OfficeQA Pro.

Результаты GPT-5.5 в интеллектуальных задачах
Результаты GPT-5.5 в профессиональных бенчмарках. Источник: OpenAI
GPT-5.5 в финансовых и офисных задачах
GPT-5.5 в задачах финансового анализа и офисной работы. Источник: OpenAI

Научные исследования и работа с информацией

В научно-технических процессах GPT-5.5 способна последовательно изучать идеи, собирать доказательства, проверять гипотезы и интерпретировать данные. На GeneBench — платформе для многоэтапного анализа в генетике и количественной биологии — модель улучшила показатели GPT-5.4. Аналогичный результат зафиксирован в BixBench.

GPT-5.5 в научных бенчмарках
Результаты GPT-5.5 в научных исследованиях. Источник: OpenAI

Более 85% сотрудников различных подразделений OpenAI еженедельно используют Codex — не только для разработки ПО, но и в финансах, коммуникации, маркетинге, аналитике данных и управлении продуктами.

GPT-5.5 в биологических бенчмарках
Показатели GPT-5.5 в биологических бенчмарках. Источник: OpenAI

Доступность и стоимость

GPT-5.5 работает в ChatGPT и Codex для подписчиков планов Plus, Pro, Business и Enterprise. Для пользователей Pro, Business и Enterprise также доступна версия GPT-5.5 Pro. В ближайшее время обе версии появятся через API: стоимость составит $5 млн за 1 млн входных токенов и $30 млн за выходные. Контекстное окно — 1 млн токенов.

В Codex модель доступна для планов Plus, Pro, Business, Enterprise, Edu и Go с контекстным окном 400 000 токенов. GPT-5.5 представлена в режиме Fast, генерирующем токены в 1,5 раза быстрее за 2,5-кратную стоимость. При этом GPT-5.5 дороже GPT-5.4, что объясняется более высокой эффективностью использования токенов.

Перед релизом OpenAI применила комплекс мер безопасности с привлечением внутренних и внешних специалистов.

ai-agentsartificial-intelligencechatgptcodexgpt-5.5machine-learningopenai

Часто задаваемые вопросы

Что такое GPT-5.5 и чем она отличается от GPT-5.4?

GPT-5.5 — флагманская ИИ-модель OpenAI, предназначенная для автономного выполнения многоэтапных задач и управления агентами. Она превосходит GPT-5.4 по уровню интеллекта при сопоставимой скорости работы и меньшем расходе токенов.

Сколько стоит доступ к GPT-5.5 через API?

Стоимость через API составит $5 млн за 1 млн входных токенов и $30 млн за выходные токены. Контекстное окно модели — 1 млн токенов.

Какие тарифные планы поддерживают GPT-5.5?

GPT-5.5 доступна в ChatGPT и Codex для пользователей планов Plus, Pro, Business и Enterprise. Версия GPT-5.5 Pro предназначена для подписчиков Pro, Business и Enterprise. В Codex также поддерживаются планы Edu и Go.

Какие результаты GPT-5.5 показала в бенчмарках программирования?

На Terminal-Bench 2.0 модель достигла точности 82,7%, на SWE-Bench Pro — 58,6%. В Expert-SWE она превзошла GPT-5.4, при этом потратив меньше токенов во всех трёх тестах.

Может ли GPT-5.5 проводить научные исследования?

GPT-5.5 способна последовательно изучать идеи, собирать доказательства, проверять гипотезы и интерпретировать данные. Модель показала улучшенные результаты на GeneBench и BixBench по сравнению с GPT-5.4.

Читайте также

AI

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.

4 мин·🔥 1
AI

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.

3 мин·🔥 0
AI

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.

3 мин·🔥 1
Инновации

Как стандарты ERC-8004 и x402 превращают ИИ-агентов в полноценных участников экономики

Блокчейн-стандарты ERC-8004 и x402 формируют инфраструктуру для автономных машинных платежей, бросая вызов закрытым экосистемам Big Tech и модели экономики внимания.

5 мин·🔥 1
AI

Объём транзакций ИИ-агентов оказался в 15 раз меньше данных Bloomberg

Партнёр a16z Ноа Левин опроверг данные Bloomberg о платежах ИИ-агентов: реальный ончейн-оборот составил $1,6–3 млн вместо заявленных $24 млн.

3 мин·🔥 0
AI

Недельный обзор: биткоин штурмовал $74 000, майнеры распродают запасы, а пользователи бойкотируют ChatGPT

Биткоин кратковременно достиг $74 000, трейдеры массово торгуют нефтью и золотом на Hyperliquid, публичные майнеры за пять месяцев продали более 15 000 BTC, а движение против ChatGPT набирает обороты.

5 мин·🔥 1