Перейти к содержимому
Anthropic выпустила Claude Opus 4.7, а OpenAI ответила обновлённым Codex и моделью GPT-Rosalind
AI4 мин
5

Anthropic выпустила Claude Opus 4.7, а OpenAI ответила обновлённым Codex и моделью GPT-Rosalind

AnthropicAnthropicSTARTUP

Anthropic запустила свою самую мощную модель Claude Opus 4.7 с улучшенным агентным программированием и визуальными возможностями. OpenAI в тот же день обновила Codex и представила специализированную модель GPT-Rosalind для биомедицинских исследований.

📝
Редакция
0
Редакция · 0 статей

Anthropic 16 апреля представила Claude Opus 4.7 — наиболее продвинутую версию линейки Opus. В тот же день OpenAI анонсировала масштабное обновление Codex и специализированную «рассуждающую» модель GPT-Rosalind, ориентированную на ускорение разработки лекарств.

Claude Opus 4.7: что нового

«Introducing Claude Opus 4.7, our most capable Opus model yet. It handles long-running tasks with more rigor, follows instructions more precisely, and verifies its own outputs before reporting back. You can hand off your hardest work with less supervision.» — Claude (@claudeai), оригинальный пост

Модель доступна всем платным подписчикам Claude и через API. Стоимость составляет $5 за 1 млн входных токенов и $25 за 1 млн выходных.

Главные улучшения сосредоточены на сложных задачах. В агентном программировании Opus 4.7 превзошла предыдущую версию на 10%, а в обработке визуальных данных — на 13%. По другим метрикам прирост менее выраженный.

Бенчмарки Claude Opus 4.7
Результаты бенчмарков Claude Opus 4.7. Источник: Anthropic

Визуальные возможности существенно расширены: модель обрабатывает изображения до 2576 пикселей по длинной стороне (около 3,75 мегапикселей), что втрое превышает показатели предыдущих версий Claude.

Opus 4.7 значительно точнее следует инструкциям. Anthropic предупреждает, что промпты, написанные для старых моделей, могут давать неожиданные результаты — прежние версии интерпретировали запросы свободнее, тогда как новая воспринимает их буквально. Разработчики рекомендуют перенастроить запросы.

Среди прочих нововведений:

  • Память между сессиями — модель сохраняет заметки в файлы и использует их в новых диалогах
  • Новый уровень усилий xhigh («экстра высокий») — промежуточная ступень между high и max для тонкой настройки баланса глубины и скорости
  • Task budgets (публичная бета API) — контроль расхода токенов
  • /ultrareview — выделенная сессия проверки кода в Claude Code
  • Режим auto для Max-пользователей — Claude самостоятельно принимает решения

Ограничения в кибербезопасности вызвали критику

Anthropic намеренно снизила кибервозможности Opus 4.7 — модель уступает Mythos Preview в этой области. Встроенная защита блокирует запрещённые и высокорисковые запросы. Команда стартапа пояснила, что опыт развёртывания этих защитных механизмов поможет продвигаться к широкому выпуску моделей класса Mythos.

Для специалистов по безопасности, которым нужна модель для легальных целей (исследование уязвимостей, пентесты), Anthropic запустила программу Cyber Verification.

Однако часть пользователей столкнулась с чрезмерной осторожностью модели. Некоторые жалуются, что Opus 4.7 отказывается писать код, «усматривая вредоносное ПО в каждом запросе».

«It suspects everything is malware, and still refuses to code after confirming that there is no malware» — Hanh Nguyen (@fashiongiik), оригинальный пост

Почему это важно

Одновременный выход Claude Opus 4.7 и крупного обновления Codex от OpenAI демонстрирует усиление конкуренции в сегменте ИИ-инструментов для разработчиков. Обе компании делают ставку на агентные возможности — автономное выполнение задач с минимальным контролем человека. Для разработчиков это означает расширение арсенала продвинутых кодинг-ассистентов, а для рынка в целом — ускорение гонки за превосходство в прикладном ИИ.

OpenAI обновила Codex: управление приложениями и встроенный браузер

«Codex for (almost) everything. It can now use apps on your Mac, connect to more of your tools, create images, learn from previous actions, remember how you like to work, and take on ongoing and repeatable tasks.» — OpenAI (@OpenAI), оригинальный пост

Обновление пока доступно только на macOS. Codex теперь умеет взаимодействовать с приложениями на компьютере пользователя: видеть экран, кликать и печатать собственным курсором. Несколько агентов могут работать параллельно, не мешая другому софту.

«With computer use on macOS, Codex can now use any app by seeing, clicking, and typing with its own cursor. It runs in the background without taking over your computer, working on tasks like frontend iteration, app testing, or any workflow that doesn't expose an API.» — OpenAI (@OpenAI), оригинальный пост

Codex получил встроенный браузер, в котором страницы можно комментировать напрямую. Также добавлена поддержка gpt-image-1.5 для генерации и итераций изображений — фронтенд-дизайн, макеты, игровые ассеты создаются в едином интерфейсе без API-ключа.

OpenAI выпустила более 90 дополнительных плагинов, включая интеграции с Atlassian Rovo (JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render и Superpowers. Codex также получил поддержку комментариев GitHub, нескольких вкладок терминала и подключение к удалённым devbox по SSH (альфа-версия).

Возможности обновлённого Codex
Функционал памяти и планирования в обновлённом Codex. Источник: OpenAI

Codex научился планировать будущую работу и автоматически возобновлять долгосрочные задачи — потенциально на дни и недели. Память помощника усовершенствована: он запоминает полезный контекст из прошлых диалогов, включая личные предпочтения и исправления.

GPT-Rosalind: ИИ для разработки лекарств

Параллельно OpenAI представила «рассуждающую» модель GPT-Rosalind, названную в честь биофизика Розалинд Франклин, чьи работы помогли расшифровать структуру ДНК.

Результаты GPT-Rosalind на бенчмарках
Сравнение GPT-Rosalind с другими моделями на LABBench2. Источник: OpenAI

По данным OpenAI, в США создание нового лекарства занимает в среднем 10–15 лет, а основные трудности связаны с анализом массивов научных публикаций и специализированных баз данных. GPT-Rosalind призвана работать ассистентом биолога: суммировать научные тексты, формулировать гипотезы, выстраивать планы экспериментов. Модель особенно сильна в задачах, связанных с белками, молекулами, генами и биологическими структурами.

На бенчмарке BixBench (реальный биоинформатический анализ) GPT-Rosalind продемонстрировала один из лучших результатов среди моделей с опубликованными данными. На LABBench2 она обошла GPT-5.4 в шести из 11 задач, с наибольшим отрывом в CloningQA — задаче проектирования ДНК и ферментов для молекулярного клонирования.

OpenAI также опубликовала бесплатный плагин Life Sciences для Codex на GitHub, дающий доступ к более чем 50 публичным научным базам данных и профильным инструментам.

ai-developmentanthropicartificial-intelligenceclaude-opuscodexgpt-rosalindopenai

Часто задаваемые вопросы

Сколько стоит Claude Opus 4.7 через API?

Стоимость составляет $5 за 1 миллион входных токенов и $25 за 1 миллион выходных токенов. Модель доступна всем платным подписчикам Claude.

Чем Claude Opus 4.7 лучше предыдущей версии?

Opus 4.7 показала прирост 10% в агентном программировании и 13% в обработке визуальных данных. Модель обрабатывает изображения до 3,75 мегапикселей — втрое больше предыдущих версий.

Что такое GPT-Rosalind от OpenAI?

Это специализированная «рассуждающая» модель для ускорения разработки лекарств, названная в честь биофизика Розалинд Франклин. Она превосходит GPT-5.4 в 6 из 11 задач на бенчмарке LABBench2.

Какие новые функции получил Codex от OpenAI?

Codex получил возможность управлять приложениями на macOS через собственный курсор, встроенный браузер, поддержку gpt-image-1.5 для генерации изображений и более 90 новых плагинов. Также добавлена долгосрочная память и планирование задач.

Почему пользователи жалуются на Claude Opus 4.7?

Anthropic намеренно снизила кибервозможности модели, и некоторые пользователи сталкиваются с чрезмерными ограничениями — модель отказывается писать код, усматривая вредоносное ПО в обычных запросах. Для легальных задач кибербезопасности компания запустила программу Cyber Verification.

Читайте также

AI

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.

3 мин·🔥 0
AI

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.

4 мин·🔥 1
AI

Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic

Трамп дал федеральным ведомствам 6 месяцев на отказ от ИИ Anthropic. Что стоит за конфликтом с Claude и какую роль играет xAI Маска?

3 мин·🔥 1
AI

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.

3 мин·🔥 1
Аналитика

Дайджест недели: расследование NYT о Сатоши, северокорейские хакеры в DeFi и «побег» ИИ от Anthropic

Биткоин укрепился выше $71 000, журналист NYT назвал Адама Бэка создателем BTC, ZachXBT раскрыл сеть IT-агентов из КНДР в криптопроектах, а Anthropic заблокировала собственную ИИ-модель после обнаружения тысяч уязвимостей нулевого дня.

5 мин·🔥 0
Рынок

Крупнейший взлом Drift Protocol на $280 млн, квантовая угроза биткоину и другие события недели

Биткоин завершил неделю на уровне $67 000, северокорейские хакеры атаковали Drift Protocol на $280 млн, Anthropic допустила утечку кода Claude Code, а исследователи Google снизили оценку квантовой угрозы для криптовалют.

5 мин·🔥 0