Перейти к содержимому
DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4
AI3 мин
9

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

AnthropicAnthropicSTARTUP

Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.

📝
Редакция
0
Редакция · 0 статей

Новый флагман от DeepSeek

24 апреля 2026 года китайский ИИ-стартап DeepSeek анонсировал превью-версию нового семейства языковых моделей V4. Флагманская DeepSeek-V4-Pro продемонстрировала результаты, превосходящие Claude Opus 4.6 и GPT-5.4 по ряду тестов, закрепив за собой статус сильнейшей открытой модели на рынке.

«🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models. 🔹 DeepSeek-V4-Flash: 284B total / 13B active params.» — DeepSeek (@deepseek_ai), оригинальный пост

Почему это важно

Появление открытой модели, способной конкурировать с лучшими закрытыми решениями от Anthropic, OpenAI и Google, меняет расстановку сил на рынке ИИ. Доступность весов и архитектуры V4-Pro позволяет исследователям и компаниям по всему миру использовать и дорабатывать систему топового уровня без зависимости от проприетарных API. Для криптоиндустрии, активно внедряющей ИИ-агентов в торговые стратегии и DeFi-протоколы, это означает появление мощного и экономичного инструмента.

Архитектура и масштаб моделей

V4-Pro содержит около 1,6 трлн параметров, однако при обработке каждого запроса задействуются лишь 49 млрд из них. Младшая модель семейства — V4-Flash — насчитывает 284 млрд параметров с активацией 13 млрд на каждый шаг вычислений.

Обе системы базируются на архитектуре Mixture of Experts (MoE) — «смеси экспертов». Суть подхода: при обработке каждого токена задействуется лишь та часть нейронных подсетей, которая наиболее релевантна текущей задаче. Это обеспечивает существенную экономию вычислительных ресурсов при сопоставимом качестве работы.

Предобучение проводилось на корпусе, превышающем 32 трлн токенов. После этого команда применила поэтапную дообучку: отдельные блоки были выделены для навыков программирования, математики, логического мышления и следования инструкциям. Финальная модель объединяет все эти способности через дистилляцию.

Сравнение ресурсоёмкости моделей DeepSeek V4
Показатели эффективности работы с длинным контекстом у моделей V4. Источник: Hugging Face

Оптимизация длинного контекста

Главное нововведение V4 — радикальное снижение затрат на обработку длинных последовательностей. Контекстное окно в 1 млн токенов предлагают и конкуренты, но обычно работа с таким объёмом данных сопровождается высокой стоимостью и значительными задержками.

DeepSeek заявил, что V4-Pro потребляет лишь около 27% вычислений и 10% памяти KV-кэша по сравнению с предшественником V3.2 при работе с максимальным контекстом. Для V4-Flash эти цифры ещё ниже — порядка 10% вычислений и 7% памяти.

Такие показатели достигнуты за счёт гибридной архитектуры внимания, использующей два механизма сжатия данных для снижения нагрузки. Дополнительно применялись специальные гиперсвязи для стабилизации обучения и оптимизатор Muon для его ускорения.

Три режима рассуждений и агентные функции

Модели V4 поддерживают три режима работы:

  • Non-think — мгновенные ответы на простые запросы без дополнительного анализа;
  • Think High — углублённый разбор для сложных задач и планирования;
  • Think Max — полный режим: модель детально прописывает каждый шаг и проверяет все возможные варианты.

В агентных сценариях режим Max теперь сохраняет цепочку промежуточных шагов внутри одной задачи. Ранее, в предыдущей версии, часть такого контекста утрачивалась при взаимодействии с пользователем.

Результаты бенчмарков

Согласно опубликованным данным DeepSeek, V4-Pro показала конкурентоспособные результаты по широкому спектру направлений:

  • Программирование: рейтинг 3206 на Codeforces — 23-е место среди живых программистов мира, на уровне GPT-5.4;
  • Математика: 95,2 на HMMT 2026 и 89,8 на IMOAnswerBench — выше большинства конкурентов;
  • Знания (SimpleQA Verified): 57,9 балла (Opus 4.6 — 46,2, но Gemini 3.1 Pro — 75,6);
  • Разработка (внутренний тест DeepSeek): 67% — между Sonnet 4.5 (47%) и Opus 4.5 (70%);
  • Агентные задачи: V4-Pro-Max набрала 80,6% на SWE Verified и 67,9% на Terminal Bench.
Результаты тестирования DeepSeek V4-Pro
Результаты тестирования V4-Pro в сравнении с конкурентами. Источник: Hugging Face

Модели V4 специально тренировались на реальных рабочих задачах: анализ данных, составление отчётов, редактирование документов и поиск в интернете с итеративным использованием инструментов. В рамках внутреннего опроса 85 разработчиков и исследователей DeepSeek 52% заявили о готовности использовать V4-Pro как основную модель для программирования, ещё 39% отметили, что склоняются к такому решению.

Релиз DeepSeek V4 состоялся за день до выхода GPT-5.5 от OpenAI, представленного 23 апреля и позиционируемого как «новый уровень интеллекта для реальной работы и управления агентами». Конкуренция между ведущими ИИ-лабораториями продолжает обостряться.

ai-benchmarksanthropicartificial-intelligencedeepseeklarge-language-modelsopen-source-aiopenai

Часто задаваемые вопросы

Что такое DeepSeek V4-Pro и сколько у неё параметров?

DeepSeek V4-Pro — флагманская языковая модель китайского стартапа DeepSeek, выпущенная 24 апреля 2026 года. Она содержит около 1,6 трлн параметров, но при обработке каждого запроса активирует лишь 49 млрд благодаря архитектуре Mixture of Experts.

DeepSeek V4 лучше ChatGPT и Claude?

По данным DeepSeek, V4-Pro обошла Claude Opus 4.6 и показала паритет с GPT-5.4 в задачах программирования на Codeforces (рейтинг 3206). Однако в тесте знаний SimpleQA Verified модель уступила Gemini 3.1 Pro (57,9 против 75,6).

Какое контекстное окно у DeepSeek V4?

DeepSeek V4 поддерживает контекстное окно в 1 млн токенов. При этом V4-Pro требует лишь 27% вычислений и 10% памяти KV-кэша по сравнению с предшественником V3.2, что делает работу с длинным контекстом значительно дешевле.

Чем V4-Flash отличается от V4-Pro?

V4-Flash — компактная версия семейства с 284 млрд параметров (13 млрд активных), тогда как V4-Pro содержит 1,6 трлн параметров (49 млрд активных). Flash ещё более эффективна по ресурсам: при максимальном контексте потребляет около 10% вычислений и 7% памяти по сравнению с V3.2.

DeepSeek V4 — открытая модель?

Да, DeepSeek V4 выпущена как open-source проект. Это делает её самой производительной открытой языковой моделью, конкурирующей с закрытыми системами от OpenAI, Anthropic и Google.

Читайте также

AI

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.

4 мин·🔥 1
AI

Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic

Трамп дал федеральным ведомствам 6 месяцев на отказ от ИИ Anthropic. Что стоит за конфликтом с Claude и какую роль играет xAI Маска?

3 мин·🔥 1
AI

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.

3 мин·🔥 1
Аналитика

Дайджест недели: расследование NYT о Сатоши, северокорейские хакеры в DeFi и «побег» ИИ от Anthropic

Биткоин укрепился выше $71 000, журналист NYT назвал Адама Бэка создателем BTC, ZachXBT раскрыл сеть IT-агентов из КНДР в криптопроектах, а Anthropic заблокировала собственную ИИ-модель после обнаружения тысяч уязвимостей нулевого дня.

5 мин·🔥 0
Рынок

Крупнейший взлом Drift Protocol на $280 млн, квантовая угроза биткоину и другие события недели

Биткоин завершил неделю на уровне $67 000, северокорейские хакеры атаковали Drift Protocol на $280 млн, Anthropic допустила утечку кода Claude Code, а исследователи Google снизили оценку квантовой угрозы для криптовалют.

5 мин·🔥 0
AI

Anthropic ослабила политику безопасности ИИ на фоне ультиматума Пентагона

Anthropic отказалась от ключевых обязательств по безопасности ИИ. Пентагон требует открыть Claude для военных задач — что изменится?

5 мин·🔥 1