Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher
Microsoft представила функции Critique и Council для Copilot Researcher, позволяющие моделям GPT и Claude одновременно работать над одной задачей — для повышения точности и борьбы с галлюцинациями ИИ.
Microsoft представила два новых режима работы для своего инструмента Copilot Researcher — Critique и Council. Оба режима задействуют языковые модели GPT (OpenAI) и Claude (Anthropic) одновременно, направляя их на совместное решение одной задачи ради повышения качества результатов.
«Introducing Critique, a new multi-model deep research system in M365 Copilot. You can use multiple models together to generate optimal responses and reports.» — Satya Nadella (@satyanadella), оригинальный пост
Почему это важно
Все существующие ИИ-инструменты для исследований, по утверждению самой Microsoft, работают по одному и тому же принципу — одна модель генерирует ответ, и никто не перепроверяет результат. Это приводит к галлюцинациям, ошибкам в цитировании и появлению ложных утверждений. Новый подход с использованием нескольких моделей одновременно — попытка решить одну из ключевых проблем генеративного ИИ на системном уровне, а не за счёт улучшения одной отдельной модели.
Critique: сотрудничество моделей
Critique — это мультимодельная система глубокого анализа, созданная для сложных исследовательских задач. Она комбинирует нейросети от ведущих лабораторий по принципу разделения ролей.
Согласно заявлению Microsoft, одна модель берёт на себя этап генерации: планирует задачу, итеративно ищет информацию и формирует первоначальный черновик. Вторая модель выполняет функцию эксперта-рецензента — проверяет и дорабатывает результат. При этом модели могут меняться ролями в процессе работы.

Результаты бенчмарка DRACO: Critique набрала 57,4 балла против 42,7 у Claude Opus 4.6. Источник: Microsoft
В бенчмарке DRACO, охватывающем 100 сложных исследовательских задач в 10 различных областях, Critique продемонстрировала результат в 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку набрала 42,7 балла.
Council: соревнование моделей
Второй режим — Council — использует принципиально иной подход. GPT и Claude запускаются параллельно, и каждая модель готовит полноценный отчёт независимо от другой. Оба ответа отображаются рядом, после чего третья модель-арбитр анализирует результаты обеих и составляет итоговое резюме. В нём указывается, по каким пунктам модели пришли к единому мнению, а в каких аспектах их аргументация расходится.
Ключевое различие между двумя режимами: в Critique модели сотрудничают, а в Council — соревнуются.
Доступность
Critique установлен как стандартный режим работы в Researcher, тогда как Council необходимо активировать вручную через меню. Обе функции на данный момент доступны пользователям, зарегистрированным в программе Microsoft Frontier.
Ранее в марте Microsoft уже расширяла возможности своей ИИ-экосистемы, представив агента Cowork для выполнения комплексных задач в Microsoft 365. Этот агент способен взаимодействовать с приложениями Outlook, Teams, Excel, PowerPoint и SharePoint.
Часто задаваемые вопросы
Что такое Critique в Microsoft Copilot Researcher?
Critique — это мультимодельная система глубокого анализа, в которой две ИИ-модели (GPT и Claude) совместно решают исследовательскую задачу. Одна модель генерирует черновик, а другая выступает рецензентом, проверяя и дорабатывая результат.
Чем отличается Council от Critique в Copilot Researcher?
В Critique модели сотрудничают, разделяя роли генератора и рецензента. В Council модели работают параллельно и независимо, а третья модель-арбитр сравнивает их ответы и составляет итоговое резюме.
Какие результаты показала Critique на бенчмарке DRACO?
На бенчмарке DRACO, включающем 100 сложных исследовательских задач в 10 областях, Critique набрала 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку показала результат 42,7 балла.
Как получить доступ к Critique и Council от Microsoft?
Обе функции доступны пользователям, зарегистрированным в программе Microsoft Frontier. Critique включён как стандартный режим в Researcher, а Council нужно выбрать вручную через меню.
Какие модели ИИ использует Microsoft в Copilot Researcher?
Copilot Researcher задействует модели GPT от OpenAI и Claude от Anthropic. Обе модели могут работать совместно (режим Critique) или соревноваться друг с другом (режим Council).
Читайте также
DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4
Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.
OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд
OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.
Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic
Трамп дал федеральным ведомствам 6 месяцев на отказ от ИИ Anthropic. Что стоит за конфликтом с Claude и какую роль играет xAI Маска?
ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind
ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.
Дайджест недели: расследование NYT о Сатоши, северокорейские хакеры в DeFi и «побег» ИИ от Anthropic
Биткоин укрепился выше $71 000, журналист NYT назвал Адама Бэка создателем BTC, ZachXBT раскрыл сеть IT-агентов из КНДР в криптопроектах, а Anthropic заблокировала собственную ИИ-модель после обнаружения тысяч уязвимостей нулевого дня.
Крупнейший взлом Drift Protocol на $280 млн, квантовая угроза биткоину и другие события недели
Биткоин завершил неделю на уровне $67 000, северокорейские хакеры атаковали Drift Protocol на $280 млн, Anthropic допустила утечку кода Claude Code, а исследователи Google снизили оценку квантовой угрозы для криптовалют.
