Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher

AI2 мин

31 марта 2026 г.

Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher

Microsoft представила функции Critique и Council для Copilot Researcher, позволяющие моделям GPT и Claude одновременно работать над одной задачей — для повышения точности и борьбы с галлюцинациями ИИ.

📝

Редакция

Редакция · 0 статей

Microsoft представила два новых режима работы для своего инструмента Copilot Researcher — Critique и Council. Оба режима задействуют языковые модели GPT (OpenAI) и Claude (Anthropic) одновременно, направляя их на совместное решение одной задачи ради повышения качества результатов.

«Introducing Critique, a new multi-model deep research system in M365 Copilot. You can use multiple models together to generate optimal responses and reports.» — Satya Nadella (@satyanadella), оригинальный пост

Почему это важно

Все существующие ИИ-инструменты для исследований, по утверждению самой Microsoft, работают по одному и тому же принципу — одна модель генерирует ответ, и никто не перепроверяет результат. Это приводит к галлюцинациям, ошибкам в цитировании и появлению ложных утверждений. Новый подход с использованием нескольких моделей одновременно — попытка решить одну из ключевых проблем генеративного ИИ на системном уровне, а не за счёт улучшения одной отдельной модели.

Critique: сотрудничество моделей

Critique — это мультимодельная система глубокого анализа, созданная для сложных исследовательских задач. Она комбинирует нейросети от ведущих лабораторий по принципу разделения ролей.

Согласно заявлению Microsoft, одна модель берёт на себя этап генерации: планирует задачу, итеративно ищет информацию и формирует первоначальный черновик. Вторая модель выполняет функцию эксперта-рецензента — проверяет и дорабатывает результат. При этом модели могут меняться ролями в процессе работы.

Результаты теста DRACO для Critique и Claude Opus

Результаты бенчмарка DRACO: Critique набрала 57,4 балла против 42,7 у Claude Opus 4.6. Источник: Microsoft

В бенчмарке DRACO, охватывающем 100 сложных исследовательских задач в 10 различных областях, Critique продемонстрировала результат в 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку набрала 42,7 балла.

Council: соревнование моделей

Второй режим — Council — использует принципиально иной подход. GPT и Claude запускаются параллельно, и каждая модель готовит полноценный отчёт независимо от другой. Оба ответа отображаются рядом, после чего третья модель-арбитр анализирует результаты обеих и составляет итоговое резюме. В нём указывается, по каким пунктам модели пришли к единому мнению, а в каких аспектах их аргументация расходится.

Ключевое различие между двумя режимами: в Critique модели сотрудничают, а в Council — соревнуются.

Доступность

Critique установлен как стандартный режим работы в Researcher, тогда как Council необходимо активировать вручную через меню. Обе функции на данный момент доступны пользователям, зарегистрированным в программе Microsoft Frontier.

Ранее в марте Microsoft уже расширяла возможности своей ИИ-экосистемы, представив агента Cowork для выполнения комплексных задач в Microsoft 365. Этот агент способен взаимодействовать с приложениями Outlook, Teams, Excel, PowerPoint и SharePoint.

ai-researchanthropic artificial-intelligencecopilotlarge-language-modelsmicrosoftopenai

Часто задаваемые вопросы

Что такое Critique в Microsoft Copilot Researcher?

Critique — это мультимодельная система глубокого анализа, в которой две ИИ-модели (GPT и Claude) совместно решают исследовательскую задачу. Одна модель генерирует черновик, а другая выступает рецензентом, проверяя и дорабатывая результат.

Чем отличается Council от Critique в Copilot Researcher?

В Critique модели сотрудничают, разделяя роли генератора и рецензента. В Council модели работают параллельно и независимо, а третья модель-арбитр сравнивает их ответы и составляет итоговое резюме.

Какие результаты показала Critique на бенчмарке DRACO?

На бенчмарке DRACO, включающем 100 сложных исследовательских задач в 10 областях, Critique набрала 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку показала результат 42,7 балла.

Как получить доступ к Critique и Council от Microsoft?

Обе функции доступны пользователям, зарегистрированным в программе Microsoft Frontier. Critique включён как стандартный режим в Researcher, а Council нужно выбрать вручную через меню.

Какие модели ИИ использует Microsoft в Copilot Researcher?

Copilot Researcher задействует модели GPT от OpenAI и Claude от Anthropic. Обе модели могут работать совместно (режим Critique) или соревноваться друг с другом (режим Council).

Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher

Почему это важно

Critique: сотрудничество моделей

Council: соревнование моделей

Доступность

Часто задаваемые вопросы

Что такое Critique в Microsoft Copilot Researcher?

Чем отличается Council от Critique в Copilot Researcher?

Какие результаты показала Critique на бенчмарке DRACO?

Как получить доступ к Critique и Council от Microsoft?

Какие модели ИИ использует Microsoft в Copilot Researcher?

Читайте также

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

Дайджест недели: расследование NYT о Сатоши, северокорейские хакеры в DeFi и «побег» ИИ от Anthropic

Крупнейший взлом Drift Protocol на $280 млн, квантовая угроза биткоину и другие события недели

Будьте в курсе