Перейти к содержимому
Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher
AI2 мин
9

Microsoft заставила GPT и Claude совместно решать задачи в Copilot Researcher

Microsoft представила функции Critique и Council для Copilot Researcher, позволяющие моделям GPT и Claude одновременно работать над одной задачей — для повышения точности и борьбы с галлюцинациями ИИ.

📝
Редакция
0
Редакция · 0 статей

Microsoft представила два новых режима работы для своего инструмента Copilot Researcher — Critique и Council. Оба режима задействуют языковые модели GPT (OpenAI) и Claude (Anthropic) одновременно, направляя их на совместное решение одной задачи ради повышения качества результатов.

«Introducing Critique, a new multi-model deep research system in M365 Copilot. You can use multiple models together to generate optimal responses and reports.» — Satya Nadella (@satyanadella), оригинальный пост

Почему это важно

Все существующие ИИ-инструменты для исследований, по утверждению самой Microsoft, работают по одному и тому же принципу — одна модель генерирует ответ, и никто не перепроверяет результат. Это приводит к галлюцинациям, ошибкам в цитировании и появлению ложных утверждений. Новый подход с использованием нескольких моделей одновременно — попытка решить одну из ключевых проблем генеративного ИИ на системном уровне, а не за счёт улучшения одной отдельной модели.

Critique: сотрудничество моделей

Critique — это мультимодельная система глубокого анализа, созданная для сложных исследовательских задач. Она комбинирует нейросети от ведущих лабораторий по принципу разделения ролей.

Согласно заявлению Microsoft, одна модель берёт на себя этап генерации: планирует задачу, итеративно ищет информацию и формирует первоначальный черновик. Вторая модель выполняет функцию эксперта-рецензента — проверяет и дорабатывает результат. При этом модели могут меняться ролями в процессе работы.

Результаты теста DRACO для Critique и Claude Opus

Результаты бенчмарка DRACO: Critique набрала 57,4 балла против 42,7 у Claude Opus 4.6. Источник: Microsoft

В бенчмарке DRACO, охватывающем 100 сложных исследовательских задач в 10 различных областях, Critique продемонстрировала результат в 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку набрала 42,7 балла.

Council: соревнование моделей

Второй режим — Council — использует принципиально иной подход. GPT и Claude запускаются параллельно, и каждая модель готовит полноценный отчёт независимо от другой. Оба ответа отображаются рядом, после чего третья модель-арбитр анализирует результаты обеих и составляет итоговое резюме. В нём указывается, по каким пунктам модели пришли к единому мнению, а в каких аспектах их аргументация расходится.

Ключевое различие между двумя режимами: в Critique модели сотрудничают, а в Council — соревнуются.

Доступность

Critique установлен как стандартный режим работы в Researcher, тогда как Council необходимо активировать вручную через меню. Обе функции на данный момент доступны пользователям, зарегистрированным в программе Microsoft Frontier.

Ранее в марте Microsoft уже расширяла возможности своей ИИ-экосистемы, представив агента Cowork для выполнения комплексных задач в Microsoft 365. Этот агент способен взаимодействовать с приложениями Outlook, Teams, Excel, PowerPoint и SharePoint.

ai-researchanthropicartificial-intelligencecopilotlarge-language-modelsmicrosoftopenai

Часто задаваемые вопросы

Что такое Critique в Microsoft Copilot Researcher?

Critique — это мультимодельная система глубокого анализа, в которой две ИИ-модели (GPT и Claude) совместно решают исследовательскую задачу. Одна модель генерирует черновик, а другая выступает рецензентом, проверяя и дорабатывая результат.

Чем отличается Council от Critique в Copilot Researcher?

В Critique модели сотрудничают, разделяя роли генератора и рецензента. В Council модели работают параллельно и независимо, а третья модель-арбитр сравнивает их ответы и составляет итоговое резюме.

Какие результаты показала Critique на бенчмарке DRACO?

На бенчмарке DRACO, включающем 100 сложных исследовательских задач в 10 областях, Critique набрала 57,4 балла. Для сравнения, Claude Opus 4.6 в одиночку показала результат 42,7 балла.

Как получить доступ к Critique и Council от Microsoft?

Обе функции доступны пользователям, зарегистрированным в программе Microsoft Frontier. Critique включён как стандартный режим в Researcher, а Council нужно выбрать вручную через меню.

Какие модели ИИ использует Microsoft в Copilot Researcher?

Copilot Researcher задействует модели GPT от OpenAI и Claude от Anthropic. Обе модели могут работать совместно (режим Critique) или соревноваться друг с другом (режим Council).

Читайте также

AI

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.

3 мин·🔥 0
AI

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.

4 мин·🔥 1
AI

Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic

Трамп дал федеральным ведомствам 6 месяцев на отказ от ИИ Anthropic. Что стоит за конфликтом с Claude и какую роль играет xAI Маска?

3 мин·🔥 1
AI

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.

3 мин·🔥 1
Аналитика

Дайджест недели: расследование NYT о Сатоши, северокорейские хакеры в DeFi и «побег» ИИ от Anthropic

Биткоин укрепился выше $71 000, журналист NYT назвал Адама Бэка создателем BTC, ZachXBT раскрыл сеть IT-агентов из КНДР в криптопроектах, а Anthropic заблокировала собственную ИИ-модель после обнаружения тысяч уязвимостей нулевого дня.

5 мин·🔥 0
Рынок

Крупнейший взлом Drift Protocol на $280 млн, квантовая угроза биткоину и другие события недели

Биткоин завершил неделю на уровне $67 000, северокорейские хакеры атаковали Drift Protocol на $280 млн, Anthropic допустила утечку кода Claude Code, а исследователи Google снизили оценку квантовой угрозы для криптовалют.

5 мин·🔥 0