拒绝AI胡说八道，微软推出Critique系统实现双模型协同自我纠错！

热门文章

美国科技巨头微软周一推出一项深度研究智能体更新，允许用户在同一项研究中同时调用OpenAI的GPT大模型和Anthropic旗下Claude大模型！

微软周一宣布，在365 Copilot的研究代理更新中上架名为“Critique”的新功能。在实际操作中，由OpenAI的GPT先展开研究、生成初稿，然后让Claude遵循学术研究的评审流程，对稿件准确性、完整性和引证质量进行审查，最终生成回复给用户的报告。

微软表示，预计未来这项功能最终能双向运行，即由Claude先写报告，然后GPT进行审查和完善。根据业界衡量深度研究质量的DRACO基准测试显示，两个模型之间的合作的确要比单打独斗强一个档次。这种方法有助于限制AI幻觉，有利于提高生产力和产出质量。微软也推出另一项大模型“理事会”机制：让多个模型同步展开研究，然后比较双方的产出。

在演示中，微软同步使用GPT和Claude模型独立生成研究报告。关键点在于，在两份报告生成后，会有一个裁判模型对产出进行评估，并提炼出两个大模型达成一致或出现分歧的地方，并总结每个模型的独特贡献。

两项尖端技术目前已率先集成至Microsoft 365 Copilot的Researcher工具包中。根据微软的市场推进计划，Critique与Council功能现已进入早期测试阶段，首批访问权限仅限于加入微软Frontier计划的企业客户。

随着这一深度研究系统的落地，微软在企业级生产力工具市场的护城河将进一步加固，同时也预示着AI竞争已从单纯的模型参数竞赛转向了复杂的系统集成与逻辑验证新阶段。

微软的新功能也展现AI产业背后的合纵联横。去年10月，OpenAI宣布与微软达成重组协议，微软保留对OpenAI模型和产品的知识产权使用权至2032年，同时双方能够与对方的竞争对手展开合作。

行情解读：

去年11月，微软宣布与英伟达、Anthropic缔结新的战略合作关系，并向OpenAI竞争对手投资最多50亿美元。作为后续进展，微软今年3月初宣布引入Anthropic引发美股软件板块大抛售的Copilot Cowork代理，并冠以Copilot Cowork的名号。

Michael Rodriguez

Michael Rodriguez brings 14 years of equity market experience with a CFA designation and an MBA in Finance from New York University. His coverage spans global equity markets, with expertise in the technology, healthcare, and financial sectors. He is also a regular contributor to industry journals, writing market commentaries that make complex equity trends accessible to both retail and institutional readers.

Item 1 of 0