文献检索，用中文搜 PubMed

应用&插件

Zotero 插件浏览器插件 Mac 客户端 Windows 客户端微信小程序

定价

高级版会员购买积分包购买API积分包

服务

文献检索文档翻译深度研究 API 文档 MCP 服务

关于我们

关于 Suppr 公司介绍联系我们用户协议隐私条款

关注我们

Suppr 超能文献

核心技术专利：CN118964589B侵权必究

粤ICP备2023148730 号-1Suppr @ 2026

我们针对临床规模的工作负载，在两种配置下测试了最先进的大语言模型（LLMs）：一种是单个智能体处理异构任务，另一种是精心编排的多智能体系统，将每个任务分配给一个专用工作器。在检索、提取和剂量计算过程中，我们将批量大小从5变化到80，以模拟临床流量。多智能体运行在负载下保持了较高的准确率（5个任务时的综合准确率为90.6%，80个任务时为65.3%），而单个智能体的准确率则大幅下降（从73.1%降至16.6%），在超过10个任务时存在显著差异（FDR校正p < 0.01）。与单个智能体运行相比，多智能体执行将令牌使用量减少了65倍，并限制了延迟增长。该设计对任务的隔离防止了上下文干扰，并在四个不同的大语言模型检查点上保持了性能。这是首次在持续的混合任务临床工作负载下对大语言模型智能体架构进行评估，表明轻量级编排能够在运营规模上实现准确性、效率和可审计性。

Suppr 超能文献

文献检索

文件翻译

深度研究

Suppr 超能文献

文献检索

文件翻译

深度研究

与单个智能体相比，精心编排的多智能体在临床规模的工作量下能保持准确性。

Orchestrated multi agents sustain accuracy under clinical-scale workloads compared to a single agent.

作者信息

机构信息

出版信息

相似文献

本文引用的文献

与单个智能体相比，精心编排的多智能体在临床规模的工作量下能保持准确性。

Orchestrated multi agents sustain accuracy under clinical-scale workloads compared to a single agent.

作者信息

机构信息

出版信息

相似文献

本文引用的文献