文献检索，用中文搜 PubMed

大型语言模型（LLMs）有潜力提高证据综合的效率和准确性。本研究评估了仅使用大型语言模型和大型语言模型辅助的方法在107项补充医学试验的数据提取和偏倚风险评估中的效果。Moonshot-v1-128k和Claude-3.5-sonnet实现了高精度（≥95%），大型语言模型辅助的方法表现更好（≥97%）。大型语言模型辅助的方法显著减少了处理时间（分别为14.7分钟和5.9分钟，而传统方法为86.9分钟和10.4分钟）。这些发现凸显了大型语言模型与人类专业知识相结合时的潜力。