• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

评估 ChatGPT 在回答日本高血压学会指南相关临床问题上的准确性。

Evaluation of the Accuracy of ChatGPT in Answering Clinical Questions on the Japanese Society of Hypertension Guidelines.

机构信息

Department of Cardiovascular Medicine, Tokushima University Hospital.

Department of Cardiovascular Medicine, Nephrology, and Neurology, Graduate School of Medicine, University of the Ryukyus.

出版信息

Circ J. 2023 Jun 23;87(7):1030-1033. doi: 10.1253/circj.CJ-23-0308. Epub 2023 Jun 7.

DOI:10.1253/circj.CJ-23-0308
PMID:37286486
Abstract

BACKGROUND

To assist healthcare providers in interpreting guidelines, clinical questions (CQ) are often included, but not always, which can make interpretation difficult for non-expert clinicians. We evaluated the ability of ChatGPT to accurately answer CQs on the Japanese Society of Hypertension Guidelines for the Management of Hypertension (JSH 2019).

METHODS AND RESULTS

We conducted an observational study using data from JSH 2019. The accuracy rate for CQs and limited evidence-based questions of the guidelines (Qs) were evaluated. ChatGPT demonstrated a higher accuracy rate for CQs than for Qs (80% vs. 36%, P value: 0.005).

CONCLUSIONS

ChatGPT has the potential to be a valuable tool for clinicians in the management of hypertension.

摘要

背景

为了帮助医疗保健提供者解读指南,通常会包含临床问题(CQ),但并非总是如此,这对于非专家临床医生来说可能难以解读。我们评估了 ChatGPT 准确回答日本高血压学会 2019 年高血压管理指南(JSH 2019)中 CQ 的能力。

方法和结果

我们使用 JSH 2019 的数据进行了一项观察性研究。评估了指南中 CQ 和有限循证问题(Qs)的准确率。ChatGPT 对 CQ 的准确率高于 Qs(80% 对 36%,P 值:0.005)。

结论

ChatGPT 有可能成为高血压管理中临床医生的有用工具。

相似文献

1
Evaluation of the Accuracy of ChatGPT in Answering Clinical Questions on the Japanese Society of Hypertension Guidelines.评估 ChatGPT 在回答日本高血压学会指南相关临床问题上的准确性。
Circ J. 2023 Jun 23;87(7):1030-1033. doi: 10.1253/circj.CJ-23-0308. Epub 2023 Jun 7.
2
ChatGPT Responses to Clinical Questions in the Japan Atherosclerosis Society Guidelines for Prevention of Atherosclerotic Cardiovascular Disease 2022.ChatGPT对《2022年日本动脉粥样硬化协会动脉粥样硬化性心血管疾病预防指南》中临床问题的回答。
J Atheroscler Thromb. 2025 May 1;32(5):567-579. doi: 10.5551/jat.65240. Epub 2024 Oct 30.
3
Performance of ChatGPT in Answering Clinical Questions on the Practical Guideline of Blepharoptosis.ChatGPT在回答关于上睑下垂实用指南临床问题方面的表现。
Aesthetic Plast Surg. 2024 Jul;48(13):2389-2398. doi: 10.1007/s00266-024-04005-1. Epub 2024 Apr 29.
4
Performance of Artificial Intelligence Chatbots in Answering Clinical Questions on Japanese Practical Guidelines for Implant-based Breast Reconstruction.人工智能聊天机器人在回答基于日本乳房植入重建实用指南的临床问题中的表现
Aesthetic Plast Surg. 2025 Apr;49(7):1947-1953. doi: 10.1007/s00266-024-04515-y. Epub 2024 Nov 26.
5
Evaluating ChatGPT in Qualitative Thematic Analysis With Human Researchers in the Japanese Clinical Context and Its Cultural Interpretation Challenges: Comparative Qualitative Study.在日本临床背景下与人类研究人员一起在定性主题分析中评估ChatGPT及其文化解释挑战:比较定性研究
J Med Internet Res. 2025 Apr 24;27:e71521. doi: 10.2196/71521.
6
Comparative performance of artificial intelligence models in rheumatology board-level questions: evaluating Google Gemini and ChatGPT-4o.人工智能模型在风湿病委员会级问题中的比较性能:评估 Google Gemini 和 ChatGPT-4o。
Clin Rheumatol. 2024 Nov;43(11):3507-3513. doi: 10.1007/s10067-024-07154-5. Epub 2024 Sep 28.
7
ChatGPT versus NASS clinical guidelines for degenerative spondylolisthesis: a comparative analysis.ChatGPT 与 NASS 退行性脊柱滑脱临床指南比较分析。
Eur Spine J. 2024 Nov;33(11):4182-4203. doi: 10.1007/s00586-024-08198-6. Epub 2024 Mar 15.
8
Performance of ChatGPT on the Chinese Postgraduate Examination for Clinical Medicine: Survey Study.ChatGPT 在临床医学研究生入学考试中的表现:调查研究。
JMIR Med Educ. 2024 Feb 9;10:e48514. doi: 10.2196/48514.
9
Advancement of Generative Pre-trained Transformer Chatbots in Answering Clinical Questions in the Practical Rhinoplasty Guideline.生成式预训练变换器聊天机器人在回答鼻整形实用指南中临床问题方面的进展
Aesthetic Plast Surg. 2025 Apr;49(7):1874-1880. doi: 10.1007/s00266-024-04377-4. Epub 2024 Sep 25.
10
Performance evaluation of ChatGPT-4.0 and Gemini on image-based neurosurgery board practice questions: A comparative analysis.ChatGPT-4.0和Gemini在基于图像的神经外科专业考试练习题上的性能评估:一项对比分析。
J Clin Neurosci. 2025 Apr;134:111097. doi: 10.1016/j.jocn.2025.111097. Epub 2025 Feb 11.

引用本文的文献

1
Multiple large language models versus clinical guidelines for postmenopausal osteoporosis: a comparative study of ChatGPT-3.5, ChatGPT-4.0, ChatGPT-4o, Google Gemini, Google Gemini Advanced, and Microsoft Copilot.多种大语言模型与绝经后骨质疏松症临床指南的对比:ChatGPT-3.5、ChatGPT-4.0、ChatGPT-4o、谷歌Gemini、谷歌Gemini Advanced和微软Copilot的比较研究
Arch Osteoporos. 2025 Sep 8;20(1):120. doi: 10.1007/s11657-025-01587-4.
2
Applications of large language models in cardiovascular disease: a systematic review.大语言模型在心血管疾病中的应用:一项系统综述
Eur Heart J Digit Health. 2025 Apr 1;6(4):540-553. doi: 10.1093/ehjdh/ztaf028. eCollection 2025 Jul.
3
Evaluation of a retrieval-augmented generation system using a Japanese Institutional Nuclear Medicine Manual and large language model-automated scoring.
使用日本机构核医学手册和大语言模型自动评分对检索增强生成系统进行评估。
Radiol Phys Technol. 2025 Jul 19. doi: 10.1007/s12194-025-00941-y.
4
Large Language Models for Chatbot Health Advice Studies: A Systematic Review.用于聊天机器人健康建议研究的大语言模型:一项系统综述。
JAMA Netw Open. 2025 Feb 3;8(2):e2457879. doi: 10.1001/jamanetworkopen.2024.57879.
5
Correspondence on "Optimizing ChatGPT's Performance in Hypertension Care".关于“优化ChatGPT在高血压护理中的表现”的通信
J Clin Hypertens (Greenwich). 2025 Jan;27(1):e70001. doi: 10.1111/jch.70001.
6
Performance of Artificial Intelligence Chatbots on Ultrasound Examinations: Cross-Sectional Comparative Analysis.人工智能聊天机器人在超声检查中的表现:横断面比较分析。
JMIR Med Inform. 2025 Jan 9;13:e63924. doi: 10.2196/63924.
7
Exploring ChatGPT in clinical inquiry: a scoping review of characteristics, applications, challenges, and evaluation.探索临床问诊中的ChatGPT:特征、应用、挑战及评估的范围综述
Ann Med Surg (Lond). 2024 Nov 8;86(12):7094-7104. doi: 10.1097/MS9.0000000000002716. eCollection 2024 Dec.
8
Analyzing evaluation methods for large language models in the medical field: a scoping review.分析医学领域大语言模型的评价方法:范围综述。
BMC Med Inform Decis Mak. 2024 Nov 29;24(1):366. doi: 10.1186/s12911-024-02709-7.
9
Can Large Language Models Help Healthcare?大语言模型能助力医疗保健吗?
J Atheroscler Thromb. 2025 May 1;32(5):560-562. doi: 10.5551/jat.ED273. Epub 2024 Nov 26.
10
Assessing the accuracy and consistency of answers by ChatGPT to questions regarding carbon monoxide poisoning.评估 ChatGPT 对一氧化碳中毒相关问题回答的准确性和一致性。
PLoS One. 2024 Nov 20;19(11):e0311937. doi: 10.1371/journal.pone.0311937. eCollection 2024.