• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ChatGPT 3.5 和 ChatGPT 4 在回答选定遗传学问题方面的比较评估。

A comparative evaluation of ChatGPT 3.5 and ChatGPT 4 in responses to selected genetics questions.

机构信息

CITRIS Health, University of California Berkeley, Berkeley, CA 94720-1764, United States.

Laboratory of Vascular and Matrix Genetics, National Heart, Lung, and Blood Institute (NHLBI), Bethesda, MD 20892, United States.

出版信息

J Am Med Inform Assoc. 2024 Oct 1;31(10):2271-2283. doi: 10.1093/jamia/ocae128.

DOI:10.1093/jamia/ocae128
PMID:38872284
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11413464/
Abstract

OBJECTIVES

To evaluate the efficacy of ChatGPT 4 (GPT-4) in delivering genetic information about BRCA1, HFE, and MLH1, building on previous findings with ChatGPT 3.5 (GPT-3.5). To focus on assessing the utility, limitations, and ethical implications of using ChatGPT in medical settings.

MATERIALS AND METHODS

A structured survey was developed to assess GPT-4's clinical value. An expert panel of genetic counselors and clinical geneticists evaluated GPT-4's responses to these questions. We also performed comparative analysis with GPT-3.5, utilizing descriptive statistics and using Prism 9 for data analysis.

RESULTS

The findings indicate improved accuracy in GPT-4 over GPT-3.5 (P < .0001). However, notable errors in accuracy remained. The relevance of responses varied in GPT-4, but was generally favorable, with a mean in the "somewhat agree" range. There was no difference in performance by disease category. The 7-question subset of the Bot Usability Scale (BUS-15) showed no statistically significant difference between the groups but trended lower in the GPT-4 version.

DISCUSSION AND CONCLUSION

The study underscores GPT-4's potential role in genetic education, showing notable progress yet facing challenges like outdated information and the necessity of ongoing refinement. Our results, while showing promise, emphasizes the importance of balancing technological innovation with ethical responsibility in healthcare information delivery.

摘要

目的

评估 ChatGPT 4(GPT-4)在传递 BRCA1、HFE 和 MLH1 遗传信息方面的效果,这是基于之前对 ChatGPT 3.5(GPT-3.5)的研究结果。重点评估在医疗环境中使用 ChatGPT 的实用性、局限性和伦理影响。

材料和方法

开发了一个结构化调查来评估 GPT-4 的临床价值。一个由遗传咨询师和临床遗传学家组成的专家小组评估了 GPT-4 对这些问题的回答。我们还使用描述性统计和 Prism 9 进行数据分析,对 GPT-3.5 进行了比较分析。

结果

研究结果表明 GPT-4 的准确性优于 GPT-3.5(P < .0001)。然而,准确性仍存在明显错误。GPT-4 的响应相关性有所不同,但总体上是有利的,平均处于“有些同意”的范围。疾病类别对性能没有影响。Bot 可用性量表(BUS-15)的 7 个问题子集在两组之间没有统计学上的显著差异,但在 GPT-4 版本中呈下降趋势。

讨论和结论

该研究强调了 GPT-4 在遗传教育中的潜在作用,显示出显著的进展,但仍面临挑战,如信息过时和需要不断改进。我们的结果虽然有希望,但强调了在医疗保健信息传递中平衡技术创新与伦理责任的重要性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/3f8299145a02/ocae128f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/9fabf3d6e187/ocae128f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/5eeaea301752/ocae128f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/3f8299145a02/ocae128f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/9fabf3d6e187/ocae128f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/5eeaea301752/ocae128f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4900/11413464/3f8299145a02/ocae128f3.jpg

相似文献

1
A comparative evaluation of ChatGPT 3.5 and ChatGPT 4 in responses to selected genetics questions.ChatGPT 3.5 和 ChatGPT 4 在回答选定遗传学问题方面的比较评估。
J Am Med Inform Assoc. 2024 Oct 1;31(10):2271-2283. doi: 10.1093/jamia/ocae128.
2
Exploring the use of ChatGPT/GPT-4 for patient follow-up after oral surgeries.探讨使用 ChatGPT/GPT-4 进行口腔手术后的患者随访。
Int J Oral Maxillofac Surg. 2024 Oct;53(10):867-872. doi: 10.1016/j.ijom.2024.04.002. Epub 2024 Apr 24.
3
The Rapid Development of Artificial Intelligence: GPT-4's Performance on Orthopedic Surgery Board Questions.人工智能的快速发展:GPT-4 在骨科手术委员会问题上的表现。
Orthopedics. 2024 Mar-Apr;47(2):e85-e89. doi: 10.3928/01477447-20230922-05. Epub 2023 Sep 27.
4
Performance of ChatGPT Across Different Versions in Medical Licensing Examinations Worldwide: Systematic Review and Meta-Analysis.ChatGPT 在全球医学执照考试不同版本中的表现:系统评价和荟萃分析。
J Med Internet Res. 2024 Jul 25;26:e60807. doi: 10.2196/60807.
5
Assessing GPT-4's Performance in Delivering Medical Advice: Comparative Analysis With Human Experts.评估 GPT-4 提供医疗建议的表现:与人类专家的比较分析。
JMIR Med Educ. 2024 Jul 8;10:e51282. doi: 10.2196/51282.
6
Performance of ChatGPT in the In-Training Examination for Anesthesiology and Pain Medicine Residents in South Korea: Observational Study.ChatGPT在韩国麻醉学与疼痛医学住院医师培训考试中的表现:观察性研究
JMIR Med Educ. 2024 Sep 16;10:e56859. doi: 10.2196/56859.
7
Performance evaluation of ChatGPT, GPT-4, and Bard on the official board examination of the Japan Radiology Society.ChatGPT、GPT-4 和 Bard 在日本放射学会官方董事会考试中的表现评估。
Jpn J Radiol. 2024 Feb;42(2):201-207. doi: 10.1007/s11604-023-01491-2. Epub 2023 Oct 4.
8
Efficacy of ChatGPT in Cantonese Sentiment Analysis: Comparative Study.ChatGPT 在粤语情感分析中的有效性:对比研究。
J Med Internet Res. 2024 Jan 30;26:e51069. doi: 10.2196/51069.
9
Artificial Intelligence in Ophthalmology: A Comparative Analysis of GPT-3.5, GPT-4, and Human Expertise in Answering StatPearls Questions.眼科中的人工智能:GPT-3.5、GPT-4与人类专家回答StatPearls问题的比较分析
Cureus. 2023 Jun 22;15(6):e40822. doi: 10.7759/cureus.40822. eCollection 2023 Jun.
10
Performance of ChatGPT, GPT-4, and Google Bard on a Neurosurgery Oral Boards Preparation Question Bank.ChatGPT、GPT-4和谷歌巴德在神经外科口试准备题库上的表现。
Neurosurgery. 2023 Nov 1;93(5):1090-1098. doi: 10.1227/neu.0000000000002551. Epub 2023 Jun 12.

引用本文的文献

1
A comparative analysis of machine learning models and human expertise for nursing intervention classification.用于护理干预分类的机器学习模型与人类专业知识的比较分析。
JAMIA Open. 2025 Jun 27;8(3):ooaf057. doi: 10.1093/jamiaopen/ooaf057. eCollection 2025 Jun.
2
Evaluation of Large Language Model Performance in Answering Clinical Questions on Periodontal Furcation Defect Management.大语言模型在回答牙周根分叉病变管理临床问题中的性能评估
Dent J (Basel). 2025 Jun 18;13(6):271. doi: 10.3390/dj13060271.
3
Chatbot for the Return of Positive Genetic Screening Results for Hereditary Cancer Syndromes: Prompt Engineering Project.

本文引用的文献

1
Empowering personalized pharmacogenomics with generative AI solutions.利用生成式人工智能解决方案增强个性化药物基因组学。
J Am Med Inform Assoc. 2024 May 20;31(6):1356-1366. doi: 10.1093/jamia/ocae039.
2
Enabling the clinical application of artificial intelligence in genomics: a perspective of the AMIA Genomics and Translational Bioinformatics Workgroup.推动人工智能在基因组学中的临床应用:AMIA 基因组学和转化生物信息学工作组的观点。
J Am Med Inform Assoc. 2024 Jan 18;31(2):536-541. doi: 10.1093/jamia/ocad211.
3
Machines and empathy in medicine.
遗传性癌症综合征阳性基因筛查结果返回的聊天机器人:提示工程设计项目
JMIR Cancer. 2025 Jun 10;11:e65848. doi: 10.2196/65848.
4
Artificial intelligence in clinical genetics.临床遗传学中的人工智能
Eur J Hum Genet. 2025 Mar;33(3):281-288. doi: 10.1038/s41431-024-01782-w. Epub 2025 Jan 13.
5
Diagnostic Accuracy of a Custom Large Language Model on Rare Pediatric Disease Case Reports.定制大语言模型对罕见儿科疾病病例报告的诊断准确性
Am J Med Genet A. 2025 Feb;197(2):e63878. doi: 10.1002/ajmg.a.63878. Epub 2024 Sep 13.
6
Chatbot for the Return of Positive Genetic Screening Results for Hereditary Cancer Syndromes: a Prompt Engineering Study.用于遗传性癌症综合征阳性基因筛查结果反馈的聊天机器人:一项提示工程研究
Res Sq. 2024 Aug 29:rs.3.rs-4986527. doi: 10.21203/rs.3.rs-4986527/v1.
医学中的机器与同理心。
Lancet. 2023 Oct 21;402(10411):1411. doi: 10.1016/S0140-6736(23)02292-4.
4
Using ChatGPT to predict the future of personalized medicine.利用 ChatGPT 预测个性化医学的未来。
Pharmacogenomics J. 2023 Nov;23(6):178-184. doi: 10.1038/s41397-023-00316-9. Epub 2023 Sep 19.
5
Large language models in medicine.医学中的大型语言模型。
Nat Med. 2023 Aug;29(8):1930-1940. doi: 10.1038/s41591-023-02448-8. Epub 2023 Jul 17.
6
The imperative for regulatory oversight of large language models (or generative AI) in healthcare.对医疗保健领域的大语言模型(或生成式人工智能)进行监管监督的必要性。
NPJ Digit Med. 2023 Jul 6;6(1):120. doi: 10.1038/s41746-023-00873-0.
7
Can ChatGPT understand genetics?ChatGPT能理解遗传学吗?
Eur J Hum Genet. 2024 Apr;32(4):371-372. doi: 10.1038/s41431-023-01419-4. Epub 2023 Jul 5.
8
Analysis of large-language model versus human performance for genetics questions.大语言模型与人类在遗传学问题表现上的分析。
Eur J Hum Genet. 2024 Apr;32(4):466-468. doi: 10.1038/s41431-023-01396-8. Epub 2023 May 29.
9
ChatGPT and the rise of large language models: the new AI-driven infodemic threat in public health.ChatGPT 和大型语言模型的兴起:公共卫生领域新的 AI 驱动的信息疫情威胁。
Front Public Health. 2023 Apr 25;11:1166120. doi: 10.3389/fpubh.2023.1166120. eCollection 2023.
10
Trends in Availability of Genetic Tests in the United States, 2012-2022.2012 - 2022年美国基因检测的可及性趋势
J Pers Med. 2023 Apr 6;13(4):638. doi: 10.3390/jpm13040638.