• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在单细胞RNA测序分析中使用GPT-4进行无参考且经济高效的自动细胞类型注释。

Reference-free and cost-effective automated cell type annotation with GPT-4 in single-cell RNA-seq analysis.

作者信息

Hou Wenpin, Ji Zhicheng

机构信息

Department of Biostatistics, The Mailman School of Public Health, Columbia University, New York City, NY, USA.

Department of Biostatistics and Bioinformatics, Duke University School of Medicine, Durham, NC, USA.

出版信息

Res Sq. 2023 May 2:rs.3.rs-2824971. doi: 10.21203/rs.3.rs-2824971/v1.

DOI:10.21203/rs.3.rs-2824971/v1
PMID:37205379
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10187429/
Abstract

Cell type annotation is an essential step in single-cell RNA-seq analysis. However, it is a time-consuming process that often requires expertise in collecting canonical marker genes and manually annotating cell types. Automated cell type annotation methods typically require the acquisition of high-quality reference datasets and the development of additional pipelines. We demonstrate that GPT-4, a highly potent large language model, can automatically and accurately annotate cell types by utilizing marker gene information generated from standard single-cell RNA-seq analysis pipelines. Evaluated across hundreds of tissue types and cell types, GPT-4 generates cell type annotations exhibiting strong concordance with manual annotations, and has the potential to considerably reduce the effort and expertise needed in cell type annotation.

摘要

细胞类型注释是单细胞RNA测序分析中的一个重要步骤。然而,这是一个耗时的过程,通常需要收集标准标记基因和手动注释细胞类型方面的专业知识。自动化细胞类型注释方法通常需要获取高质量的参考数据集并开发额外的流程。我们证明,GPT-4,一种功能强大的大语言模型,可以通过利用标准单细胞RNA测序分析流程生成的标记基因信息自动且准确地注释细胞类型。在数百种组织类型和细胞类型上进行评估,GPT-4生成的细胞类型注释与手动注释具有很强的一致性,并且有潜力大幅减少细胞类型注释所需的工作量和专业知识。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c2c4/10187429/5bf1b0a6eb40/nihpp-rs2824971v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c2c4/10187429/e3b201cf132a/nihpp-rs2824971v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c2c4/10187429/5bf1b0a6eb40/nihpp-rs2824971v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c2c4/10187429/e3b201cf132a/nihpp-rs2824971v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c2c4/10187429/5bf1b0a6eb40/nihpp-rs2824971v1-f0002.jpg

相似文献

1
Reference-free and cost-effective automated cell type annotation with GPT-4 in single-cell RNA-seq analysis.在单细胞RNA测序分析中使用GPT-4进行无参考且经济高效的自动细胞类型注释。
Res Sq. 2023 May 2:rs.3.rs-2824971. doi: 10.21203/rs.3.rs-2824971/v1.
2
Assessing GPT-4 for cell type annotation in single-cell RNA-seq analysis.在单细胞RNA测序分析中评估GPT-4用于细胞类型注释
bioRxiv. 2023 Dec 13:2023.04.16.537094. doi: 10.1101/2023.04.16.537094.
3
Assessing GPT-4 for cell type annotation in single-cell RNA-seq analysis.在单细胞RNA测序分析中评估GPT-4用于细胞类型注释
Nat Methods. 2024 Aug;21(8):1462-1465. doi: 10.1038/s41592-024-02235-4. Epub 2024 Mar 25.
4
FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences.FINDER:一个自动化软件包,用于从 RNA-Seq 数据和相关蛋白质序列中注释真核基因。
BMC Bioinformatics. 2021 Apr 20;22(1):205. doi: 10.1186/s12859-021-04120-9.
5
TripletCell: a deep metric learning framework for accurate annotation of cell types at the single-cell level.三重细胞:一种用于单细胞水平准确注释细胞类型的深度度量学习框架。
Brief Bioinform. 2023 May 19;24(3). doi: 10.1093/bib/bbad132.
6
scATAnno: Automated Cell Type Annotation for single-cell ATAC Sequencing Data.scATAnno:单细胞ATAC测序数据的自动细胞类型注释
bioRxiv. 2024 Mar 25:2023.06.01.543296. doi: 10.1101/2023.06.01.543296.
7
CodingQuarry: highly accurate hidden Markov model gene prediction in fungal genomes using RNA-seq transcripts.CodingQuarry:利用RNA测序转录本对真菌基因组进行高精度隐马尔可夫模型基因预测。
BMC Genomics. 2015 Mar 11;16(1):170. doi: 10.1186/s12864-015-1344-4.
8
MACA: marker-based automatic cell-type annotation for single-cell expression data.MACA:用于单细胞表达数据的基于标记的自动细胞类型注释
Bioinformatics. 2022 Mar 4;38(6):1756-1760. doi: 10.1093/bioinformatics/btab840.
9
scWizard: A web-based automated tool for classifying and annotating single cells and downstream analysis of single-cell RNA-seq data in cancers.scWizard:一种基于网络的自动化工具,用于对癌症中的单细胞进行分类和注释以及对单细胞RNA测序数据进行下游分析。
Comput Struct Biotechnol J. 2022 Aug 27;20:4902-4909. doi: 10.1016/j.csbj.2022.08.028. eCollection 2022.
10
scMRA: a robust deep learning method to annotate scRNA-seq data with multiple reference datasets.scMRA:一种用于用多个参考数据集注释单细胞RNA测序数据的强大深度学习方法。
Bioinformatics. 2022 Jan 12;38(3):738-745. doi: 10.1093/bioinformatics/btab700.

本文引用的文献

1
Empowering beginners in bioinformatics with ChatGPT.借助ChatGPT助力生物信息学初学者。
Quant Biol. 2023 Jun;11(2):105-108. doi: 10.15302/j-qb-023-0327. Epub 2023 Mar 31.
2
Analysis of large-language model versus human performance for genetics questions.大语言模型与人类在遗传学问题表现上的分析。
Eur J Hum Genet. 2024 Apr;32(4):466-468. doi: 10.1038/s41431-023-01396-8. Epub 2023 May 29.
3
JAK-STAT activation contributes to cytotoxic T cell-mediated basal cell death in human chronic lung allograft dysfunction.JAK-STAT 激活导致人慢性肺移植功能障碍中细胞毒性 T 细胞介导的基底细胞死亡。
JCI Insight. 2023 Mar 22;8(6):e167082. doi: 10.1172/jci.insight.167082.
4
Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models.ChatGPT在美国医师执照考试中的表现:使用大语言模型进行人工智能辅助医学教育的潜力。
PLOS Digit Health. 2023 Feb 9;2(2):e0000198. doi: 10.1371/journal.pdig.0000198. eCollection 2023 Feb.
5
Transformer for one stop interpretable cell type annotation.用于一站式可解释细胞类型注释的 Transformer。
Nat Commun. 2023 Jan 14;14(1):223. doi: 10.1038/s41467-023-35923-4.
6
Single-cell transcriptomics reveals common epithelial response patterns in human acute kidney injury.单细胞转录组学揭示了人类急性肾损伤中常见的上皮细胞反应模式。
Genome Med. 2022 Sep 9;14(1):103. doi: 10.1186/s13073-022-01108-9.
7
Single-nucleus cross-tissue molecular reference maps toward understanding disease gene function.单细胞跨组织分子参考图谱,助力疾病基因功能研究。
Science. 2022 May 13;376(6594):eabl4290. doi: 10.1126/science.abl4290.
8
Fully-automated and ultra-fast cell-type identification using specific marker combinations from single-cell transcriptomic data.利用单细胞转录组数据中的特定标记组合进行全自动超快速细胞类型识别。
Nat Commun. 2022 Mar 10;13(1):1246. doi: 10.1038/s41467-022-28803-w.
9
Unbiased visualization of single-cell genomic data with SCUBI.使用 SCUBI 进行单细胞基因组数据的无偏可视化。
Cell Rep Methods. 2022 Jan 24;2(1). doi: 10.1016/j.crmeth.2021.100135. Epub 2022 Jan 4.
10
Transcriptional programs of neoantigen-specific TIL in anti-PD-1-treated lung cancers.抗 PD-1 治疗的肺癌中 neoantigen 特异性 TIL 的转录程序。
Nature. 2021 Aug;596(7870):126-132. doi: 10.1038/s41586-021-03752-4. Epub 2021 Jul 21.