• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

初级转录本对临床和非临床基因组学界的价值:调查结果和改进路线图。

The value of primary transcripts to the clinical and non-clinical genomics community: Survey results and roadmap for improvements.

机构信息

European Molecular Biology Laboratory, European Bioinformatics Institute, Wellcome Genome Campus, Hinxton, Cambridge, United Kingdom.

出版信息

Mol Genet Genomic Med. 2021 Dec;9(12):e1786. doi: 10.1002/mgg3.1786. Epub 2021 Aug 26.

DOI:10.1002/mgg3.1786
PMID:34435752
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8683622/
Abstract

BACKGROUND

Variant interpretation is dependent on transcript annotation and remains time consuming and challenging. There are major obstacles for historical data reuse and for interpretation of new variants. First, both RefSeq and Ensembl/GENCODE produce transcript sets in common use, but there is currently no easy way to translate between the two. Second, the resources often used for variant interpretation (e.g. ClinVar, gnomAD, UniProt) do not use the same transcript set, nor default transcript or protein sequence.

METHOD

Ensembl ran a survey in 2018 to sample attitudes to choosing one default transcript per locus, and to gather data on reference sequences used by the scientific community. This was publicised on the Ensembl and UCSC genome browsers, by email and on social media.

RESULTS

The survey had 788 responses from 32 different countries, the results of which we report here.

CONCLUSIONS

We present our roadmap to create an effective default set of transcripts for resources, and for reporting interpretation of clinical variants.

摘要

背景

变体解释依赖于转录本注释,仍然耗时且具有挑战性。历史数据的重复使用和新变体的解释存在重大障碍。首先,RefSeq 和 Ensembl/GENCODE 都生成常用的转录本集,但目前没有简便的方法在两者之间进行转换。其次,变体解释常用的资源(例如 ClinVar、gnomAD、UniProt)不使用相同的转录本集,也没有默认的转录本或蛋白质序列。

方法

Ensembl 在 2018 年进行了一项调查,以抽样选择每个基因座的一个默认转录本的态度,并收集有关科学界使用的参考序列的数据。该调查在 Ensembl 和 UCSC 基因组浏览器、电子邮件和社交媒体上进行了宣传。

结果

该调查收到了来自 32 个不同国家的 788 份回复,我们在此报告这些回复的结果。

结论

我们提出了创建资源和报告临床变体解释的有效默认转录本集的路线图。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/16cb2f6bd3c6/MGG3-9-e1786-g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/91862a1cee69/MGG3-9-e1786-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/33037d31667a/MGG3-9-e1786-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/caf74af015c1/MGG3-9-e1786-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/16cb2f6bd3c6/MGG3-9-e1786-g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/91862a1cee69/MGG3-9-e1786-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/33037d31667a/MGG3-9-e1786-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/caf74af015c1/MGG3-9-e1786-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e20d/8683622/16cb2f6bd3c6/MGG3-9-e1786-g005.jpg

相似文献

1
The value of primary transcripts to the clinical and non-clinical genomics community: Survey results and roadmap for improvements.初级转录本对临床和非临床基因组学界的价值:调查结果和改进路线图。
Mol Genet Genomic Med. 2021 Dec;9(12):e1786. doi: 10.1002/mgg3.1786. Epub 2021 Aug 26.
2
A joint NCBI and EMBL-EBI transcript set for clinical genomics and research.临床基因组学和研究用的 NCBI 和 EMBL-EBI 联合转录本集。
Nature. 2022 Apr;604(7905):310-315. doi: 10.1038/s41586-022-04558-8. Epub 2022 Apr 6.
3
Comparison of GENCODE and RefSeq gene annotation and the impact of reference geneset on variant effect prediction.GENCODE与RefSeq基因注释的比较以及参考基因集对变异效应预测的影响。
BMC Genomics. 2015;16 Suppl 8(Suppl 8):S2. doi: 10.1186/1471-2164-16-S8-S2. Epub 2015 Jun 18.
4
GENCODE: reference annotation for the human and mouse genomes in 2023.GENCODE:2023 年人类和小鼠基因组的参考注释。
Nucleic Acids Res. 2023 Jan 6;51(D1):D942-D949. doi: 10.1093/nar/gkac1071.
5
AceView: a comprehensive cDNA-supported gene and transcripts annotation.AceView:一个由cDNA支持的全面的基因和转录本注释。
Genome Biol. 2006;7 Suppl 1(Suppl 1):S12.1-14. doi: 10.1186/gb-2006-7-s1-s12. Epub 2006 Aug 7.
6
GENCODE: the reference human genome annotation for The ENCODE Project.GENCODE:ENCODE 项目的人类参考基因组注释。
Genome Res. 2012 Sep;22(9):1760-74. doi: 10.1101/gr.135350.111.
7
GENCODE 2021.GENCODE 2021.
Nucleic Acids Res. 2021 Jan 8;49(D1):D916-D923. doi: 10.1093/nar/gkaa1087.
8
Annotating and prioritizing genomic variants using the Ensembl Variant Effect Predictor-A tutorial.使用 Ensembl Variant Effect Predictor 注释和优先排序基因组变体——教程。
Hum Mutat. 2022 Aug;43(8):986-997. doi: 10.1002/humu.24298. Epub 2021 Dec 2.
9
The UCSC Genome Browser database: 2021 update.UCSC 基因组浏览器数据库:2021 年更新。
Nucleic Acids Res. 2021 Jan 8;49(D1):D1046-D1057. doi: 10.1093/nar/gkaa1070.
10
GENCODE: producing a reference annotation for ENCODE.GENCODE:为ENCODE生成参考注释。
Genome Biol. 2006;7 Suppl 1(Suppl 1):S4.1-9. doi: 10.1186/gb-2006-7-s1-s4. Epub 2006 Aug 7.

引用本文的文献

1
BioRels' data infrastructure: a scientific schema and exchange standard to transform and enhance biological data sciences.生物关系数据基础设施:一种用于转换和增强生物数据科学的科学架构与交换标准。
Nucleic Acids Res. 2025 Mar 20;53(6). doi: 10.1093/nar/gkaf254.
2
Bioinformatics of germline variant discovery for rare disease diagnostics: current approaches and remaining challenges.用于罕见病诊断的种系变异发现的生物信息学:当前方法与尚存挑战
Brief Bioinform. 2024 Jan 22;25(2). doi: 10.1093/bib/bbad508.
3
A joint NCBI and EMBL-EBI transcript set for clinical genomics and research.

本文引用的文献

1
GENCODE 2021.GENCODE 2021.
Nucleic Acids Res. 2021 Jan 8;49(D1):D916-D923. doi: 10.1093/nar/gkaa1087.
2
Ensembl 2021.Ensembl 2021.
Nucleic Acids Res. 2021 Jan 8;49(D1):D884-D891. doi: 10.1093/nar/gkaa942.
3
The Human Gene Mutation Database (HGMD): optimizing its use in a clinical diagnostic or research setting.人类基因突变数据库(HGMD):优化其在临床诊断或研究环境中的使用。
临床基因组学和研究用的 NCBI 和 EMBL-EBI 联合转录本集。
Nature. 2022 Apr;604(7905):310-315. doi: 10.1038/s41586-022-04558-8. Epub 2022 Apr 6.
4
Ensembl 2022.Ensembl 2022.
Nucleic Acids Res. 2022 Jan 7;50(D1):D988-D995. doi: 10.1093/nar/gkab1049.
Hum Genet. 2020 Oct;139(10):1197-1207. doi: 10.1007/s00439-020-02199-3. Epub 2020 Jun 28.
4
The mutational constraint spectrum quantified from variation in 141,456 humans.从 141456 名人类个体的变异中量化的突变约束谱。
Nature. 2020 May;581(7809):434-443. doi: 10.1038/s41586-020-2308-7. Epub 2020 May 27.
5
Consensus coding sequence (CCDS) database: a standardized set of human and mouse protein-coding regions supported by expert curation.共识编码序列(CCDS)数据库:一组由专家管理的标准化人类和小鼠蛋白编码区。
Nucleic Acids Res. 2018 Jan 4;46(D1):D221-D228. doi: 10.1093/nar/gkx1031.
6
Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly.对GRCh38和从头单倍体基因组组装的评估证明了参考组装的持久质量。
Genome Res. 2017 May;27(5):849-864. doi: 10.1101/gr.213611.116. Epub 2017 Apr 10.
7
The UCSC Genome Browser database: 2017 update.加州大学圣克鲁兹分校基因组浏览器数据库:2017年更新版
Nucleic Acids Res. 2017 Jan 4;45(D1):D626-D634. doi: 10.1093/nar/gkw1134. Epub 2016 Nov 29.
8
UniProt: the universal protein knowledgebase.通用蛋白质知识库:UniProt
Nucleic Acids Res. 2017 Jan 4;45(D1):D158-D169. doi: 10.1093/nar/gkw1099. Epub 2016 Nov 29.
9
Analysis of protein-coding genetic variation in 60,706 humans.对60706名人类的蛋白质编码基因变异进行分析。
Nature. 2016 Aug 18;536(7616):285-91. doi: 10.1038/nature19057.
10
HGVS Recommendations for the Description of Sequence Variants: 2016 Update.《人类基因组变异协会(HGVS)序列变异描述建议:2016年更新》
Hum Mutat. 2016 Jun;37(6):564-9. doi: 10.1002/humu.22981. Epub 2016 Mar 25.