• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基因注释偏差阻碍了生物医学研究。

Gene annotation bias impedes biomedical research.

机构信息

Stanford Institute for Immunity, Transplantation, and Infection, Stanford University, Stanford, California, USA.

Stanford Center for Biomedical Informatics Research, Department of Medicine, Stanford University, Stanford, California, USA.

出版信息

Sci Rep. 2018 Jan 22;8(1):1362. doi: 10.1038/s41598-018-19333-x.

DOI:10.1038/s41598-018-19333-x
PMID:29358745
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5778030/
Abstract

We found tremendous inequality across gene and protein annotation resources. We observed that this bias leads biomedical researchers to focus on richly annotated genes instead of those with the strongest molecular data. We advocate that researchers reduce these biases by pursuing data-driven hypotheses.

摘要

我们发现基因和蛋白质注释资源存在巨大的不平等现象。我们观察到,这种偏见导致生物医学研究人员专注于注释丰富的基因,而不是那些具有最强分子数据的基因。我们主张研究人员通过追求数据驱动的假设来减少这些偏见。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/542c/5778030/e7a60f9950d3/41598_2018_19333_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/542c/5778030/d34a3041cbf2/41598_2018_19333_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/542c/5778030/e7a60f9950d3/41598_2018_19333_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/542c/5778030/d34a3041cbf2/41598_2018_19333_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/542c/5778030/e7a60f9950d3/41598_2018_19333_Fig2_HTML.jpg

相似文献

1
Gene annotation bias impedes biomedical research.基因注释偏差阻碍了生物医学研究。
Sci Rep. 2018 Jan 22;8(1):1362. doi: 10.1038/s41598-018-19333-x.
2
The GATO gene annotation tool for research laboratories.面向研究实验室的GATO基因注释工具。
Braz J Med Biol Res. 2005 Nov;38(11):1571-4. doi: 10.1590/s0100-879x2005001100002. Epub 2005 Oct 26.
3
A variant by any name: quantifying annotation discordance across tools and clinical databases.无论名称如何的变体:量化不同工具和临床数据库之间的注释不一致性。
Genome Med. 2017 Jan 26;9(1):7. doi: 10.1186/s13073-016-0396-7.
4
Gene name errors: Lessons not learned.基因名称错误:未吸取教训。
PLoS Comput Biol. 2021 Jul 30;17(7):e1008984. doi: 10.1371/journal.pcbi.1008984. eCollection 2021 Jul.
5
Evaluating the effect of annotation size on measures of semantic similarity.评估注释大小对语义相似性度量的影响。
J Biomed Semantics. 2017 Feb 13;8(1):7. doi: 10.1186/s13326-017-0119-z.
6
Quantitative biomedical annotation using medical subject heading over-representation profiles (MeSHOPs).基于医学主题词过度表达谱(MeSHOPs)的定量生物医学注释。
BMC Bioinformatics. 2012 Sep 27;13:249. doi: 10.1186/1471-2105-13-249.
7
Exploring and linking biomedical resources through multidimensional semantic spaces.通过多维语义空间探索和链接生物医学资源。
BMC Bioinformatics. 2012 Jan 25;13 Suppl 1(Suppl 1):S6. doi: 10.1186/1471-2105-13-S1-S6.
8
A beginner's guide to eukaryotic genome annotation.真核生物基因组注释入门指南。
Nat Rev Genet. 2012 Apr 18;13(5):329-42. doi: 10.1038/nrg3174.
9
Science mapping analysis characterizes 235 biases in biomedical research.科学图谱分析刻画了生物医学研究中的 235 种偏差。
J Clin Epidemiol. 2010 Nov;63(11):1205-15. doi: 10.1016/j.jclinepi.2009.12.011. Epub 2010 Apr 18.
10
Ten simple rules for annotating sequencing experiments.注释测序实验的十条简单规则。
PLoS Comput Biol. 2020 Oct 5;16(10):e1008260. doi: 10.1371/journal.pcbi.1008260. eCollection 2020 Oct.

引用本文的文献

1
Peptide abundance correlations in metaproteomics enhance taxonomic and functional analysis of the human gut microbiome.宏蛋白质组学中的肽丰度相关性增强了人类肠道微生物群的分类学和功能分析。
NPJ Biofilms Microbiomes. 2025 Aug 19;11(1):166. doi: 10.1038/s41522-025-00801-y.
2
GhostBuster: A Deep-Learning-based, Literature-Unbiased Gene Prioritization Tool for Gene Annotation Prediction.幽灵克星:一种基于深度学习、不受文献偏差影响的用于基因注释预测的基因优先级排序工具。
bioRxiv. 2025 Jun 27:2025.06.22.660948. doi: 10.1101/2025.06.22.660948.
3
Analyzing human gut microbiome data from global populations: challenges and resources.

本文引用的文献

1
Five ways to fix statistics.修正统计数据的五种方法。
Nature. 2017 Nov 30;551(7682):557-559. doi: 10.1038/d41586-017-07522-z.
2
The most popular genes in the human genome.人类基因组中最常见的基因。
Nature. 2017 Nov 23;551(7681):427-431. doi: 10.1038/d41586-017-07291-9.
3
Differential gene expression in disease: a comparison between high-throughput studies and the literature.疾病中的差异基因表达:高通量研究与文献的比较
分析来自全球人群的人类肠道微生物组数据:挑战与资源
Trends Microbiol. 2025 Jun 6. doi: 10.1016/j.tim.2025.05.008.
4
Methodological opportunities in genomic data analysis to advance health equity.基因组数据分析中促进健康公平的方法学机遇。
Nat Rev Genet. 2025 May 15. doi: 10.1038/s41576-025-00839-w.
5
A longitudinal analysis of function annotations of the human proteome reveals consistently high biases.对人类蛋白质组功能注释的纵向分析揭示了始终存在的高度偏差。
Database (Oxford). 2025 May 7;2025. doi: 10.1093/database/baaf036.
6
EvoWeaver: large-scale prediction of gene functional associations from coevolutionary signals.EvoWeaver:基于共进化信号的基因功能关联大规模预测
Nat Commun. 2025 Apr 24;16(1):3878. doi: 10.1038/s41467-025-59175-6.
7
Qarles: a web server for the quick characterization of large sets of genes.Qarles:用于快速表征大量基因集的网络服务器。
NAR Genom Bioinform. 2025 Mar 29;7(2):lqaf030. doi: 10.1093/nargab/lqaf030. eCollection 2025 Jun.
8
A workflow for human health hazard evaluation using transcriptomic data and Key Characteristics-based gene sets.一种使用转录组数据和基于关键特征的基因集进行人类健康危害评估的工作流程。
Toxicol Sci. 2025 Jun 1;205(2):310-325. doi: 10.1093/toxsci/kfaf036.
9
Learning maximally spanning representations improves protein function annotation.学习最大生成表示可改善蛋白质功能注释。
bioRxiv. 2025 Feb 17:2025.02.13.638156. doi: 10.1101/2025.02.13.638156.
10
Properties of "Stable" Mosquito Cytochrome P450 Enzymes.“稳定”的蚊子细胞色素P450酶的特性
Insects. 2025 Feb 8;16(2):184. doi: 10.3390/insects16020184.
BMC Med Genomics. 2017 Oct 11;10(1):59. doi: 10.1186/s12920-017-0293-y.
4
Multicohort analysis reveals baseline transcriptional predictors of influenza vaccination responses.多队列分析揭示了流感疫苗接种反应的基线转录预测指标。
Sci Immunol. 2017 Aug 25;2(14). doi: 10.1126/sciimmunol.aal4656.
5
A PTK7-targeted antibody-drug conjugate reduces tumor-initiating cells and induces sustained tumor regressions.一种靶向 PTK7 的抗体药物偶联物可减少肿瘤起始细胞并诱导持续的肿瘤消退。
Sci Transl Med. 2017 Jan 11;9(372). doi: 10.1126/scitranslmed.aag2611.
6
Integrated, multicohort analysis of systemic sclerosis identifies robust transcriptional signature of disease severity.系统性硬化症的综合多队列分析确定了疾病严重程度的强大转录特征。
JCI Insight. 2016 Dec 22;1(21):e89073. doi: 10.1172/jci.insight.89073.
7
UniProt: the universal protein knowledgebase.通用蛋白质知识库:UniProt
Nucleic Acids Res. 2017 Jan 4;45(D1):D158-D169. doi: 10.1093/nar/gkw1099. Epub 2016 Nov 29.
8
EMPOWERING MULTI-COHORT GENE EXPRESSION ANALYSIS TO INCREASE REPRODUCIBILITY.助力多队列基因表达分析以提高可重复性。
Pac Symp Biocomput. 2017;22:144-153. doi: 10.1142/9789813207813_0015.
9
Methods to increase reproducibility in differential gene expression via meta-analysis.通过荟萃分析提高差异基因表达重现性的方法。
Nucleic Acids Res. 2017 Jan 9;45(1):e1. doi: 10.1093/nar/gkw797. Epub 2016 Sep 14.
10
Robust classification of bacterial and viral infections via integrated host gene expression diagnostics.通过整合宿主基因表达诊断实现细菌和病毒感染的稳健分类。
Sci Transl Med. 2016 Jul 6;8(346):346ra91. doi: 10.1126/scitranslmed.aaf7165.