• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

DRISEE高估了宏基因组测序数据中的误差。

DRISEE overestimates errors in metagenomic sequencing data.

作者信息

Eren A Murat, Morrison Hilary G, Huse Susan M, Sogin Mitchell L

出版信息

Brief Bioinform. 2014 Sep;15(5):783-7. doi: 10.1093/bib/bbt010. Epub 2013 May 22.

DOI:10.1093/bib/bbt010
PMID:23698723
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4171678/
Abstract

The extremely high error rates reported by Keegan et al. in 'A platform-independent method for detecting errors in metagenomic sequencing data: DRISEE' (PLoS Comput Biol 2012; 8: :e1002541) for many next-generation sequencing datasets prompted us to re-examine their results. Our analysis reveals that the presence of conserved artificial sequences, e.g. Illumina adapters, and other naturally occurring sequence motifs accounts for most of the reported errors. We conclude that DRISEE reports inflated levels of sequencing error, particularly for Illumina data. Tools offered for evaluating large datasets need scrupulous review before they are implemented.

摘要

基冈等人在《一种用于检测宏基因组测序数据中错误的平台无关方法:DRISEE》(《公共科学图书馆·计算生物学》2012年;8:e1002541)中报告的许多下一代测序数据集的极高错误率促使我们重新审视他们的结果。我们的分析表明,保守人工序列(如Illumina接头)和其他天然存在的序列基序的存在是报告的大多数错误的原因。我们得出结论,DRISEE报告的测序错误水平过高,尤其是对于Illumina数据。在实施用于评估大型数据集的工具之前,需要进行严格审查。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/3845df063f50/bbt010f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/7084ca07a982/bbt010f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/5c25848cee06/bbt010f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/3845df063f50/bbt010f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/7084ca07a982/bbt010f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/5c25848cee06/bbt010f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/55a0/4171678/3845df063f50/bbt010f3p.jpg

相似文献

1
DRISEE overestimates errors in metagenomic sequencing data.DRISEE高估了宏基因组测序数据中的误差。
Brief Bioinform. 2014 Sep;15(5):783-7. doi: 10.1093/bib/bbt010. Epub 2013 May 22.
2
A platform-independent method for detecting errors in metagenomic sequencing data: DRISEE.一种用于检测宏基因组测序数据中错误的与平台无关的方法:DRISEE。
PLoS Comput Biol. 2012;8(6):e1002541. doi: 10.1371/journal.pcbi.1002541. Epub 2012 Jun 7.
3
The effect of sequencing errors on metagenomic gene prediction.测序错误对宏基因组基因预测的影响。
BMC Genomics. 2009 Nov 12;10:520. doi: 10.1186/1471-2164-10-520.
4
Direct comparisons of Illumina vs. Roche 454 sequencing technologies on the same microbial community DNA sample.Illumina 与 Roche 454 测序技术在同一微生物群落 DNA 样本上的直接比较。
PLoS One. 2012;7(2):e30087. doi: 10.1371/journal.pone.0030087. Epub 2012 Feb 10.
5
Scalable metagenomics alignment research tool (SMART): a scalable, rapid, and complete search heuristic for the classification of metagenomic sequences from complex sequence populations.可扩展宏基因组比对研究工具(SMART):一种用于对复杂序列群体中的宏基因组序列进行分类的可扩展、快速且完整的搜索启发式方法。
BMC Bioinformatics. 2016 Jul 28;17:292. doi: 10.1186/s12859-016-1159-6.
6
WebMGA: a customizable web server for fast metagenomic sequence analysis.WebMGA:一个可定制的快速宏基因组序列分析网络服务器。
BMC Genomics. 2011 Sep 7;12:444. doi: 10.1186/1471-2164-12-444.
7
Assessment of metagenomic assembly using simulated next generation sequencing data.基于模拟下一代测序数据的宏基因组组装评估。
PLoS One. 2012;7(2):e31386. doi: 10.1371/journal.pone.0031386. Epub 2012 Feb 23.
8
Small RNA Profiling by Next-Generation Sequencing Using High-Definition Adapters.使用高清衔接子通过新一代测序进行小RNA分析
Methods Mol Biol. 2017;1580:45-57. doi: 10.1007/978-1-4939-6866-4_4.
9
Clinical Metagenomic Next-Generation Sequencing for Pathogen Detection.临床宏基因组下一代测序在病原体检测中的应用。
Annu Rev Pathol. 2019 Jan 24;14:319-338. doi: 10.1146/annurev-pathmechdis-012418-012751. Epub 2018 Oct 24.
10
Improving the sensitivity of long read overlap detection using grouped short k-mer matches.利用分组短 k-mer 匹配提高长读重叠检测的灵敏度。
BMC Genomics. 2019 Apr 4;20(Suppl 2):190. doi: 10.1186/s12864-019-5475-x.

引用本文的文献

1
ReSeq simulates realistic Illumina high-throughput sequencing data.ReSeq 模拟真实的 Illumina 高通量测序数据。
Genome Biol. 2021 Feb 19;22(1):67. doi: 10.1186/s13059-021-02265-7.
2
Co-registered Geochemistry and Metatranscriptomics Reveal Unexpected Distributions of Microbial Activity within a Hydrothermal Vent Field.联合注册的地球化学和宏转录组学揭示了热液喷口场内微生物活动的意外分布。
Front Microbiol. 2017 Jun 13;8:1042. doi: 10.3389/fmicb.2017.01042. eCollection 2017.
3
Fragmentation and Coverage Variation in Viral Metagenome Assemblies, and Their Effect in Diversity Calculations.

本文引用的文献

1
Quality-filtering vastly improves diversity estimates from Illumina amplicon sequencing.质量过滤极大地提高了 Illumina 扩增子测序的多样性估计。
Nat Methods. 2013 Jan;10(1):57-9. doi: 10.1038/nmeth.2276. Epub 2012 Dec 2.
2
Denoising PCR-amplified metagenome data.对 PCR 扩增的宏基因组数据进行去噪。
BMC Bioinformatics. 2012 Oct 31;13:283. doi: 10.1186/1471-2105-13-283.
3
Estimation of sequencing error rates in short reads.短读测序错误率的估计。
病毒宏基因组组装中的碎片化和覆盖度变化,及其对多样性计算的影响。
Front Bioeng Biotechnol. 2015 Sep 17;3:141. doi: 10.3389/fbioe.2015.00141. eCollection 2015.
BMC Bioinformatics. 2012 Jul 30;13:185. doi: 10.1186/1471-2105-13-185.
4
A platform-independent method for detecting errors in metagenomic sequencing data: DRISEE.一种用于检测宏基因组测序数据中错误的与平台无关的方法:DRISEE。
PLoS Comput Biol. 2012;8(6):e1002541. doi: 10.1371/journal.pcbi.1002541. Epub 2012 Jun 7.
5
BIGpre: a quality assessment package for next-generation sequencing data.BIGpre:下一代测序数据的质量评估包。
Genomics Proteomics Bioinformatics. 2011 Dec;9(6):238-44. doi: 10.1016/S1672-0229(11)60027-2.
6
Identification and correction of systematic error in high-throughput sequence data.高通量测序数据中系统误差的识别与校正。
BMC Bioinformatics. 2011 Nov 21;12:451. doi: 10.1186/1471-2105-12-451.
7
Evaluation of genomic high-throughput sequencing data generated on Illumina HiSeq and genome analyzer systems.Illumina HiSeq 和基因组分析仪系统生成的基因组高通量测序数据评估。
Genome Biol. 2011 Nov 8;12(11):R112. doi: 10.1186/gb-2011-12-11-r112.
8
ConDeTri--a content dependent read trimmer for Illumina data.ConDeTri——一个用于 Illumina 数据的基于内容的读修剪器。
PLoS One. 2011;6(10):e26314. doi: 10.1371/journal.pone.0026314. Epub 2011 Oct 19.
9
SAMQA: error classification and validation of high-throughput sequenced read data.SAMQA:高通量测序读段数据的错误分类和验证。
BMC Genomics. 2011 Aug 18;12:419. doi: 10.1186/1471-2164-12-419.
10
Error correction of high-throughput sequencing datasets with non-uniform coverage.利用非均匀覆盖的高通量测序数据集进行纠错。
Bioinformatics. 2011 Jul 1;27(13):i137-41. doi: 10.1093/bioinformatics/btr208.