• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

HiTEC:高通量测序数据中的精确错误校正。

HiTEC: accurate error correction in high-throughput sequencing data.

机构信息

Department of Computer Science, University of Western Ontario, London, ON N6A 5B7, Canada.

出版信息

Bioinformatics. 2011 Feb 1;27(3):295-302. doi: 10.1093/bioinformatics/btq653. Epub 2010 Nov 26.

DOI:10.1093/bioinformatics/btq653
PMID:21115437
Abstract

MOTIVATION

High-throughput sequencing technologies produce very large amounts of data and sequencing errors constitute one of the major problems in analyzing such data. Current algorithms for correcting these errors are not very accurate and do not automatically adapt to the given data.

RESULTS

We present HiTEC, an algorithm that provides a highly accurate, robust and fully automated method to correct reads produced by high-throughput sequencing methods. Our approach provides significantly higher accuracy than previous methods. It is time and space efficient and works very well for all read lengths, genome sizes and coverage levels.

AVAILABILITY

The source code of HiTEC is freely available at www.csd.uwo.ca/~ilie/HiTEC/.

摘要

动机

高通量测序技术产生了大量的数据,而测序错误是分析这些数据时面临的主要问题之一。目前用于纠正这些错误的算法不够准确,也不能自动适应给定的数据。

结果

我们提出了 HiTEC,这是一种能够提供高度准确、稳健和全自动的方法来纠正高通量测序方法产生的读取的算法。我们的方法比以前的方法具有更高的准确性。它在时间和空间上都很高效,并且在所有读取长度、基因组大小和覆盖水平上都能很好地工作。

可用性

HiTEC 的源代码可在 www.csd.uwo.ca/~ilie/HiTEC/ 上免费获得。

相似文献

1
HiTEC: accurate error correction in high-throughput sequencing data.HiTEC:高通量测序数据中的精确错误校正。
Bioinformatics. 2011 Feb 1;27(3):295-302. doi: 10.1093/bioinformatics/btq653. Epub 2010 Nov 26.
2
RACER: Rapid and accurate correction of errors in reads.RACER:快速准确地纠正读取错误。
Bioinformatics. 2013 Oct 1;29(19):2490-3. doi: 10.1093/bioinformatics/btt407. Epub 2013 Jul 12.
3
Blue: correcting sequencing errors using consensus and context.蓝色:使用一致性和上下文来纠正测序错误。
Bioinformatics. 2014 Oct;30(19):2723-32. doi: 10.1093/bioinformatics/btu368. Epub 2014 Jun 11.
4
Correction of sequencing errors in a mixed set of reads.纠正混合读取集中的测序错误。
Bioinformatics. 2010 May 15;26(10):1284-90. doi: 10.1093/bioinformatics/btq151. Epub 2010 Apr 8.
5
SHREC: a short-read error correction method.SHREC:一种短读长错误校正方法。
Bioinformatics. 2009 Sep 1;25(17):2157-63. doi: 10.1093/bioinformatics/btp379. Epub 2009 Jun 19.
6
Correcting errors in short reads by multiple alignments.通过多次比对纠正短读中的错误。
Bioinformatics. 2011 Jun 1;27(11):1455-61. doi: 10.1093/bioinformatics/btr170. Epub 2011 Apr 5.
7
A parallel algorithm for error correction in high-throughput short-read data on CUDA-enabled graphics hardware.一种用于在支持CUDA的图形硬件上对高通量短读数据进行纠错的并行算法。
J Comput Biol. 2010 Apr;17(4):603-15. doi: 10.1089/cmb.2009.0062.
8
In search of perfect reads.寻找完美的读数。
BMC Bioinformatics. 2015;16 Suppl 17(Suppl 17):S7. doi: 10.1186/1471-2105-16-S17-S7. Epub 2015 Dec 7.
9
QuorUM: An Error Corrector for Illumina Reads.QuorUM:Illumina测序读数的纠错工具
PLoS One. 2015 Jun 17;10(6):e0130821. doi: 10.1371/journal.pone.0130821. eCollection 2015.
10
E-MEM: efficient computation of maximal exact matches for very large genomes.E-MEM:高效计算非常大基因组的最大精确匹配。
Bioinformatics. 2015 Feb 15;31(4):509-14. doi: 10.1093/bioinformatics/btu687. Epub 2014 Oct 17.

引用本文的文献

1
Genome sequencing of and its comparative analysis with malacostracan crustaceans.[物种名称]的基因组测序及其与软甲纲甲壳动物的比较分析。 (注:原文中“of”后面缺少具体物种名称)
3 Biotech. 2024 Nov;14(11):276. doi: 10.1007/s13205-024-04121-4. Epub 2024 Oct 23.
2
Fast, parallel, and cache-friendly suffix array construction.快速、并行且缓存友好的后缀数组构造。
Algorithms Mol Biol. 2024 Apr 28;19(1):16. doi: 10.1186/s13015-024-00263-5.
3
Genome sequence assembly algorithms and misassembly identification methods.基因组序列组装算法和错误组装识别方法。
Mol Biol Rep. 2022 Nov;49(11):11133-11148. doi: 10.1007/s11033-022-07919-8. Epub 2022 Sep 23.
4
GAAP: A Genome Assembly + Annotation Pipeline.GAAP:基因组组装与注释流水线。
Biomed Res Int. 2019 Jun 26;2019:4767354. doi: 10.1155/2019/4767354. eCollection 2019.
5
Mining statistically-solid k-mers for accurate NGS error correction.挖掘统计上可靠的 k-mers 以实现准确的 NGS 错误纠正。
BMC Genomics. 2018 Dec 31;19(Suppl 10):912. doi: 10.1186/s12864-018-5272-y.
6
The origin and adaptive evolution of domesticated populations of yeast from Far East Asia.来自东亚的驯化酵母种群的起源和适应性进化。
Nat Commun. 2018 Jul 12;9(1):2690. doi: 10.1038/s41467-018-05106-7.
7
An efficient error correction algorithm using FM-index.一种使用FM索引的高效错误校正算法。
BMC Bioinformatics. 2017 Nov 28;18(1):524. doi: 10.1186/s12859-017-1940-1.
8
DUDE-Seq: Fast, flexible, and robust denoising for targeted amplicon sequencing.DUDE-Seq:用于靶向扩增子测序的快速、灵活且稳健的去噪方法
PLoS One. 2017 Jul 27;12(7):e0181463. doi: 10.1371/journal.pone.0181463. eCollection 2017.
9
From next-generation resequencing reads to a high-quality variant data set.从新一代重测序 reads 到高质量变异数据集。
Heredity (Edinb). 2017 Feb;118(2):111-124. doi: 10.1038/hdy.2016.102. Epub 2016 Oct 19.
10
High-Throughput Sequencing-Based Immune Repertoire Study during Infectious Disease.基于高通量测序的传染病免疫组库研究
Front Immunol. 2016 Aug 31;7:336. doi: 10.3389/fimmu.2016.00336. eCollection 2016.