• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

超级词阵列在基因组组装中的应用。

Application of a superword array in genome assembly.

作者信息

Huang Xiaoqiu, Yang Shiaw-Pyng, Chinwalla Asif T, Hillier LaDeana W, Minx Patrick, Mardis Elaine R, Wilson Richard K

机构信息

Department of Computer Science, Iowa State University, Ames, IA 50011-1040, USA.

出版信息

Nucleic Acids Res. 2006 Jan 5;34(1):201-5. doi: 10.1093/nar/gkj419. Print 2006.

DOI:10.1093/nar/gkj419
PMID:16397298
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1325203/
Abstract

We introduce a data structure called a superword array for finding quickly matches between DNA sequences. The superword array possesses some desirable features of the lookup table and suffix array. We describe simple algorithms for constructing and using a superword array to find pairs of sequences that share a unique superword. The algorithms are implemented in a genome assembly program called PCAP.REP for computation of overlaps between reads. Experimental results produced by PCAP.REP and PCAP on a whole-genome dataset show that PCAP.REP produced a more accurate and contiguous assembly than PCAP.

摘要

我们引入一种名为超字数组的数据结构,用于快速查找DNA序列之间的匹配项。超字数组具备查找表和后缀数组的一些理想特性。我们描述了构建和使用超字数组以找到共享唯一超字的序列对的简单算法。这些算法在一个名为PCAP.REP的基因组组装程序中实现,用于计算读段之间的重叠。PCAP.REP和PCAP在一个全基因组数据集上产生的实验结果表明,PCAP.REP比PCAP产生了更准确和连续的组装。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f68/1325203/e069a58b7057/gkj419f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f68/1325203/e069a58b7057/gkj419f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f68/1325203/e069a58b7057/gkj419f1.jpg

相似文献

1
Application of a superword array in genome assembly.超级词阵列在基因组组装中的应用。
Nucleic Acids Res. 2006 Jan 5;34(1):201-5. doi: 10.1093/nar/gkj419. Print 2006.
2
PCAP: a whole-genome assembly program.PCAP:一个全基因组组装程序。
Genome Res. 2003 Sep;13(9):2164-70. doi: 10.1101/gr.1390403.
3
Sequence Assembly.序列组装
Methods Mol Biol. 2017;1525:35-45. doi: 10.1007/978-1-4939-6622-6_2.
4
Generating a genome assembly with PCAP.使用PCAP生成基因组组装。
Curr Protoc Bioinformatics. 2005 Oct;Chapter 11:Unit11.3. doi: 10.1002/0471250953.bi1103s11.
5
Indexing huge genome sequences for solving various problems.为解决各种问题对庞大的基因组序列进行索引。
Genome Inform. 2001;12:175-83.
6
Linear-time computation of minimal absent words using suffix array.使用后缀数组进行最小缺失词的线性时间计算。
BMC Bioinformatics. 2014 Dec 20;15(1):388. doi: 10.1186/s12859-014-0388-9.
7
Constructing consensus genetic maps in comparative analysis.在比较分析中构建共识遗传图谱。
J Comput Biol. 2010 Nov;17(11):1561-73. doi: 10.1089/cmb.2009.0268. Epub 2010 Oct 20.
8
Localized suffix array and its application to genome mapping problems for paired-end short reads.局部后缀数组及其在双端短读长基因组图谱问题中的应用。
Genome Inform. 2009 Oct;23(1):60-71.
9
Space efficient computation of rare maximal exact matches between multiple sequences.多个序列之间稀有最大精确匹配的空间高效计算。
J Comput Biol. 2008 May;15(4):357-77. doi: 10.1089/cmb.2007.0105.
10
Overview of genomic and bioinformatic resources for Zymoseptoria tritici.小麦黄斑叶枯病菌的基因组和生物信息学资源概述。
Fungal Genet Biol. 2015 Jun;79:13-6. doi: 10.1016/j.fgb.2015.04.011.

引用本文的文献

1
Draft genome sequence of eggplant (Solanum melongena L.): the representative solanum species indigenous to the old world.茄子(Solanum melongena L.)的基因组序列草图:旧世界原产的代表性茄科物种。
DNA Res. 2014 Dec;21(6):649-60. doi: 10.1093/dnares/dsu027. Epub 2014 Sep 18.
2
An immunity-triggering effector from the Barley smut fungus Ustilago hordei resides in an Ustilaginaceae-specific cluster bearing signs of transposable element-assisted evolution.来自大麦黑粉菌(Ustilago hordei)的一种引发免疫的效应因子位于一个黑粉菌科特有的基因簇中,该基因簇带有转座元件辅助进化的迹象。
PLoS Pathog. 2014 Jul 3;10(7):e1004223. doi: 10.1371/journal.ppat.1004223. eCollection 2014 Jul.
3

本文引用的文献

1
The Atlas genome assembly system.阿特拉斯基因组组装系统。
Genome Res. 2004 Apr;14(4):721-32. doi: 10.1101/gr.2264004.
2
Versatile and open software for comparing large genomes.用于比较大型基因组的通用且开放的软件。
Genome Biol. 2004;5(2):R12. doi: 10.1186/gb-2004-5-2-r12. Epub 2004 Jan 30.
3
PCAP: a whole-genome assembly program.PCAP:一个全基因组组装程序。
Correction of the Caulobacter crescentus NA1000 genome annotation.
新月柄杆菌NA1000基因组注释的校正
PLoS One. 2014 Mar 12;9(3):e91668. doi: 10.1371/journal.pone.0091668. eCollection 2014.
4
Development of full-length cDNAs from Chinese cabbage (Brassica rapa Subsp. pekinensis) and identification of marker genes for defence response.从白菜(Brassica rapa Subsp. pekinensis)中全长 cDNA 的开发和防御反应标记基因的鉴定。
DNA Res. 2011 Aug;18(4):277-89. doi: 10.1093/dnares/dsr018. Epub 2011 Jul 10.
5
Horizontal gene transfer of microbial cellulases into nematode genomes is associated with functional assimilation and gene turnover.微生物纤维素酶的水平基因转移到线虫基因组中与功能同化和基因更替有关。
BMC Evol Biol. 2011 Jan 13;11:13. doi: 10.1186/1471-2148-11-13.
6
Sequence analysis of the genome of an oil-bearing tree, Jatropha curcas L.油桐基因组序列分析
DNA Res. 2011 Feb;18(1):65-76. doi: 10.1093/dnares/dsq030. Epub 2010 Dec 13.
7
The Pristionchus pacificus genome provides a unique perspective on nematode lifestyle and parasitism.太平洋小杆线虫基因组为线虫的生活方式和寄生现象提供了独特的视角。
Nat Genet. 2008 Oct;40(10):1193-8. doi: 10.1038/ng.227. Epub 2008 Sep 21.
8
Advances in the sequencing of the genome of the adenophorean nematode Trichinella spiralis.旋毛虫属腺胃线虫基因组测序的进展。
Parasitology. 2008 Jul;135(8):869-80. doi: 10.1017/S0031182008004472.
9
Genome analysis of the platypus reveals unique signatures of evolution.鸭嘴兽的基因组分析揭示了独特的进化特征。
Nature. 2008 May 8;453(7192):175-83. doi: 10.1038/nature06936.
10
A Caenorhabditis motif compendium for studying transcriptional gene regulation.用于研究转录基因调控的秀丽隐杆线虫基序汇编。
BMC Genomics. 2008 Jan 23;9:30. doi: 10.1186/1471-2164-9-30.
Genome Res. 2003 Sep;13(9):2164-70. doi: 10.1101/gr.1390403.
4
Efficient clustering of large EST data sets on parallel computers.在并行计算机上对大型EST数据集进行高效聚类
Nucleic Acids Res. 2003 Jun 1;31(11):2963-74. doi: 10.1093/nar/gkg379.
5
LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA.LAGAN和多LAGAN:用于基因组DNA大规模多重比对的高效工具。
Genome Res. 2003 Apr;13(4):721-31. doi: 10.1101/gr.926603. Epub 2003 Mar 12.
6
Human-mouse alignments with BLASTZ.使用BLASTZ进行人-小鼠序列比对。
Genome Res. 2003 Jan;13(1):103-7. doi: 10.1101/gr.809403.
7
AVID: A global alignment program.AVID:一个全局比对程序。
Genome Res. 2003 Jan;13(1):97-102. doi: 10.1101/gr.789803.
8
Whole-genome sequence assembly for mammalian genomes: Arachne 2.哺乳动物基因组的全基因组序列组装:Arachne 2
Genome Res. 2003 Jan;13(1):91-6. doi: 10.1101/gr.828403.
9
The phusion assembler.Phusion 组装器。
Genome Res. 2003 Jan;13(1):81-90. doi: 10.1101/gr.731003.
10
Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes.红鳍东方鲀全基因组鸟枪法测序组装与基因组分析
Science. 2002 Aug 23;297(5585):1301-10. doi: 10.1126/science.1072104. Epub 2002 Jul 25.