• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

WCD EST聚类工具概述。

An overview of the wcd EST clustering tool.

作者信息

Hazelhurst Scott, Hide Winston, Lipták Zsuzsanna, Nogueira Ramon, Starfield Richard

机构信息

Wits Bioinformatics, University of the Witwatersrand, Johannesburg, Private Bag 3, 2050 Wits, South Africa.

出版信息

Bioinformatics. 2008 Jul 1;24(13):1542-6. doi: 10.1093/bioinformatics/btn203. Epub 2008 May 14.

DOI:10.1093/bioinformatics/btn203
PMID:18480101
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2718666/
Abstract

UNLABELLED

The wcd system is an open source tool for clustering expressed sequence tags (EST) and other DNA and RNA sequences. wcd allows efficient all-versus-all comparison of ESTs using either the d(2) distance function or edit distance, improving existing implementations of d(2). It supports merging, refinement and reclustering of clusters. It is 'drop in' compatible with the StackPack clustering package. wcd supports parallelization under both shared memory and cluster architectures. It is distributed with an EMBOSS wrapper allowing wcd to be installed as part of an EMBOSS installation (and so provided by a web server).

AVAILABILITY

wcd is distributed under a GPL licence and is available from http://code.google.com/p/wcdest.

SUPPLEMENTARY INFORMATION

Additional experimental results. The wcd manual, a companion paper describing underlying algorithms, and all datasets used for experimentation can also be found at www.bioinf.wits.ac.za/~scott/wcdsupp.html.

摘要

未标注

wcd系统是一种用于对表达序列标签(EST)以及其他DNA和RNA序列进行聚类的开源工具。wcd允许使用d(2)距离函数或编辑距离对EST进行高效的全对全比较,改进了d(2)的现有实现方式。它支持聚类的合并、细化和重新聚类。它与StackPack聚类软件包“即插即用”兼容。wcd在共享内存和集群架构下均支持并行化。它随附一个EMBOSS包装器,允许将wcd作为EMBOSS安装的一部分进行安装(因此可由网络服务器提供)。

可用性

wcd根据GPL许可进行分发,可从http://code.google.com/p/wcdest获取。

补充信息

更多实验结果。wcd手册、一篇描述基础算法的配套论文以及所有用于实验的数据集也可在www.bioinf.wits.ac.za/~scott/wcdsupp.html上找到。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f3f9/2718666/c3a10b8face5/btn203f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f3f9/2718666/79faede611b7/btn203f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f3f9/2718666/c3a10b8face5/btn203f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f3f9/2718666/79faede611b7/btn203f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f3f9/2718666/c3a10b8face5/btn203f2.jpg

相似文献

1
An overview of the wcd EST clustering tool.WCD EST聚类工具概述。
Bioinformatics. 2008 Jul 1;24(13):1542-6. doi: 10.1093/bioinformatics/btn203. Epub 2008 May 14.
2
RBR: library-less repeat detection for ESTs.RBR:用于ESTs的无文库重复序列检测
Bioinformatics. 2006 Sep 15;22(18):2232-6. doi: 10.1093/bioinformatics/btl368. Epub 2006 Jul 12.
3
ESTminer: a Web interface for mining EST contig and cluster databases.ESTminer:用于挖掘EST重叠群和聚类数据库的网络界面。
Bioinformatics. 2005 Mar 1;21(5):669-70. doi: 10.1093/bioinformatics/bti030. Epub 2004 Sep 16.
4
KABOOM! A new suffix array based algorithm for clustering expression data.砰!一种新的基于后缀数组的聚类表达数据算法。
Bioinformatics. 2011 Dec 15;27(24):3348-55. doi: 10.1093/bioinformatics/btr560. Epub 2011 Oct 8.
5
Pattern locator: a new tool for finding local sequence patterns in genomic DNA sequences.模式定位器:一种在基因组DNA序列中寻找局部序列模式的新工具。
Bioinformatics. 2006 Dec 15;22(24):3099-100. doi: 10.1093/bioinformatics/btl551. Epub 2006 Nov 8.
6
Gene structure prediction from consensus spliced alignment of multiple ESTs matching the same genomic locus.基于与同一基因组位点匹配的多个EST的一致性剪接比对进行基因结构预测。
Bioinformatics. 2004 May 1;20(7):1157-69. doi: 10.1093/bioinformatics/bth058. Epub 2004 Feb 5.
7
SEAN: SNP prediction and display program utilizing EST sequence clusters.肖恩:利用表达序列标签(EST)序列簇的单核苷酸多态性(SNP)预测与显示程序。
Bioinformatics. 2006 Feb 15;22(4):495-6. doi: 10.1093/bioinformatics/btk006. Epub 2005 Dec 15.
8
Fast sequence clustering using a suffix array algorithm.使用后缀数组算法进行快速序列聚类。
Bioinformatics. 2003 Jul 1;19(10):1221-6. doi: 10.1093/bioinformatics/btg138.
9
EST2uni: an open, parallel tool for automated EST analysis and database creation, with a data mining web interface and microarray expression data integration.EST2uni:一个用于自动EST分析和数据库创建的开放并行工具,带有数据挖掘网络界面和微阵列表达数据整合功能。
BMC Bioinformatics. 2008 Jan 7;9:5. doi: 10.1186/1471-2105-9-5.
10
INCA: synonymous codon usage analysis and clustering by means of self-organizing map.INCA:通过自组织映射进行同义密码子使用分析和聚类
Bioinformatics. 2004 Sep 22;20(14):2329-30. doi: 10.1093/bioinformatics/bth238. Epub 2004 Apr 1.

引用本文的文献

1
SCRAPT: an iterative algorithm for clustering large 16S rRNA gene data sets.SCRAPT:一种用于聚类大型 16S rRNA 基因数据集的迭代算法。
Nucleic Acids Res. 2023 May 8;51(8):e46. doi: 10.1093/nar/gkad158.
2
Telomere Roles in Fungal Genome Evolution and Adaptation.端粒在真菌基因组进化与适应中的作用
Front Genet. 2021 Aug 9;12:676751. doi: 10.3389/fgene.2021.676751. eCollection 2021.
3
MeShClust: an intelligent tool for clustering DNA sequences.MeShClust:一种用于聚类 DNA 序列的智能工具。

本文引用的文献

1
A hitchhiker's guide to expressed sequence tag (EST) analysis.表达序列标签(EST)分析指南
Brief Bioinform. 2007 Jan;8(1):6-21. doi: 10.1093/bib/bbl015. Epub 2006 May 23.
2
Integrative annotation of 21,037 human genes validated by full-length cDNA clones.由全长cDNA克隆验证的21,037个人类基因的综合注释。
PLoS Biol. 2004 Jun;2(6):e162. doi: 10.1371/journal.pbio.0020162. Epub 2004 Apr 20.
3
Fast sequence clustering using a suffix array algorithm.使用后缀数组算法进行快速序列聚类。
Nucleic Acids Res. 2018 Aug 21;46(14):e83. doi: 10.1093/nar/gky315.
4
Inferring bona fide transfrags in RNA-Seq derived-transcriptome assemblies of non-model organisms.在非模式生物的RNA测序衍生转录组组装中推断真正的转录片段
BMC Bioinformatics. 2015 Feb 21;16(1):58. doi: 10.1186/s12859-015-0492-5.
5
EasyCluster2: an improved tool for clustering and assembling long transcriptome reads.EasyCluster2:一种改进的长转录本读长聚类和组装工具。
BMC Bioinformatics. 2014;15 Suppl 15(Suppl 15):S7. doi: 10.1186/1471-2105-15-S15-S7. Epub 2014 Dec 3.
6
Development of EST-based SNP and InDel markers and their utilization in tetraploid cotton genetic mapping.基于EST的SNP和InDel标记的开发及其在四倍体棉花遗传图谱构建中的应用
BMC Genomics. 2014 Dec 1;15(1):1046. doi: 10.1186/1471-2164-15-1046.
7
Construction of a public CHO cell line transcript database using versatile bioinformatics analysis pipelines.利用多功能生物信息学分析管道构建公共 CHO 细胞系转录数据库。
PLoS One. 2014 Jan 10;9(1):e85568. doi: 10.1371/journal.pone.0085568. eCollection 2014.
8
A de novo assembly of the newt transcriptome combined with proteomic validation identifies new protein families expressed during tissue regeneration.结合蛋白质组学验证的蝾螈转录组从头组装鉴定出组织再生过程中表达的新蛋白质家族。
Genome Biol. 2013 Feb 20;14(2):R16. doi: 10.1186/gb-2013-14-2-r16.
9
Analysis of the leaf transcriptome of Musa acuminata during interaction with Mycosphaerella musicola: gene assembly, annotation and marker development.分析在与 Mycosphaerella musicola 相互作用过程中 Musa acuminata 的叶片转录组:基因组装、注释和标记开发。
BMC Genomics. 2013 Feb 5;14:78. doi: 10.1186/1471-2164-14-78.
10
Bio-crude transcriptomics: gene discovery and metabolic network reconstruction for the biosynthesis of the terpenome of the hydrocarbon oil-producing green alga, Botryococcus braunii race B (Showa).生物原油转录组学:发现基因和代谢网络,重建生产碳氢油的绿藻 Botryococcus braunii 种 B(昭和)萜类化合物组的生物合成途径。
BMC Genomics. 2012 Oct 30;13:576. doi: 10.1186/1471-2164-13-576.
Bioinformatics. 2003 Jul 1;19(10):1221-6. doi: 10.1093/bioinformatics/btg138.
4
A comprehensive approach to clustering of expressed human gene sequence: the sequence tag alignment and consensus knowledge base.一种用于人类表达基因序列聚类的综合方法:序列标签比对与共有知识库。
Genome Res. 1999 Nov;9(11):1143-55. doi: 10.1101/gr.9.11.1143.
5
CAP3: A DNA sequence assembly program.CAP3:一个DNA序列组装程序。
Genome Res. 1999 Sep;9(9):868-77. doi: 10.1101/gr.9.9.868.
6
Biological evaluation of d2, an algorithm for high-performance sequence comparison.d2的生物学评估,一种用于高性能序列比较的算法。
J Comput Biol. 1994 Fall;1(3):199-215. doi: 10.1089/cmb.1994.1.199.