• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CD-HIT 套件:用于聚类和比较生物序列的网络服务器。

CD-HIT Suite: a web server for clustering and comparing biological sequences.

机构信息

California Institute for Telecommunications and Information Technology, University of California San Diego, La Jolla, CA, USA.

出版信息

Bioinformatics. 2010 Mar 1;26(5):680-2. doi: 10.1093/bioinformatics/btq003. Epub 2010 Jan 6.

DOI:10.1093/bioinformatics/btq003
PMID:20053844
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2828112/
Abstract

UNLABELLED

CD-HIT is a widely used program for clustering and comparing large biological sequence datasets. In order to further assist the CD-HIT users, we significantly improved this program with more functions and better accuracy, scalability and flexibility. Most importantly, we developed a new web server, CD-HIT Suite, for clustering a user-uploaded sequence dataset or comparing it to another dataset at different identity levels. Users can now interactively explore the clusters within web browsers. We also provide downloadable clusters for several public databases (NCBI NR, Swissprot and PDB) at different identity levels.

AVAILABILITY

Free access at http://cd-hit.org

摘要

未标注

CD-HIT 是一个广泛使用的程序,用于聚类和比较大型生物序列数据集。为了进一步帮助 CD-HIT 用户,我们对该程序进行了重大改进,增加了更多功能,提高了准确性、可扩展性和灵活性。最重要的是,我们开发了一个新的 Web 服务器 CD-HIT Suite,用于对用户上传的序列数据集进行聚类,或在不同的同一性水平上与另一个数据集进行比较。用户现在可以在网络浏览器中交互式地探索聚类。我们还提供了在不同同一性水平下的几个公共数据库(NCBI NR、Swissprot 和 PDB)的可下载聚类。

可用性

免费访问网址:http://cd-hit.org

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/95de/2828112/a559a1286f16/btq003f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/95de/2828112/a559a1286f16/btq003f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/95de/2828112/a559a1286f16/btq003f1.jpg

相似文献

1
CD-HIT Suite: a web server for clustering and comparing biological sequences.CD-HIT 套件:用于聚类和比较生物序列的网络服务器。
Bioinformatics. 2010 Mar 1;26(5):680-2. doi: 10.1093/bioinformatics/btq003. Epub 2010 Jan 6.
2
BOV--a web-based BLAST output visualization tool.BOV——一个基于网络的BLAST输出可视化工具。
BMC Genomics. 2008 Sep 15;9:414. doi: 10.1186/1471-2164-9-414.
3
Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences.Cd-hit:一个用于对大量蛋白质或核苷酸序列进行聚类和比较的快速程序。
Bioinformatics. 2006 Jul 1;22(13):1658-9. doi: 10.1093/bioinformatics/btl158. Epub 2006 May 26.
4
PLAN: a web platform for automating high-throughput BLAST searches and for managing and mining results.PLAN:一个用于自动化高通量BLAST搜索以及管理和挖掘结果的网络平台。
BMC Bioinformatics. 2007 Feb 9;8:53. doi: 10.1186/1471-2105-8-53.
5
CD-HIT: accelerated for clustering the next-generation sequencing data.CD-HIT:用于加速下一代测序数据聚类的工具。
Bioinformatics. 2012 Dec 1;28(23):3150-2. doi: 10.1093/bioinformatics/bts565. Epub 2012 Oct 11.
6
SALIGN: a web server for alignment of multiple protein sequences and structures.SALIGN:一个用于多个蛋白质序列和结构比对的网络服务器。
Bioinformatics. 2012 Aug 1;28(15):2072-3. doi: 10.1093/bioinformatics/bts302. Epub 2012 May 21.
7
Comprehensive cluster analysis with Transitivity Clustering.使用传递闭包聚类进行全面的聚类分析。
Nat Protoc. 2011 Mar;6(3):285-95. doi: 10.1038/nprot.2010.197. Epub 2011 Feb 10.
8
HMMER web server: 2018 update.HMMER 网页服务器:2018 年更新。
Nucleic Acids Res. 2018 Jul 2;46(W1):W200-W204. doi: 10.1093/nar/gky448.
9
PESTAS: a web server for EST analysis and sequence mining.PESTAS:用于EST分析和序列挖掘的网络服务器。
Bioinformatics. 2009 Jul 15;25(14):1846-8. doi: 10.1093/bioinformatics/btp293. Epub 2009 May 4.
10
The web server of IBM's Bioinformatics and Pattern Discovery group.IBM生物信息学与模式发现小组的网络服务器。
Nucleic Acids Res. 2003 Jul 1;31(13):3645-50. doi: 10.1093/nar/gkg621.

引用本文的文献

1
Consequences of interspecific plant hybridization on metabolic diversity in naturally occurring hybrid swarms.种间植物杂交对自然杂交群体中代谢多样性的影响。
Plant J. 2025 Aug;123(4):e70444. doi: 10.1111/tpj.70444.
2
The hidden genetic reservoir: structural variants as drivers of marine microbial and viral microdiversity.隐藏的基因库:结构变异作为海洋微生物和病毒微多样性的驱动因素
Environ Microbiome. 2025 Aug 25;20(1):110. doi: 10.1186/s40793-025-00773-8.
3
DeepAIPs-SFLA: Deep Convolutional Model for Prediction of Anti-Inflammatory Peptides Using Binary Pattern Decomposition of Novel Multiview Descriptors with an SFLA Approach.

本文引用的文献

1
A core gut microbiome in obese and lean twins.肥胖与消瘦双胞胎的核心肠道微生物群。
Nature. 2009 Jan 22;457(7228):480-4. doi: 10.1038/nature07540. Epub 2008 Nov 30.
2
SMART 6: recent updates and new developments.SMART 6:近期更新与新进展
Nucleic Acids Res. 2009 Jan;37(Database issue):D229-32. doi: 10.1093/nar/gkn808. Epub 2008 Oct 31.
3
Probing metagenomics by rapid cluster analysis of very large datasets.通过对超大型数据集进行快速聚类分析来探索宏基因组学。
深度人工智能粒子群优化算法:基于新型多视图描述符的二元模式分解与粒子群优化算法的深度卷积模型用于抗炎肽预测
ACS Omega. 2025 Aug 5;10(32):35747-35762. doi: 10.1021/acsomega.5c02422. eCollection 2025 Aug 19.
4
LABind: identifying protein binding ligand-aware sites via learning interactions between ligand and protein.LABind:通过学习配体与蛋白质之间的相互作用来识别蛋白质结合配体感知位点。
Nat Commun. 2025 Aug 19;16(1):7712. doi: 10.1038/s41467-025-62899-0.
5
Volcano: a pipeline to characterize long terminal repeat-retrotransposons families in plants.Volcano:一个用于鉴定植物中长末端重复反转录转座子家族的流程
Bioinform Adv. 2025 Jul 4;5(1):vbaf162. doi: 10.1093/bioadv/vbaf162. eCollection 2025.
6
EZpred: improving deep learning-based enzyme function prediction using unlabeled sequence homologs.EZpred:利用未标记的序列同源物改进基于深度学习的酶功能预测
bioRxiv. 2025 Jul 14:2025.07.09.663945. doi: 10.1101/2025.07.09.663945.
7
Symbionts with eroded genomes adjust gene expression according to host life-stage and environment.基因组退化的共生体根据宿主的生命阶段和环境来调整基因表达。
EMBO Rep. 2025 Aug 8. doi: 10.1038/s44319-025-00525-2.
8
Temperate phages enhance host fitness via RNA-guided flagellar remodeling.温和噬菌体通过RNA引导的鞭毛重塑提高宿主适应性。
bioRxiv. 2025 Jul 22:2025.07.22.666180. doi: 10.1101/2025.07.22.666180.
9
Ancestral Sequence Reconstruction of the Ethylene-Forming Enzyme.乙烯形成酶的祖先序列重建
Biochemistry. 2025 Aug 5;64(15):3432-3445. doi: 10.1021/acs.biochem.5c00334. Epub 2025 Jul 25.
10
Analysis and comparison of the bacterial σ54 regulon: Evidence of phylogenetic trends in gene regulation.细菌σ54调控子的分析与比较:基因调控中系统发育趋势的证据
PLoS One. 2025 Aug 1;20(8):e0327805. doi: 10.1371/journal.pone.0327805. eCollection 2025.
PLoS One. 2008;3(10):e3375. doi: 10.1371/journal.pone.0003375. Epub 2008 Oct 10.
4
Gene identification and protein classification in microbial metagenomic sequence data via incremental clustering.通过增量聚类对微生物宏基因组序列数据进行基因识别和蛋白质分类。
BMC Bioinformatics. 2008 Apr 10;9:182. doi: 10.1186/1471-2105-9-182.
5
UniRef: comprehensive and non-redundant UniProt reference clusters.UniRef:全面且无冗余的UniProt参考簇。
Bioinformatics. 2007 May 15;23(10):1282-8. doi: 10.1093/bioinformatics/btm098. Epub 2007 Mar 22.
6
The Sorcerer II Global Ocean Sampling expedition: expanding the universe of protein families.“魔法师二号”全球海洋采样考察:拓展蛋白质家族的范畴
PLoS Biol. 2007 Mar;5(3):e16. doi: 10.1371/journal.pbio.0050016.
7
Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences.Cd-hit:一个用于对大量蛋白质或核苷酸序列进行聚类和比较的快速程序。
Bioinformatics. 2006 Jul 1;22(13):1658-9. doi: 10.1093/bioinformatics/btl158. Epub 2006 May 26.
8
Tolerating some redundancy significantly speeds up clustering of large protein databases.容忍一定程度的冗余可显著加快大型蛋白质数据库的聚类速度。
Bioinformatics. 2002 Jan;18(1):77-82. doi: 10.1093/bioinformatics/18.1.77.
9
Clustering of highly homologous sequences to reduce the size of large protein databases.对高度同源序列进行聚类以减小大型蛋白质数据库的规模。
Bioinformatics. 2001 Mar;17(3):282-3. doi: 10.1093/bioinformatics/17.3.282.