• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

镇流器:基于局部保守片段的爆炸后处理

Ballast: blast post-processing based on locally conserved segments.

作者信息

Plewniak F, Thompson J D, Poch O

机构信息

Institut de Génétique et de Biologie Moléculaire et Cellulaire, Laboratoire de Biologie Structurale, (CNRS/INSERM/ULP), BP 163, 67404 Illkirch Cedex, France.

出版信息

Bioinformatics. 2000 Sep;16(9):750-9. doi: 10.1093/bioinformatics/16.9.750.

DOI:10.1093/bioinformatics/16.9.750
PMID:11108697
Abstract

MOTIVATION

Blast programs are very efficient in finding relatively strong similarities but some very distantly related sequences are given a very high Expect value and are ranked very low in Blast results. We have developed Ballast, a program to predict local maximum segments (LMSs-i.e. sequence segments conserved relatively to their flanking regions) from a single Blast database search and to highlight these divergent homologues. The TBlastN database searches can also be processed with the help of information from a joint BlastP search.

RESULTS

We have applied the Ballast algorithm to BlastP searches performed with sequences belonging to well described dispersed families (aminoacyl-tRNA synthetases; helicases) against the SwissProt 38 database. We show that Ballast is able to build an appropriate conservation profile and that LMSs are predicted that are consistent with the signatures and motifs described in the literature. Furthermore, by comparing the Blast, PsiBlast and Ballast results obtained on a well defined database of structurally related sequences, we show that the LMSs provide a scoring scheme that can concentrate on top ranking distant homologues better than Blast. Using the graphical user interface available on the Web, specific LMSs may be selected to detect divergent homologues sharing the corresponding properties with the query sequence without requiring any additional database search.

摘要

动机

Blast程序在寻找相对较强的相似性方面非常高效,但一些亲缘关系非常远的序列的期望值非常高,在Blast结果中的排名非常低。我们开发了Ballast程序,该程序可从单次Blast数据库搜索中预测局部最大片段(LMS,即相对于其侧翼区域保守的序列片段),并突出显示这些差异同源物。TBlastN数据库搜索也可以借助联合BlastP搜索的信息进行处理。

结果

我们将Ballast算法应用于使用属于描述详细的分散家族(氨酰-tRNA合成酶;解旋酶)的序列对SwissProt 38数据库进行的BlastP搜索。我们表明,Ballast能够构建适当的保守图谱,并且预测的LMS与文献中描述的特征和基序一致。此外,通过比较在结构相关序列的明确定义数据库上获得的Blast、PsiBlast和Ballast结果,我们表明LMS提供了一种评分方案,该方案比Blast更能专注于排名靠前的远缘同源物。使用网络上可用的图形用户界面,可以选择特定的LMS来检测与查询序列具有相应特性的差异同源物,而无需任何额外的数据库搜索。

相似文献

1
Ballast: blast post-processing based on locally conserved segments.镇流器:基于局部保守片段的爆炸后处理
Bioinformatics. 2000 Sep;16(9):750-9. doi: 10.1093/bioinformatics/16.9.750.
2
Finding Homologs in Amino Acid Sequences Using Network BLAST Searches.使用网络BLAST搜索在氨基酸序列中寻找同源物。
Curr Protoc Bioinformatics. 2017 Sep 13;59:3.4.1-3.4.24. doi: 10.1002/cpbi.34.
3
muBLASTP: database-indexed protein sequence search on multicore CPUs.muBLASTP:基于多核CPU的数据库索引蛋白质序列搜索。
BMC Bioinformatics. 2016 Nov 4;17(1):443. doi: 10.1186/s12859-016-1302-4.
4
NemaFootPrinter: a web based software for the identification of conserved non-coding genome sequence regions between C. elegans and C. briggsae.线虫足部打印机:一种基于网络的软件,用于识别秀丽隐杆线虫和briggsae线虫之间保守的非编码基因组序列区域。
BMC Bioinformatics. 2005 Dec 1;6 Suppl 4(Suppl 4):S22. doi: 10.1186/1471-2105-6-S4-S22.
5
genBlastG: using BLAST searches to build homologous gene models.genBlastG:利用 BLAST 搜索构建同源基因模型。
Bioinformatics. 2011 Aug 1;27(15):2141-3. doi: 10.1093/bioinformatics/btr342. Epub 2011 Jun 8.
6
Blast sampling for structural and functional analyses.用于结构和功能分析的胚细胞采样。
BMC Bioinformatics. 2007 Feb 23;8:62. doi: 10.1186/1471-2105-8-62.
7
SSMAL: similarity searching with alignment graphs.SSMAL:使用比对图进行相似性搜索。
Bioinformatics. 1998;14(6):508-15. doi: 10.1093/bioinformatics/14.6.508.
8
Recent Hits Acquired by BLAST (ReHAB): a tool to identify new hits in sequence similarity searches.通过BLAST获取的近期命中结果(ReHAB):一种在序列相似性搜索中识别新命中结果的工具。
BMC Bioinformatics. 2005 Feb 8;6:23. doi: 10.1186/1471-2105-6-23.
9
PHAT: a transmembrane-specific substitution matrix. Predicted hydrophobic and transmembrane.PHAT:一种跨膜特异性替代矩阵。预测的疏水性和跨膜性。
Bioinformatics. 2000 Sep;16(9):760-6. doi: 10.1093/bioinformatics/16.9.760.
10
PROMALS web server for accurate multiple protein sequence alignments.用于精确多蛋白序列比对的PROMALS网络服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W649-52. doi: 10.1093/nar/gkm227. Epub 2007 Apr 22.

引用本文的文献

1
Controversies in modern evolutionary biology: the imperative for error detection and quality control.现代进化生物学中的争议:错误检测和质量控制的必要性。
BMC Genomics. 2012 Jan 4;13:5. doi: 10.1186/1471-2164-13-5.
2
Host-pathogen o-methyltransferase similarity and its specific presence in highly virulent strains of Francisella tularensis suggests molecular mimicry.宿主-病原体 O-甲基转移酶的相似性及其在强毒力弗朗西斯氏菌属土拉弗朗西斯菌菌株中的特异性存在提示了分子模拟现象。
PLoS One. 2011;6(5):e20295. doi: 10.1371/journal.pone.0020295. Epub 2011 May 26.
3
A comprehensive benchmark study of multiple sequence alignment methods: current challenges and future perspectives.
多种序列比对方法的综合基准研究:当前的挑战与未来展望。
PLoS One. 2011 Mar 31;6(3):e18093. doi: 10.1371/journal.pone.0018093.
4
Crystal structure of Escherichia coli Rnk, a new RNA polymerase-interacting protein.大肠杆菌Rnk(一种新的与RNA聚合酶相互作用的蛋白质)的晶体结构
J Mol Biol. 2008 Nov 7;383(2):367-79. doi: 10.1016/j.jmb.2008.08.011. Epub 2008 Aug 12.
5
Blast sampling for structural and functional analyses.用于结构和功能分析的胚细胞采样。
BMC Bioinformatics. 2007 Feb 23;8:62. doi: 10.1186/1471-2105-8-62.
6
PipeAlign: A new toolkit for protein family analysis.PipeAlign:一种用于蛋白质家族分析的新工具包。
Nucleic Acids Res. 2003 Jul 1;31(13):3829-32. doi: 10.1093/nar/gkg518.
7
Distinct mutations in yeast TAF(II)25 differentially affect the composition of TFIID and SAGA complexes as well as global gene expression patterns.酵母TAF(II)25中的不同突变对TFIID和SAGA复合物的组成以及整体基因表达模式有不同影响。
Mol Cell Biol. 2002 May;22(9):3178-93. doi: 10.1128/MCB.22.9.3178-3193.2002.
8
DbClustal: rapid and reliable global multiple alignments of protein sequences detected by database searches.DbClustal:通过数据库搜索检测到的蛋白质序列的快速可靠全局多序列比对。
Nucleic Acids Res. 2000 Aug 1;28(15):2919-26. doi: 10.1093/nar/28.15.2919.