• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

TM-Aligner:用于跨膜蛋白的多重序列比对工具,可减少时间并提高准确性。

TM-Aligner: Multiple sequence alignment tool for transmembrane proteins with reduced time and improved accuracy.

机构信息

Department of Life Science, Shiv Nadar University, Greater Noida, UP, 201314, India.

Department of Animal Biotechnology, Sher-e-Kashmir University of Agricultural Sciences and Technology, Shuhama, Jammu and Kashmir, 190016, India.

出版信息

Sci Rep. 2017 Oct 2;7(1):12543. doi: 10.1038/s41598-017-13083-y.

DOI:10.1038/s41598-017-13083-y
PMID:28970546
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5624947/
Abstract

Membrane proteins plays significant role in living cells. Transmembrane proteins are estimated to constitute approximately 30% of proteins at genomic scale. It has been a difficult task to develop specific alignment tools for transmembrane proteins due to limited number of experimentally validated protein structures. Alignment tools based on homology modeling provide fairly good result by recapitulating 70-80% residues in reference alignment provided all input sequences should have known template structures. However, homology modeling tools took substantial amount of time, thus aligning large numbers of sequences becomes computationally demanding. Here we present TM-Aligner, a new tool for transmembrane protein sequence alignment. TM-Aligner is based on Wu-Manber and dynamic string matching algorithm which has significantly improved its accuracy and speed of multiple sequence alignment. We compared TM-Aligner with prevailing other popular tools and performed benchmarking using three separate reference sets, BaliBASE3.0 reference set7 of alpha-helical transmembrane proteins, structure based alignment of transmembrane proteins from Pfam database and structure alignment from GPCRDB. Benchmarking against reference datasets indicated that TM-Aligner is more advanced method having least turnaround time with significant improvements over the most accurate methods such as PROMALS, MAFFT, TM-Coffee, Kalign, ClustalW, Muscle and PRALINE. TM-Aligner is freely available through http://lms.snu.edu.in/TM-Aligner/ .

摘要

膜蛋白在活细胞中起着重要作用。跨膜蛋白估计约占基因组规模蛋白质的 30%。由于实验验证的蛋白质结构数量有限,因此开发针对跨膜蛋白的特异性对齐工具一直是一项艰巨的任务。基于同源建模的对齐工具通过在提供的参考对齐中重新生成 70-80%的残基,提供了相当好的结果,前提是所有输入序列都应该具有已知的模板结构。然而,同源建模工具需要大量的时间,因此对齐大量序列在计算上变得具有挑战性。在这里,我们介绍了 TM-Aligner,这是一种用于跨膜蛋白序列对齐的新工具。TM-Aligner 基于 Wu-Manber 和动态字符串匹配算法,显著提高了其在参考对齐中重新生成 70-80%残基的准确性和速度,所有输入序列都应该具有已知的模板结构。然而,同源建模工具需要大量的时间,因此对齐大量序列在计算上变得具有挑战性。在这里,我们介绍了 TM-Aligner,这是一种用于跨膜蛋白序列对齐的新工具。TM-Aligner 基于 Wu-Manber 和动态字符串匹配算法,显著提高了其在参考对齐中重新生成 70-80%残基的准确性和速度,所有输入序列都应该具有已知的模板结构。然而,同源建模工具需要大量的时间,因此对齐大量序列在计算上变得具有挑战性。在这里,我们介绍了 TM-Aligner,这是一种用于跨膜蛋白序列对齐的新工具。TM-Aligner 基于 Wu-Manber 和动态字符串匹配算法,显著提高了其在参考对齐中重新生成 70-80%残基的准确性和速度,

我们将 TM-Aligner 与现有的其他流行工具进行了比较,并使用三个独立的参考数据集(BaliBASE3.0 参考集 7 的α-螺旋跨膜蛋白、来自 Pfam 数据库的基于结构的跨膜蛋白比对和来自 GPCRDB 的结构比对)进行了基准测试。与参考数据集的基准测试表明,TM-Aligner 是一种更先进的方法,具有最短的周转时间,并在最准确的方法(如 PROMALS、MAFFT、TM-Coffee、Kalign、ClustalW、Muscle 和 PRALINE)上取得了显著的改进。TM-Aligner 可通过 http://lms.snu.edu.in/TM-Aligner/ 免费获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/8793b9486c52/41598_2017_13083_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/c2430c67b182/41598_2017_13083_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/3c1def6b9ad2/41598_2017_13083_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/8793b9486c52/41598_2017_13083_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/c2430c67b182/41598_2017_13083_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/3c1def6b9ad2/41598_2017_13083_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4717/5624947/8793b9486c52/41598_2017_13083_Fig3_HTML.jpg

相似文献

1
TM-Aligner: Multiple sequence alignment tool for transmembrane proteins with reduced time and improved accuracy.TM-Aligner:用于跨膜蛋白的多重序列比对工具,可减少时间并提高准确性。
Sci Rep. 2017 Oct 2;7(1):12543. doi: 10.1038/s41598-017-13083-y.
2
Kalign--an accurate and fast multiple sequence alignment algorithm.Kalign——一种准确且快速的多序列比对算法。
BMC Bioinformatics. 2005 Dec 12;6:298. doi: 10.1186/1471-2105-6-298.
3
PSI/TM-Coffee: a web server for fast and accurate multiple sequence alignments of regular and transmembrane proteins using homology extension on reduced databases.PSI/TM-Coffee:一个利用简化数据库上的同源性延伸对常规和跨膜蛋白进行快速准确多序列比对的网络服务器。
Nucleic Acids Res. 2016 Jul 8;44(W1):W339-43. doi: 10.1093/nar/gkw300. Epub 2016 Apr 22.
4
Accurate multiple sequence alignment of transmembrane proteins with PSI-Coffee.使用 PSI-Coffee 进行跨膜蛋白的精确多重序列比对。
BMC Bioinformatics. 2012 Mar 28;13 Suppl 4(Suppl 4):S1. doi: 10.1186/1471-2105-13-S4-S1.
5
PROMALS web server for accurate multiple protein sequence alignments.用于精确多蛋白序列比对的PROMALS网络服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W649-52. doi: 10.1093/nar/gkm227. Epub 2007 Apr 22.
6
PROMALS: towards accurate multiple sequence alignments of distantly related proteins.PROMALS:用于实现远缘相关蛋白质准确多序列比对
Bioinformatics. 2007 Apr 1;23(7):802-8. doi: 10.1093/bioinformatics/btm017. Epub 2007 Jan 31.
7
SPEM: improving multiple sequence alignment with sequence profiles and predicted secondary structures.SPEM:利用序列概况和预测的二级结构改进多序列比对
Bioinformatics. 2005 Sep 15;21(18):3615-21. doi: 10.1093/bioinformatics/bti582. Epub 2005 Jul 14.
8
OXBench: a benchmark for evaluation of protein multiple sequence alignment accuracy.OXBench:一种用于评估蛋白质多序列比对准确性的基准。
BMC Bioinformatics. 2003 Oct 10;4:47. doi: 10.1186/1471-2105-4-47.
9
MUSCLE: multiple sequence alignment with high accuracy and high throughput.MUSCLE:具有高精度和高吞吐量的多序列比对。
Nucleic Acids Res. 2004 Mar 19;32(5):1792-7. doi: 10.1093/nar/gkh340. Print 2004.
10
Grammar-based distance in progressive multiple sequence alignment.渐进多序列比对中基于语法的距离
BMC Bioinformatics. 2008 Jul 10;9:306. doi: 10.1186/1471-2105-9-306.

引用本文的文献

1
Computational drug development for membrane protein targets.计算药物研发用于膜蛋白靶标。
Nat Biotechnol. 2024 Feb;42(2):229-242. doi: 10.1038/s41587-023-01987-2. Epub 2024 Feb 15.
2
Multiple sequence alignment based on deep reinforcement learning with self-attention and positional encoding.基于深度强化学习的具有自注意力和位置编码的多序列比对。
Bioinformatics. 2023 Nov 1;39(11). doi: 10.1093/bioinformatics/btad636.
3
Disruption of the inositol phosphorylceramide synthase gene affects Trypanosoma cruzi differentiation and infection capacity.

本文引用的文献

1
PSI/TM-Coffee: a web server for fast and accurate multiple sequence alignments of regular and transmembrane proteins using homology extension on reduced databases.PSI/TM-Coffee:一个利用简化数据库上的同源性延伸对常规和跨膜蛋白进行快速准确多序列比对的网络服务器。
Nucleic Acids Res. 2016 Jul 8;44(W1):W339-43. doi: 10.1093/nar/gkw300. Epub 2016 Apr 22.
2
The Pfam protein families database: towards a more sustainable future.Pfam蛋白质家族数据库:迈向更可持续的未来。
Nucleic Acids Res. 2016 Jan 4;44(D1):D279-85. doi: 10.1093/nar/gkv1344. Epub 2015 Dec 15.
3
GPCRDB: an information system for G protein-coupled receptors.
肌醇磷酸神经酰胺合酶基因的破坏影响克氏锥虫的分化和感染能力。
PLoS Negl Trop Dis. 2023 Sep 20;17(9):e0011646. doi: 10.1371/journal.pntd.0011646. eCollection 2023 Sep.
4
Genome-wide analysis of PTR transporters in Candida species and their functional characterization in Candida auris.泛素蛋白酶体系统(ubiquitin-proteasome system,UPS)是真核生物中高度保守的蛋白质降解途径,可识别并降解短寿命或错误折叠的蛋白质,以维持细胞内蛋白质稳态。UPS 由泛素(ubiquitin,Ub)、泛素激活酶(ubiquitin-activating enzymes,E1)、泛素结合酶(ubiquitin-conjugating enzymes,E2s)、泛素-蛋白连接酶(ubiquitin ligases,E3s)和 26S 蛋白酶体组成。泛素分子通过 7 个氨基酸残基(Met1-Gly75)与靶蛋白赖氨酸残基的 ε-氨基共价连接,形成多聚泛素化链,是 UPS 识别和降解靶蛋白的关键。 UPS 异常与多种疾病相关,包括神经退行性疾病、癌症、代谢性疾病和自身免疫性疾病等。在神经退行性疾病中,UPS 功能失调导致异常蛋白积累,如 tau 蛋白和 α-突触核蛋白,与神经元变性和细胞死亡有关。在癌症中,UPS 通过降解肿瘤抑制蛋白和激活周期蛋白依赖性激酶抑制蛋白来促进细胞增殖和抑制凋亡。在代谢性疾病中,UPS 调节葡萄糖代谢和胰岛素信号通路,其功能障碍与胰岛素抵抗和 2 型糖尿病的发生有关。在自身免疫性疾病中,UPS 参与抗原呈递和免疫调节,其异常与自身免疫反应的激活有关。 UPS 功能的异常可以通过多种机制引起,包括基因突变、蛋白表达异常、UPS 组分的相互作用异常和代谢产物的改变等。这些机制可以导致 UPS 对靶蛋白的识别和降解能力下降,从而导致蛋白质积累和细胞功能障碍。 UPS 功能的异常与多种疾病的发生和发展密切相关,因此 UPS 成为了治疗这些疾病的重要靶点。目前已经有一些针对 UPS 的药物正在研发中,包括蛋白酶体抑制剂和 E1 激活酶抑制剂等,这些药物可以通过抑制 UPS 来减少异常蛋白的积累,从而起到治疗疾病的作用。
Appl Microbiol Biotechnol. 2022 Jun;106(11):4223-4235. doi: 10.1007/s00253-022-11998-9. Epub 2022 Jun 1.
5
Genome wide expression analysis of circular RNAs in mammary epithelial cells of cattle revealed difference in milk synthesis.对牛乳腺上皮细胞环状 RNA 的全基因组表达分析揭示了乳汁合成的差异。
PeerJ. 2022 Mar 1;10:e13029. doi: 10.7717/peerj.13029. eCollection 2022.
6
Mammary epithelial cell transcriptome reveals potential roles of lncRNAs in regulating milk synthesis pathways in Jersey and Kashmiri cattle.乳腺上皮细胞转录组揭示了长非编码 RNA 在调控泽西牛和克什米尔牛乳汁合成途径中的潜在作用。
BMC Genomics. 2022 Mar 4;23(1):176. doi: 10.1186/s12864-022-08406-x.
7
SNPs in Mammary Gland Epithelial Cells Unraveling Potential Difference in Milk Production Between Jersey and Kashmiri Cattle Using RNA Sequencing.利用RNA测序揭示泽西牛和克什米尔牛乳腺上皮细胞中的单核苷酸多态性与产奶量潜在差异
Front Genet. 2021 Aug 3;12:666015. doi: 10.3389/fgene.2021.666015. eCollection 2021.
8
Changthangi Pashmina Goat Genome: Sequencing, Assembly, and Annotation.羌塘山羊绒山羊基因组:测序、组装与注释
Front Genet. 2021 Jul 20;12:695178. doi: 10.3389/fgene.2021.695178. eCollection 2021.
9
Refining pairwise sequence alignments of membrane proteins by the incorporation of anchors.通过引入锚点来优化膜蛋白的成对序列比对。
PLoS One. 2021 Apr 30;16(4):e0239881. doi: 10.1371/journal.pone.0239881. eCollection 2021.
10
Identification of potential key genes and pathways associated with the Pashmina fiber initiation using RNA-Seq and integrated bioinformatics analysis.利用 RNA-Seq 和综合生物信息学分析鉴定与帕什米纳纤维起始相关的潜在关键基因和途径。
Sci Rep. 2021 Jan 19;11(1):1766. doi: 10.1038/s41598-021-81471-6.
GPCRDB:一个 G 蛋白偶联受体的信息系统。
Nucleic Acids Res. 2014 Jan;42(Database issue):D422-5. doi: 10.1093/nar/gkt1255. Epub 2013 Dec 3.
4
PDBTM: Protein Data Bank of transmembrane proteins after 8 years.PDBTM:经过 8 年的跨膜蛋白数据库。
Nucleic Acids Res. 2013 Jan;41(Database issue):D524-9. doi: 10.1093/nar/gks1169. Epub 2012 Nov 30.
5
Recent developments in the MAFFT multiple sequence alignment program.MAFFT多序列比对程序的最新进展。
Brief Bioinform. 2008 Jul;9(4):286-98. doi: 10.1093/bib/bbn013. Epub 2008 Mar 27.
6
PRALINETM: a strategy for improved multiple alignment of transmembrane proteins.PRALINETM:一种改进跨膜蛋白多重比对的策略。
Bioinformatics. 2008 Feb 15;24(4):492-7. doi: 10.1093/bioinformatics/btm636. Epub 2008 Jan 2.
7
PROMALS: towards accurate multiple sequence alignments of distantly related proteins.PROMALS:用于实现远缘相关蛋白质准确多序列比对
Bioinformatics. 2007 Apr 1;23(7):802-8. doi: 10.1093/bioinformatics/btm017. Epub 2007 Jan 31.
8
Kalign--an accurate and fast multiple sequence alignment algorithm.Kalign——一种准确且快速的多序列比对算法。
BMC Bioinformatics. 2005 Dec 12;6:298. doi: 10.1186/1471-2105-6-298.
9
BAliBASE 3.0: latest developments of the multiple sequence alignment benchmark.BAliBASE 3.0:多序列比对基准测试的最新进展。
Proteins. 2005 Oct 1;61(1):127-36. doi: 10.1002/prot.20527.
10
Homology-extended sequence alignment.同源性扩展序列比对
Nucleic Acids Res. 2005 Feb 7;33(3):816-24. doi: 10.1093/nar/gki233. Print 2005.