• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

远程同源性检测:一种基于基序的方法。

Remote homology detection: a motif based approach.

作者信息

Ben-Hur Asa, Brutlag Douglas

机构信息

Department of Biochemistry, B400 Beckman Center, Stanford University, CA 94305-5307, USA.

出版信息

Bioinformatics. 2003;19 Suppl 1:i26-33. doi: 10.1093/bioinformatics/btg1002.

DOI:10.1093/bioinformatics/btg1002
PMID:12855434
Abstract

MOTIVATION

Remote homology detection is the problem of detecting homology in cases of low sequence similarity. It is a hard computational problem with no approach that works well in all cases.

RESULTS

We present a method for detecting remote homology that is based on the presence of discrete sequence motifs. The motif content of a pair of sequences is used to define a similarity that is used as a kernel for a Support Vector Machine (SVM) classifier. We test the method on two remote homology detection tasks: prediction of a previously unseen SCOP family and prediction of an enzyme class given other enzymes that have a similar function on other substrates. We find that it performs significantly better than an SVM method that uses BLAST or Smith-Waterman similarity scores as features.

摘要

动机

远程同源性检测是在序列相似性较低的情况下检测同源性的问题。这是一个困难的计算问题,没有一种方法能在所有情况下都有效。

结果

我们提出了一种基于离散序列基序存在的远程同源性检测方法。一对序列的基序内容用于定义一种相似性,该相似性用作支持向量机(SVM)分类器的核。我们在两个远程同源性检测任务上测试了该方法:预测一个以前未见过的SCOP家族,以及根据在其他底物上具有相似功能的其他酶来预测酶的类别。我们发现它的性能明显优于使用BLAST或Smith-Waterman相似性得分作为特征的SVM方法。

相似文献

1
Remote homology detection: a motif based approach.远程同源性检测:一种基于基序的方法。
Bioinformatics. 2003;19 Suppl 1:i26-33. doi: 10.1093/bioinformatics/btg1002.
2
Mismatch string kernels for discriminative protein classification.用于判别式蛋白质分类的错配字符串核
Bioinformatics. 2004 Mar 1;20(4):467-76. doi: 10.1093/bioinformatics/btg431. Epub 2004 Jan 22.
3
Protein homology detection using string alignment kernels.使用字符串比对核进行蛋白质同源性检测。
Bioinformatics. 2004 Jul 22;20(11):1682-9. doi: 10.1093/bioinformatics/bth141. Epub 2004 Feb 26.
4
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.
5
Application of latent semantic analysis to protein remote homology detection.潜在语义分析在蛋白质远程同源性检测中的应用。
Bioinformatics. 2006 Feb 1;22(3):285-90. doi: 10.1093/bioinformatics/bti801. Epub 2005 Nov 29.
6
Profile-based string kernels for remote homology detection and motif extraction.基于轮廓的字符串核用于远程同源性检测和基序提取。
J Bioinform Comput Biol. 2005 Jun;3(3):527-50. doi: 10.1142/s021972000500120x.
7
SVM-HUSTLE--an iterative semi-supervised machine learning approach for pairwise protein remote homology detection.SVM-HUSTLE——一种用于成对蛋白质远程同源性检测的迭代半监督机器学习方法。
Bioinformatics. 2008 Mar 15;24(6):783-90. doi: 10.1093/bioinformatics/btn028. Epub 2008 Feb 1.
8
Motif extraction and protein classification.基序提取与蛋白质分类。
Proc IEEE Comput Syst Bioinform Conf. 2005:80-5. doi: 10.1109/csb.2005.39.
9
A structural alignment kernel for protein structures.一种用于蛋白质结构的结构比对核。
Bioinformatics. 2007 May 1;23(9):1090-8. doi: 10.1093/bioinformatics/btl642. Epub 2007 Jan 18.
10
Profile-based string kernels for remote homology detection and motif extraction.基于轮廓的字符串核用于远程同源性检测和基序提取。
Proc IEEE Comput Syst Bioinform Conf. 2004:152-60. doi: 10.1109/csb.2004.1332428.

引用本文的文献

1
Genomic language model predicts protein co-regulation and function.基因组语言模型预测蛋白质的共同调控和功能。
Nat Commun. 2024 Apr 3;15(1):2880. doi: 10.1038/s41467-024-46947-9.
2
Machine Learning Methods for Small Data Challenges in Molecular Science.机器学习方法在分子科学中小数据挑战中的应用。
Chem Rev. 2023 Jul 12;123(13):8736-8780. doi: 10.1021/acs.chemrev.3c00189. Epub 2023 Jun 29.
3
Building blocks and blueprints for bacterial autolysins.细菌自溶素的构建模块和蓝图。
PLoS Comput Biol. 2021 Apr 1;17(4):e1008889. doi: 10.1371/journal.pcbi.1008889. eCollection 2021 Apr.
4
Taxonomic Classification for Living Organisms Using Convolutional Neural Networks.使用卷积神经网络对生物进行分类学分类。
Genes (Basel). 2017 Nov 17;8(11):326. doi: 10.3390/genes8110326.
5
Protein remote homology detection based on bidirectional long short-term memory.基于双向长短期记忆的蛋白质远程同源性检测
BMC Bioinformatics. 2017 Oct 10;18(1):443. doi: 10.1186/s12859-017-1842-2.
6
Implementation and comparison of kernel-based learning methods to predict metabolic networks.用于预测代谢网络的基于核的学习方法的实现与比较
Netw Model Anal Health Inform Bioinform. 2016;5(1):26. doi: 10.1007/s13721-016-0134-5. Epub 2016 Jul 15.
7
CMsearch: simultaneous exploration of protein sequence space and structure space improves not only protein homology detection but also protein structure prediction.CMsearch:同时探索蛋白质序列空间和结构空间不仅能改善蛋白质同源性检测,还能提升蛋白质结构预测。
Bioinformatics. 2016 Jun 15;32(12):i332-i340. doi: 10.1093/bioinformatics/btw271.
8
Protein Remote Homology Detection Based on an Ensemble Learning Approach.基于集成学习方法的蛋白质远程同源性检测
Biomed Res Int. 2016;2016:5813645. doi: 10.1155/2016/5813645. Epub 2016 May 8.
9
The recognition of multi-class protein folds by adding average chemical shifts of secondary structure elements.通过添加二级结构元件的平均化学位移来识别多类蛋白质折叠。
Saudi J Biol Sci. 2016 Mar;23(2):189-97. doi: 10.1016/j.sjbs.2015.10.008. Epub 2015 Dec 11.
10
LAF: Logic Alignment Free and its application to bacterial genomes classification.LAF:无逻辑比对及其在细菌基因组分类中的应用。
BioData Min. 2015 Dec 8;8:39. doi: 10.1186/s13040-015-0073-1. eCollection 2015.