• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

谱核:一种用于支持向量机蛋白质分类的字符串核。

The spectrum kernel: a string kernel for SVM protein classification.

作者信息

Leslie Christina, Eskin Eleazar, Noble William Stafford

机构信息

Department of Computer Science, Columbia University, New York, NY 10027, USA.

出版信息

Pac Symp Biocomput. 2002:564-75.

PMID:11928508
Abstract

We introduce a new sequence-similarity kernel, the spectrum kernel, for use with support vector machines (SVMs) in a discriminative approach to the protein classification problem. Our kernel is conceptually simple and efficient to compute and, in experiments on the SCOP database, performs well in comparison with state-of-the-art methods for homology detection. Moreover, our method produces an SVM classifier that allows linear time classification of test sequences. Our experiments provide evidence that string-based kernels, in conjunction with SVMs, could offer a viable and computationally efficient alternative to other methods of protein classification and homology detection.

摘要

我们引入了一种新的序列相似性核——谱核,用于支持向量机(SVM),以一种判别式方法解决蛋白质分类问题。我们的核在概念上简单且计算高效,并且在SCOP数据库上的实验中,与用于同源性检测的现有最先进方法相比表现良好。此外,我们的方法产生了一个支持向量机分类器,它允许对测试序列进行线性时间分类。我们的实验证明,基于字符串的核与支持向量机相结合,可以为蛋白质分类和同源性检测的其他方法提供一种可行且计算高效的替代方案。

相似文献

1
The spectrum kernel: a string kernel for SVM protein classification.谱核:一种用于支持向量机蛋白质分类的字符串核。
Pac Symp Biocomput. 2002:564-75.
2
Mismatch string kernels for discriminative protein classification.用于判别式蛋白质分类的错配字符串核
Bioinformatics. 2004 Mar 1;20(4):467-76. doi: 10.1093/bioinformatics/btg431. Epub 2004 Jan 22.
3
Remote protein homology detection and fold recognition using two-layer support vector machine classifiers.使用两层支持向量机分类器进行远程蛋白质同源检测和折叠识别。
Comput Biol Med. 2011 Aug;41(8):687-99. doi: 10.1016/j.compbiomed.2011.06.004. Epub 2011 Jun 25.
4
Profile-based string kernels for remote homology detection and motif extraction.基于轮廓的字符串核用于远程同源性检测和基序提取。
J Bioinform Comput Biol. 2005 Jun;3(3):527-50. doi: 10.1142/s021972000500120x.
5
Protein homology detection using string alignment kernels.使用字符串比对核进行蛋白质同源性检测。
Bioinformatics. 2004 Jul 22;20(11):1682-9. doi: 10.1093/bioinformatics/bth141. Epub 2004 Feb 26.
6
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.
7
Application of latent semantic analysis to protein remote homology detection.潜在语义分析在蛋白质远程同源性检测中的应用。
Bioinformatics. 2006 Feb 1;22(3):285-90. doi: 10.1093/bioinformatics/bti801. Epub 2005 Nov 29.
8
Efficient classification for additive kernel SVMs.加法核支持向量机的高效分类。
IEEE Trans Pattern Anal Mach Intell. 2013 Jan;35(1):66-77. doi: 10.1109/TPAMI.2012.62.
9
Profile-based string kernels for remote homology detection and motif extraction.基于轮廓的字符串核用于远程同源性检测和基序提取。
Proc IEEE Comput Syst Bioinform Conf. 2004:152-60. doi: 10.1109/csb.2004.1332428.
10
Application of string kernels in protein sequence classification.字符串核在蛋白质序列分类中的应用。
Appl Bioinformatics. 2005;4(1):45-52. doi: 10.2165/00822942-200504010-00005.

引用本文的文献

1
Learning sequence-function relationships with scalable, interpretable Gaussian processes.通过可扩展、可解释的高斯过程学习序列-函数关系。
bioRxiv. 2025 Aug 19:2025.08.15.670613. doi: 10.1101/2025.08.15.670613.
2
Benchmarking transcription factor binding site prediction models: a comparative analysis on synthetic and biological data.基准测试转录因子结合位点预测模型:对合成数据和生物数据的比较分析
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf363.
3
LncRNA Subcellular Localization Across Diverse Cell Lines: An Exploration Using Deep Learning with Inexact -mers.
跨多种细胞系的长链非编码RNA亚细胞定位:使用含不精确k聚体的深度学习进行的探索
Noncoding RNA. 2025 Jun 25;11(4):49. doi: 10.3390/ncrna11040049.
4
Genomic prediction with kinship-based multiple kernel learning produces hypothesis on the underlying inheritance mechanisms of phenotypic traits.基于亲缘关系的多核学习进行基因组预测,能够对表型性状的潜在遗传机制提出假设。
Genome Biol. 2025 Apr 4;26(1):84. doi: 10.1186/s13059-025-03544-3.
5
Active learning of enhancers and silencers in the developing neural retina.发育中的神经视网膜中增强子和沉默子的主动学习
Cell Syst. 2025 Jan 15;16(1):101163. doi: 10.1016/j.cels.2024.12.004. Epub 2025 Jan 7.
6
A privacy-preserving approach for cloud-based protein fold recognition.一种基于云的蛋白质折叠识别的隐私保护方法。
Patterns (N Y). 2024 Jul 19;5(9):101023. doi: 10.1016/j.patter.2024.101023. eCollection 2024 Sep 13.
7
Attenuation Measuring Ultrasound Shearwave Elastography (AMUSE) as Noninvasive Imaging Biomarker for Liver Acute Cellular Rejection.衰减测量超声剪切波弹性成像(AMUSE)作为肝急性细胞排斥的无创成像生物标志物。
Ultrasound Med Biol. 2025 Jan;51(1):149-158. doi: 10.1016/j.ultrasmedbio.2024.09.018. Epub 2024 Oct 16.
8
Machine Learning to Predict Enzyme-Substrate Interactions in Elucidation of Synthesis Pathways: A Review.用于阐明合成途径的预测酶-底物相互作用的机器学习:综述。
Metabolites. 2024 Mar 7;14(3):154. doi: 10.3390/metabo14030154.
9
Efficient model selection for predictive pattern mining model by safe pattern pruning.通过安全模式剪枝实现预测模式挖掘模型的高效模型选择。
Patterns (N Y). 2023 Dec 1;4(12):100890. doi: 10.1016/j.patter.2023.100890. eCollection 2023 Dec 8.
10
Active learning of enhancer and silencer regulatory grammar in photoreceptors.光感受器中增强子和沉默子调控语法的主动学习
bioRxiv. 2023 Aug 22:2023.08.21.554146. doi: 10.1101/2023.08.21.554146.