• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过分析氨基酸序列预测蛋白质无序状态。

Predicting protein disorder by analyzing amino acid sequence.

作者信息

Yang Jack Y, Yang Mary Qu

机构信息

Harvard Medical School, Harvard University, Cambridge, MA 02115, USA.

出版信息

BMC Genomics. 2008 Sep 16;9 Suppl 2(Suppl 2):S8. doi: 10.1186/1471-2164-9-S2-S8.

DOI:10.1186/1471-2164-9-S2-S8
PMID:18831799
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2559898/
Abstract

BACKGROUND

Many protein regions and some entire proteins have no definite tertiary structure, presenting instead as dynamic, disorder ensembles under different physiochemical circumstances. These proteins and regions are known as Intrinsically Unstructured Proteins (IUP). IUP have been associated with a wide range of protein functions, along with roles in diseases characterized by protein misfolding and aggregation.

RESULTS

Identifying IUP is important task in structural and functional genomics. We exact useful features from sequences and develop machine learning algorithms for the above task. We compare our IUP predictor with PONDRs (mainly neural-network-based predictors), disEMBL (also based on neural networks) and Globplot (based on disorder propensity).

CONCLUSION

We find that augmenting features derived from physiochemical properties of amino acids (such as hydrophobicity, complexity etc.) and using ensemble method proved beneficial. The IUP predictor is a viable alternative software tool for identifying IUP protein regions and proteins.

摘要

背景

许多蛋白质区域以及一些完整蛋白质没有确定的三级结构,而是在不同的物理化学环境下呈现为动态的无序集合体。这些蛋白质和区域被称为内在无序蛋白质(IUP)。IUP与广泛的蛋白质功能相关,同时也在以蛋白质错误折叠和聚集为特征的疾病中发挥作用。

结果

识别IUP是结构和功能基因组学中的一项重要任务。我们从序列中提取有用特征,并为上述任务开发机器学习算法。我们将我们的IUP预测器与PONDRs(主要基于神经网络的预测器)、disEMBL(也基于神经网络)和Globplot(基于无序倾向)进行比较。

结论

我们发现增加从氨基酸物理化学性质(如疏水性、复杂性等)衍生的特征并使用集成方法被证明是有益的。该IUP预测器是识别IUP蛋白质区域和蛋白质的一个可行的替代软件工具。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/171cc166d247/1471-2164-9-S2-S8-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/0a66b1ca5c7b/1471-2164-9-S2-S8-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/7ff62ddc0e0d/1471-2164-9-S2-S8-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/171cc166d247/1471-2164-9-S2-S8-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/0a66b1ca5c7b/1471-2164-9-S2-S8-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/7ff62ddc0e0d/1471-2164-9-S2-S8-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4bad/2559898/171cc166d247/1471-2164-9-S2-S8-3.jpg

相似文献

1
Predicting protein disorder by analyzing amino acid sequence.通过分析氨基酸序列预测蛋白质无序状态。
BMC Genomics. 2008 Sep 16;9 Suppl 2(Suppl 2):S8. doi: 10.1186/1471-2164-9-S2-S8.
2
Identification of Intrinsically Unstructured Proteins using hierarchical classifier.使用层次分类器识别内在无序蛋白质。
Int J Data Min Bioinform. 2008;2(2):121-33. doi: 10.1504/ijdmb.2008.019093.
3
PrDOS: prediction of disordered protein regions from amino acid sequence.PrDOS:从氨基酸序列预测无序蛋白质区域
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W460-4. doi: 10.1093/nar/gkm363. Epub 2007 Jun 12.
4
SCPRED: accurate prediction of protein structural class for sequences of twilight-zone similarity with predicting sequences.SCPRED:对与预测序列具有模糊相似性的序列的蛋白质结构类别进行准确预测。
BMC Bioinformatics. 2008 May 1;9:226. doi: 10.1186/1471-2105-9-226.
5
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.
6
Glycosylation site prediction using ensembles of Support Vector Machine classifiers.使用支持向量机分类器集成进行糖基化位点预测。
BMC Bioinformatics. 2007 Nov 9;8:438. doi: 10.1186/1471-2105-8-438.
7
GlobPlot: Exploring protein sequences for globularity and disorder.GlobPlot:探索蛋白质序列的球状性和无序性。
Nucleic Acids Res. 2003 Jul 1;31(13):3701-8. doi: 10.1093/nar/gkg519.
8
IUPred: web server for the prediction of intrinsically unstructured regions of proteins based on estimated energy content.IUPred:基于估计能量含量预测蛋白质内在无序区域的网络服务器。
Bioinformatics. 2005 Aug 15;21(16):3433-4. doi: 10.1093/bioinformatics/bti541. Epub 2005 Jun 14.
9
A new similarity measure among protein sequences.一种蛋白质序列间新的相似性度量方法。
Proc IEEE Comput Soc Bioinform Conf. 2003;2:347-52.
10
Two multi-classification strategies used on SVM to predict protein structural classes by using auto covariance.两种使用自协方差的 SVM 多分类策略用于预测蛋白质结构类别。
Interdiscip Sci. 2009 Dec;1(4):315-9. doi: 10.1007/s12539-009-0066-1. Epub 2009 Nov 14.

引用本文的文献

1
DisPredict: A Predictor of Disordered Protein Using Optimized RBF Kernel.DisPredict:一种使用优化径向基函数核的无序蛋白质预测器。
PLoS One. 2015 Oct 30;10(10):e0141551. doi: 10.1371/journal.pone.0141551. eCollection 2015.
2
Genomics, molecular imaging, bioinformatics, and bio-nano-info integration are synergistic components of translational medicine and personalized healthcare research.基因组学、分子成像、生物信息学以及生物纳米信息整合是转化医学和个性化医疗研究的协同组成部分。
BMC Genomics. 2008 Sep 16;9 Suppl 2(Suppl 2):I1. doi: 10.1186/1471-2164-9-S2-I1.

本文引用的文献

1
Classification and knowledge discovery in protein databases.蛋白质数据库中的分类与知识发现。
J Biomed Inform. 2004 Aug;37(4):224-39. doi: 10.1016/j.jbi.2004.07.008.
2
Protein disorder prediction: implications for structural proteomics.蛋白质无序预测:对结构蛋白质组学的影响。
Structure. 2003 Nov;11(11):1453-9. doi: 10.1016/j.str.2003.10.002.
3
GlobPlot: Exploring protein sequences for globularity and disorder.GlobPlot:探索蛋白质序列的球状性和无序性。
Nucleic Acids Res. 2003 Jul 1;31(13):3701-8. doi: 10.1093/nar/gkg519.
4
Intrinsic disorder and protein function.内在无序与蛋白质功能。
Biochemistry. 2002 May 28;41(21):6573-82. doi: 10.1021/bi012159+.
5
The protein trinity--linking function and disorder.蛋白质三元体——连接功能与无序状态
Nat Biotechnol. 2001 Sep;19(9):805-6. doi: 10.1038/nbt0901-805.
6
A simple method for displaying the hydropathic character of a protein.一种展示蛋白质亲水性特征的简单方法。
J Mol Biol. 1982 May 5;157(1):105-32. doi: 10.1016/0022-2836(82)90515-0.