• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

从多种数据类型中学习基因功能分类。

Learning gene functional classifications from multiple data types.

作者信息

Pavlidis Paul, Weston Jason, Cai Jinsong, Noble William Stafford

机构信息

Columbia Genome Center, Columbia University, New York, NY 10027, USA.

出版信息

J Comput Biol. 2002;9(2):401-11. doi: 10.1089/10665270252935539.

DOI:10.1089/10665270252935539
PMID:12015889
Abstract

In our attempts to understand cellular function at the molecular level, we must be able to synthesize information from disparate types of genomic data. We consider the problem of inferring gene functional classifications from a heterogeneous data set consisting of DNA microarray expression measurements and phylogenetic profiles from whole-genome sequence comparisons. We demonstrate the application of the support vector machine (SVM) learning algorithm to this functional inference task. Our results suggest the importance of exploiting prior information about the heterogeneity of the data. In particular, we propose an SVM kernel function that is explicitly heterogeneous. In addition, we describe feature scaling methods for further exploiting prior knowledge of heterogeneity by giving each data type different weights.

摘要

在我们试图从分子水平理解细胞功能的过程中,我们必须能够整合来自不同类型基因组数据的信息。我们考虑从一个由DNA微阵列表达测量值和全基因组序列比较的系统发育谱组成的异构数据集中推断基因功能分类的问题。我们展示了支持向量机(SVM)学习算法在这个功能推断任务中的应用。我们的结果表明利用关于数据异质性的先验信息的重要性。特别是,我们提出了一种明确异构的SVM核函数。此外,我们描述了特征缩放方法,通过给每种数据类型赋予不同的权重来进一步利用异质性的先验知识。

相似文献

1
Learning gene functional classifications from multiple data types.从多种数据类型中学习基因功能分类。
J Comput Biol. 2002;9(2):401-11. doi: 10.1089/10665270252935539.
2
The advantage of functional prediction based on clustering of yeast genes and its correlation with non-sequence based classifications.基于酵母基因聚类的功能预测优势及其与非序列分类的相关性。
J Comput Biol. 2002;9(2):193-210. doi: 10.1089/10665270252935412.
3
Systematic learning of gene functional classes from DNA array expression data by using multilayer perceptrons.利用多层感知器从DNA阵列表达数据中系统学习基因功能类别。
Genome Res. 2002 Nov;12(11):1703-15. doi: 10.1101/gr.192502.
4
Integrating genomic data to predict transcription factor binding.整合基因组数据以预测转录因子结合
Genome Inform. 2005;16(1):83-94.
5
Inferring genetic networks from DNA microarray data by multiple regression analysis.通过多元回归分析从DNA微阵列数据推断基因网络。
Genome Inform Ser Workshop Genome Inform. 2000;11:118-28.
6
A DSRPCL-SVM approach to informative gene analysis.一种用于信息基因分析的DSRPCL-SVM方法。
Genomics Proteomics Bioinformatics. 2008 Jun;6(2):83-90. doi: 10.1016/S1672-0229(08)60023-6.
7
Decomposing gene expression into cellular processes.将基因表达分解为细胞过程。
Pac Symp Biocomput. 2003:89-100. doi: 10.1142/9789812776303_0009.
8
Artificial intelligence techniques for bioinformatics.用于生物信息学的人工智能技术
Appl Bioinformatics. 2002;1(4):191-222.
9
Correlation and prediction of gene expression level from amino acid and dipeptide composition of its protein.基于蛋白质的氨基酸和二肽组成对基因表达水平进行相关性分析与预测。
BMC Bioinformatics. 2005 Mar 17;6:59. doi: 10.1186/1471-2105-6-59.
10
Module networks: identifying regulatory modules and their condition-specific regulators from gene expression data.模块网络:从基因表达数据中识别调控模块及其特定条件下的调控因子。
Nat Genet. 2003 Jun;34(2):166-76. doi: 10.1038/ng1165.

引用本文的文献

1
Gene Target Prediction of Environmental Chemicals Using Coupled Matrix-Matrix Completion.利用耦合矩阵-矩阵补全技术进行环境化学物的基因靶点预测。
Environ Sci Technol. 2024 Apr 2;58(13):5889-5898. doi: 10.1021/acs.est.4c00458. Epub 2024 Mar 19.
2
Integration of pan-cancer multi-omics data for novel mixed subgroup identification using machine learning methods.基于机器学习方法的泛癌多组学生物标志物数据整合,用于新型混合亚组鉴定。
PLoS One. 2023 Oct 19;18(10):e0287176. doi: 10.1371/journal.pone.0287176. eCollection 2023.
3
Multimodal data fusion for cancer biomarker discovery with deep learning.
用于癌症生物标志物发现的深度学习多模态数据融合
Nat Mach Intell. 2023 Apr;5(4):351-362. doi: 10.1038/s42256-023-00633-5. Epub 2023 Apr 6.
4
Machine learning based combination of multi-omics data for subgroup identification in non-small cell lung cancer.基于机器学习的多组学生物标志物数据融合分析用于非小细胞肺癌亚组鉴定。
Sci Rep. 2023 Mar 21;13(1):4636. doi: 10.1038/s41598-023-31426-w.
5
Machine learning in postgenomic biology and personalized medicine.后基因组生物学与个性化医学中的机器学习
Wiley Interdiscip Rev Data Min Knowl Discov. 2022 Mar-Apr;12(2). doi: 10.1002/widm.1451. Epub 2022 Jan 24.
6
Breast cancer stage prediction: a computational approach guided by transcriptome analysis.乳腺癌分期预测:基于转录组分析的计算方法。
Mol Genet Genomics. 2022 Nov;297(6):1467-1479. doi: 10.1007/s00438-022-01932-z. Epub 2022 Aug 3.
7
Heterogeneous data integration methods for patient similarity networks.用于患者相似网络的异质数据集成方法。
Brief Bioinform. 2022 Jul 18;23(4). doi: 10.1093/bib/bbac207.
8
Unsupervised Algorithms for Microarray Sample Stratification.非监督算法在微阵列样本分层中的应用。
Methods Mol Biol. 2022;2401:121-146. doi: 10.1007/978-1-0716-1839-4_9.
9
Fusing imperfect experimental data for risk assessment of musculoskeletal disorders in construction using canonical polyadic decomposition.使用典范多向分解融合不完美的实验数据以评估建筑行业肌肉骨骼疾病的风险
Autom Constr. 2020 Nov;119. doi: 10.1016/j.autcon.2020.103322.
10
MKL-GRNI: A parallel multiple kernel learning approach for supervised inference of large-scale gene regulatory networks.MKL-GRNI:一种用于大规模基因调控网络监督推理的并行多核学习方法。
PeerJ Comput Sci. 2021 Jan 28;7:e363. doi: 10.7717/peerj-cs.363. eCollection 2021.