• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

应用于基因表达数据分析的多类预测的遗传算法。

Genetic algorithms applied to multi-class prediction for the analysis of gene expression data.

作者信息

Ooi C H, Tan Patrick

机构信息

Nanyang Technological University, School of Mechanical and Production Engineering, 50 Nanyang Avenue, Singapore 639798, Republic of Singapore.

出版信息

Bioinformatics. 2003 Jan;19(1):37-44. doi: 10.1093/bioinformatics/19.1.37.

DOI:10.1093/bioinformatics/19.1.37
PMID:12499291
Abstract

MOTIVATION

An important challenge in the use of large-scale gene expression data for biological classification occurs when the expression dataset being analyzed involves multiple classes. Key issues that need to be addressed under such circumstances are the efficient selection of good predictive gene groups from datasets that are inherently 'noisy', and the development of new methodologies that can enhance the successful classification of these complex datasets.

METHODS

We have applied genetic algorithms (GAs) to the problem of multi-class prediction. A GA-based gene selection scheme is described that automatically determines the members of a predictive gene group, as well as the optimal group size, that maximizes classification success using a maximum likelihood (MLHD) classification method.

RESULTS

The GA/MLHD-based approach achieves higher classification accuracies than other published predictive methods on the same multi-class test dataset. It also permits substantial feature reduction in classifier genesets without compromising predictive accuracy. We propose that GA-based algorithms may represent a powerful new tool in the analysis and exploration of complex multi-class gene expression data.

AVAILABILITY

Supplementary information, data sets and source codes are available at http://www.omniarray.com/bioinformatics/GA.

摘要

动机

当所分析的基因表达数据集涉及多个类别时,在利用大规模基因表达数据进行生物学分类方面会出现一个重要挑战。在这种情况下需要解决的关键问题是,从本质上“有噪声”的数据集中高效选择良好的预测基因组,以及开发能够提高这些复杂数据集成功分类的新方法。

方法

我们将遗传算法(GA)应用于多类别预测问题。描述了一种基于GA的基因选择方案,该方案使用最大似然(MLHD)分类方法自动确定预测基因组的成员以及最优组大小,以最大化分类成功率。

结果

基于GA/MLHD的方法在相同的多类别测试数据集上比其他已发表的预测方法取得了更高的分类准确率。它还允许在不影响预测准确性的情况下大幅减少分类器基因集的特征数量。我们提出基于GA的算法可能是分析和探索复杂多类别基因表达数据的一种强大新工具。

可用性

补充信息、数据集和源代码可在http://www.omniarray.com/bioinformatics/GA获取。

相似文献

1
Genetic algorithms applied to multi-class prediction for the analysis of gene expression data.应用于基因表达数据分析的多类预测的遗传算法。
Bioinformatics. 2003 Jan;19(1):37-44. doi: 10.1093/bioinformatics/19.1.37.
2
SamCluster: an integrated scheme for automatic discovery of sample classes using gene expression profile.SamCluster:一种利用基因表达谱自动发现样本类别的综合方案。
Bioinformatics. 2003 May 1;19(7):811-7. doi: 10.1093/bioinformatics/btg095.
3
Multi-class cancer classification via partial least squares with gene expression profiles.基于基因表达谱的偏最小二乘法进行多类别癌症分类
Bioinformatics. 2002 Sep;18(9):1216-26. doi: 10.1093/bioinformatics/18.9.1216.
4
Gene expression data analysis with a dynamically extended self-organized map that exploits class information.利用类信息的动态扩展自组织映射进行基因表达数据分析。
Bioinformatics. 2002 Nov;18(11):1446-53. doi: 10.1093/bioinformatics/18.11.1446.
5
Bayesian automatic relevance determination algorithms for classifying gene expression data.用于基因表达数据分类的贝叶斯自动相关性确定算法。
Bioinformatics. 2002 Oct;18(10):1332-9. doi: 10.1093/bioinformatics/18.10.1332.
6
New algorithms for multi-class cancer diagnosis using tumor gene expression signatures.使用肿瘤基因表达特征进行多类别癌症诊断的新算法。
Bioinformatics. 2003 Sep 22;19(14):1800-7. doi: 10.1093/bioinformatics/btg238.
7
Reliable classification of two-class cancer data using evolutionary algorithms.使用进化算法对两类癌症数据进行可靠分类。
Biosystems. 2003 Nov;72(1-2):111-29. doi: 10.1016/s0303-2647(03)00138-2.
8
Class prediction and discovery using gene microarray and proteomics mass spectroscopy data: curses, caveats, cautions.利用基因微阵列和蛋白质组质谱数据进行类别预测与发现:问题、注意事项、警示
Bioinformatics. 2003 Aug 12;19(12):1484-91. doi: 10.1093/bioinformatics/btg182.
9
Selecting a minimal number of relevant genes from microarray data to design accurate tissue classifiers.从微阵列数据中选择最少数量的相关基因以设计精确的组织分类器。
Biosystems. 2007 Jul-Aug;90(1):78-86. doi: 10.1016/j.biosystems.2006.07.002. Epub 2006 Jul 10.
10
Computational selection of distinct class- and subclass-specific gene expression signatures.不同类别和亚类特异性基因表达特征的计算选择。
J Biomed Inform. 2002 Jun;35(3):160-70. doi: 10.1016/s1532-0464(02)00525-7.

引用本文的文献

1
oFVSD: a Python package of optimized forward variable selection decoder for high-dimensional neuroimaging data.oFVSD:用于高维神经成像数据的优化前向变量选择解码器的Python软件包。
Front Neuroinform. 2023 Sep 26;17:1266713. doi: 10.3389/fninf.2023.1266713. eCollection 2023.
2
Combining Gaussian Process with Hybrid Optimal Feature Decision in Cuffless Blood Pressure Estimation.在无袖带血压估计中结合高斯过程与混合最优特征决策
Diagnostics (Basel). 2023 Feb 15;13(4):736. doi: 10.3390/diagnostics13040736.
3
Determination of biomarkers from microarray data using graph neural network and spectral clustering.
基于图神经网络和谱聚类的基因表达谱数据中生物标志物的确定。
Sci Rep. 2021 Dec 13;11(1):23828. doi: 10.1038/s41598-021-03316-6.
4
Feature Selection for Topological Proximity Prediction of Single-Cell Transcriptomic Profiles in Embryo Using Genetic Algorithm.基于遗传算法的胚胎单细胞转录组图谱拓扑邻近预测的特征选择
Genes (Basel). 2020 Dec 28;12(1):28. doi: 10.3390/genes12010028.
5
Integrative Gene Selection on Gene Expression Data: Providing Biological Context to Traditional Approaches.基因表达数据的整合基因选择:为传统方法提供生物学背景。
J Integr Bioinform. 2018 Dec 22;16(1):20180064. doi: 10.1515/jib-2018-0064.
6
Identification of tissue-specific tumor biomarker using different optimization algorithms.使用不同优化算法鉴定组织特异性肿瘤生物标志物。
Genes Genomics. 2019 Apr;41(4):431-443. doi: 10.1007/s13258-018-0773-2. Epub 2018 Dec 8.
7
The Applications of Genetic Algorithms in Medicine.遗传算法在医学中的应用。
Oman Med J. 2015 Nov;30(6):406-16. doi: 10.5001/omj.2015.82.
8
In silico discovery of significant pathways in colorectal cancer metastasis using a two-stage optimisation approach.使用两阶段优化方法在计算机上发现结直肠癌转移中的重要通路。
IET Syst Biol. 2015 Dec;9(6):294-302. doi: 10.1049/iet-syb.2015.0031.
9
Linking Genes to Cardiovascular Diseases: Gene Action and Gene-Environment Interactions.将基因与心血管疾病相联系:基因作用与基因-环境相互作用
J Cardiovasc Transl Res. 2015 Dec;8(9):506-27. doi: 10.1007/s12265-015-9658-9. Epub 2015 Nov 6.
10
A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data.应用于微阵列数据的特征选择与特征提取方法综述
Adv Bioinformatics. 2015;2015:198363. doi: 10.1155/2015/198363. Epub 2015 Jun 11.