• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

提高从微阵列功能基因组学数据中进行基因选择的可靠性。

Improving reliability of gene selection from microarray functional genomics data.

作者信息

Fu Li M, Youn Eun Seog

机构信息

University of Florida, Gainesville, FL 32611, USA.

出版信息

IEEE Trans Inf Technol Biomed. 2003 Sep;7(3):191-6. doi: 10.1109/titb.2003.816558.

DOI:10.1109/titb.2003.816558
PMID:14518732
Abstract

Constructing a classifier based on microarray gene expression data has recently emerged as an important problem for cancer classification. Recent results have suggested the feasibility of constructing such a classifier with reasonable predictive accuracy under the circumstance where only a small number of cancer tissue samples of known type are available. Difficulty arises from the fact that each sample contains the expression data of a vast number of genes and these genes may interact with one another. Selection of a small number of critical genes is fundamental to correctly analyze the otherwise overwhelming data. It is essential to use a multivariate approach for capturing the correlated structure in the data. However, the curse of dimensionality leads to the concern about the reliability of selected genes. Here, we present a new gene selection method in which error and repeatability of selected genes are assessed within the context of M-fold cross-validation. In particular, we show that the method is able to identify source variables underlying data generation.

摘要

基于微阵列基因表达数据构建分类器最近已成为癌症分类中的一个重要问题。最近的结果表明,在仅有少量已知类型的癌组织样本可用的情况下,构建具有合理预测准确性的此类分类器是可行的。困难在于每个样本都包含大量基因的表达数据,并且这些基因可能相互作用。选择少量关键基因是正确分析原本海量数据的基础。使用多变量方法来捕捉数据中的相关结构至关重要。然而,维度诅咒引发了对所选基因可靠性的担忧。在此,我们提出一种新的基因选择方法,其中在M折交叉验证的背景下评估所选基因的误差和可重复性。特别是,我们表明该方法能够识别数据生成背后的源变量。

相似文献

1
Improving reliability of gene selection from microarray functional genomics data.提高从微阵列功能基因组学数据中进行基因选择的可靠性。
IEEE Trans Inf Technol Biomed. 2003 Sep;7(3):191-6. doi: 10.1109/titb.2003.816558.
2
Reliable classification of two-class cancer data using evolutionary algorithms.使用进化算法对两类癌症数据进行可靠分类。
Biosystems. 2003 Nov;72(1-2):111-29. doi: 10.1016/s0303-2647(03)00138-2.
3
Evaluation of gene importance in microarray data based upon probability of selection.基于选择概率评估微阵列数据中的基因重要性。
BMC Bioinformatics. 2005 Mar 22;6:67. doi: 10.1186/1471-2105-6-67.
4
Simultaneous gene clustering and subset selection for sample classification via MDL.通过最小描述长度实现用于样本分类的同步基因聚类和子集选择
Bioinformatics. 2003 Jun 12;19(9):1100-9. doi: 10.1093/bioinformatics/btg039.
5
Effective dimension reduction methods for tumor classification using gene expression data.使用基因表达数据进行肿瘤分类的有效降维方法。
Bioinformatics. 2003 Mar 22;19(5):563-70. doi: 10.1093/bioinformatics/btg062.
6
SamCluster: an integrated scheme for automatic discovery of sample classes using gene expression profile.SamCluster:一种利用基因表达谱自动发现样本类别的综合方案。
Bioinformatics. 2003 May 1;19(7):811-7. doi: 10.1093/bioinformatics/btg095.
7
A CART-based approach to discover emerging patterns in microarray data.一种基于CART的方法来发现微阵列数据中的新兴模式。
Bioinformatics. 2003 Dec 12;19(18):2465-72. doi: 10.1093/bioinformatics/btg361.
8
An unsupervised hierarchical dynamic self-organizing approach to cancer class discovery and marker gene identification in microarray data.一种用于微阵列数据中癌症类别发现和标记基因识别的无监督分层动态自组织方法。
Bioinformatics. 2003 Nov 1;19(16):2131-40. doi: 10.1093/bioinformatics/btg296.
9
Bayesian class discovery in microarray datasets.微阵列数据集中的贝叶斯类发现
IEEE Trans Biomed Eng. 2004 May;51(5):707-18. doi: 10.1109/TBME.2004.824139.
10
Bayesian automatic relevance determination algorithms for classifying gene expression data.用于基因表达数据分类的贝叶斯自动相关性确定算法。
Bioinformatics. 2002 Oct;18(10):1332-9. doi: 10.1093/bioinformatics/18.10.1332.

引用本文的文献

1
Clustering of serum biomarkers involved in post-aneurysmal subarachnoid hemorrhage (aSAH) complications.与颅内动脉瘤性蛛网膜下腔出血(aSAH)后并发症相关的血清生物标志物聚类。
Neurosurg Rev. 2023 Mar 3;46(1):63. doi: 10.1007/s10143-023-01967-9.
2
Hippocampal shape analysis of Alzheimer disease based on machine learning methods.基于机器学习方法的阿尔茨海默病海马体形状分析
AJNR Am J Neuroradiol. 2007 Aug;28(7):1339-45. doi: 10.3174/ajnr.A0620.
3
Evaluation of gene importance in microarray data based upon probability of selection.基于选择概率评估微阵列数据中的基因重要性。
BMC Bioinformatics. 2005 Mar 22;6:67. doi: 10.1186/1471-2105-6-67.