• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

鉴定差异表达基因以建立癌症预测的新生物标志物。

Identification of Differentially Expressed Genes to Establish New Biomarker for Cancer Prediction.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2019 Nov-Dec;16(6):1970-1985. doi: 10.1109/TCBB.2018.2837095. Epub 2018 May 16.

DOI:10.1109/TCBB.2018.2837095
PMID:29994718
Abstract

The goal of the human genome project is to integrate genetic information into different clinical therapies. To achieve this goal, different computational algorithms are devised for identifying the biomarker genes, cause of complex diseases. However, most of the methods developed so far using DNA microarray data lack in interpreting biological findings and are less accurate in disease prediction. In the paper, we propose two parameters risk_factor and confusion_factor to identify the biologically significant genes for cancer development. First, we evaluate risk_factor of each gene and the genes with nonzero risk_factor result misclassification of data, therefore removed. Next, we calculate confusion_factor of the remaining genes which determines confusion of a gene in prediction due to closeness of the samples in the cancer and normal classes. We apply nondominated sorting genetic algorithm (NSGA-II) to select the maximally uncorrelated differentially expressed genes in the cancer class with minimum confusion_factor. The proposed Gene Selection Explore (GSE) algorithm is compared to well established feature selection algorithms using 10 microarray data with respect to sensitivity, specificity, and accuracy. The identified genes appear in KEGG pathway and have several biological importance.

摘要

人类基因组计划的目标是将遗传信息整合到不同的临床治疗中。为了实现这一目标,设计了不同的计算算法来识别生物标志物基因,以确定复杂疾病的原因。然而,迄今为止使用 DNA 微阵列数据开发的大多数方法在解释生物学发现方面缺乏准确性,在疾病预测方面的准确性也较低。在本文中,我们提出了两个参数风险因子和混淆因子,以识别癌症发展的生物学意义上的重要基因。首先,我们评估每个基因的风险因子,如果某个基因的风险因子不为零,则说明该基因的数据分类错误,因此将其删除。接下来,我们计算剩余基因的混淆因子,该因子确定了由于癌症和正常样本在接近程度上的差异,一个基因在预测中的混淆程度。我们应用非支配排序遗传算法 (NSGA-II) 来选择癌症类中具有最小混淆因子的最大不相关差异表达基因。使用 10 个微阵列数据集,将所提出的基因选择探索 (GSE) 算法与成熟的特征选择算法进行了比较,比较了它们的敏感性、特异性和准确性。所鉴定的基因出现在 KEGG 途径中,具有几个生物学重要性。

相似文献

1
Identification of Differentially Expressed Genes to Establish New Biomarker for Cancer Prediction.鉴定差异表达基因以建立癌症预测的新生物标志物。
IEEE/ACM Trans Comput Biol Bioinform. 2019 Nov-Dec;16(6):1970-1985. doi: 10.1109/TCBB.2018.2837095. Epub 2018 May 16.
2
New algorithms for multi-class cancer diagnosis using tumor gene expression signatures.使用肿瘤基因表达特征进行多类别癌症诊断的新算法。
Bioinformatics. 2003 Sep 22;19(14):1800-7. doi: 10.1093/bioinformatics/btg238.
3
Feature selection and nearest centroid classification for protein mass spectrometry.蛋白质质谱的特征选择与最近质心分类
BMC Bioinformatics. 2005 Mar 23;6:68. doi: 10.1186/1471-2105-6-68.
4
SamCluster: an integrated scheme for automatic discovery of sample classes using gene expression profile.SamCluster:一种利用基因表达谱自动发现样本类别的综合方案。
Bioinformatics. 2003 May 1;19(7):811-7. doi: 10.1093/bioinformatics/btg095.
5
C-HMOSHSSA: Gene selection for cancer classification using multi-objective meta-heuristic and machine learning methods.C-HMOSHSSA:使用多目标元启发式和机器学习方法进行癌症分类的基因选择。
Comput Methods Programs Biomed. 2019 Sep;178:219-235. doi: 10.1016/j.cmpb.2019.06.029. Epub 2019 Jun 29.
6
Tumor classification and marker gene prediction by feature selection and fuzzy c-means clustering using microarray data.利用微阵列数据通过特征选择和模糊c均值聚类进行肿瘤分类和标记基因预测。
BMC Bioinformatics. 2003 Dec 2;4:60. doi: 10.1186/1471-2105-4-60.
7
Many accurate small-discriminatory feature subsets exist in microarray transcript data: biomarker discovery.微阵列转录数据中存在许多准确的小判别特征子集:生物标志物发现。
BMC Bioinformatics. 2005 Apr 13;6:97. doi: 10.1186/1471-2105-6-97.
8
A centroid-based gene selection method for microarray data classification.一种基于质心的微阵列数据分类基因选择方法。
J Theor Biol. 2016 Jul 7;400:32-41. doi: 10.1016/j.jtbi.2016.03.034. Epub 2016 Apr 4.
9
Noise filtering and nonparametric analysis of microarray data underscores discriminating markers of oral, prostate, lung, ovarian and breast cancer.微阵列数据的噪声过滤和非参数分析突出了口腔癌、前列腺癌、肺癌、卵巢癌和乳腺癌的鉴别标志物。
BMC Bioinformatics. 2004 Nov 29;5:185. doi: 10.1186/1471-2105-5-185.
10
Biomarker identification and cancer classification based on microarray data using Laplace naive Bayes model with mean shrinkage.基于微阵列数据的拉普拉斯朴素贝叶斯模型均值收缩的生物标志物识别和癌症分类。
IEEE/ACM Trans Comput Biol Bioinform. 2012 Nov-Dec;9(6):1649-62. doi: 10.1109/TCBB.2012.105.