• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于检测基因组序列中信号的马尔可夫编码

Markov encoding for detecting signals in genomic sequences.

作者信息

Rajapakse Jagath C, Ho Loi Sy

机构信息

BioInformatics Research Center, School of Computer Engineering, Nanyang Technological University, Singapore 639798.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2005 Apr-Jun;2(2):131-42. doi: 10.1109/TCBB.2005.27.

DOI:10.1109/TCBB.2005.27
PMID:17044178
Abstract

We present a technique to encode the inputs to neural networks for the detection of signals in genomic sequences. The encoding is based on lower-order Markov models which incorporate known biological characteristics in genomic sequences. The neural networks then learn intrinsic higher-order dependencies of nucleotides at the signal sites. We demonstrate the efficacy of the Markov encoding method in the detection of three genomic signals, namely, splice sites, transcription start sites, and translation initiation sites.

摘要

我们提出了一种对神经网络的输入进行编码的技术,用于检测基因组序列中的信号。这种编码基于低阶马尔可夫模型,该模型纳入了基因组序列中已知的生物学特征。然后,神经网络学习信号位点处核苷酸的内在高阶依赖性。我们证明了马尔可夫编码方法在检测三种基因组信号(即剪接位点、转录起始位点和翻译起始位点)方面的有效性。

相似文献

1
Markov encoding for detecting signals in genomic sequences.用于检测基因组序列中信号的马尔可夫编码
IEEE/ACM Trans Comput Biol Bioinform. 2005 Apr-Jun;2(2):131-42. doi: 10.1109/TCBB.2005.27.
2
Recognition of cis-regulatory elements with vombat.使用袋熊识别顺式调控元件。
J Bioinform Comput Biol. 2007 Apr;5(2B):561-77. doi: 10.1142/s0219720007002886.
3
Generalized hierarchical markov models for the discovery of length-constrained sequence features from genome tiling arrays.用于从基因组平铺阵列中发现长度受限序列特征的广义分层马尔可夫模型。
Biometrics. 2007 Sep;63(3):797-805. doi: 10.1111/j.1541-0420.2007.00760.x.
4
Adding sequence context to a Markov background model improves the identification of regulatory elements.为马尔可夫背景模型添加序列上下文可改善调控元件的识别。
Bioinformatics. 2006 Dec 1;22(23):2870-5. doi: 10.1093/bioinformatics/btl528. Epub 2006 Oct 26.
5
Finding cis-regulatory modules in Drosophila using phylogenetic hidden Markov models.使用系统发育隐马尔可夫模型在果蝇中寻找顺式调控模块。
Bioinformatics. 2007 Aug 15;23(16):2031-7. doi: 10.1093/bioinformatics/btm299. Epub 2007 Jun 5.
6
BioHMM: a heterogeneous hidden Markov model for segmenting array CGH data.BioHMM:一种用于分割阵列比较基因组杂交数据的异构隐马尔可夫模型。
Bioinformatics. 2006 May 1;22(9):1144-6. doi: 10.1093/bioinformatics/btl089. Epub 2006 Mar 13.
7
Eukaryotic gene prediction using GeneMark.hmm.使用GeneMark.hmm进行真核基因预测。
Curr Protoc Bioinformatics. 2003 May;Chapter 4:Unit4.6. doi: 10.1002/0471250953.bi0406s01.
8
Discriminative discovery of transcription factor binding sites from location data.从定位数据中鉴别性发现转录因子结合位点
Proc IEEE Comput Syst Bioinform Conf. 2005:86-9. doi: 10.1109/csb.2005.30.
9
Bayesian classifiers for detecting HGT using fixed and variable order markov models of genomic signatures.使用基因组特征的固定和可变阶马尔可夫模型检测水平基因转移的贝叶斯分类器。
Bioinformatics. 2006 Mar 1;22(5):517-22. doi: 10.1093/bioinformatics/btk029. Epub 2006 Jan 10.
10
Splice site detection with a higher-order markov model implemented on a neural network.基于神经网络实现的高阶马尔可夫模型进行剪接位点检测。
Genome Inform. 2003;14:64-72.

引用本文的文献

1
From tradition to innovation: conventional and deep learning frameworks in genome annotation.从传统到创新:基因组注释中的常规和深度学习框架。
Brief Bioinform. 2024 Mar 27;25(3). doi: 10.1093/bib/bbae138.
2
CNNSplice: Robust models for splice site prediction using convolutional neural networks.CNNSplice:使用卷积神经网络进行剪接位点预测的稳健模型。
Comput Struct Biotechnol J. 2023 May 30;21:3210-3223. doi: 10.1016/j.csbj.2023.05.031. eCollection 2023.
3
A high-performance approach for predicting donor splice sites based on short window size and imbalanced large samples.
基于短窗口大小和不平衡大样本的供体剪接位点预测的高性能方法。
Biol Direct. 2019 Apr 11;14(1):6. doi: 10.1186/s13062-019-0236-y.
4
Prediction of donor splice sites using random forest with a new sequence encoding approach.使用随机森林和一种新的序列编码方法预测供体剪接位点。
BioData Min. 2016 Jan 22;9:4. doi: 10.1186/s13040-016-0086-4. eCollection 2016.
5
A statistical approach for 5' splice site prediction using short sequence motifs and without encoding sequence data.一种使用短序列基序且无需编码序列数据来预测5'剪接位点的统计方法。
BMC Bioinformatics. 2014 Nov 25;15:362. doi: 10.1186/s12859-014-0362-6.
6
Dragon TIS Spotter: an Arabidopsis-derived predictor of translation initiation sites in plants.龙 TIS 定位器:一种源自拟南芥的植物翻译起始位点预测器。
Bioinformatics. 2013 Jan 1;29(1):117-8. doi: 10.1093/bioinformatics/bts638. Epub 2012 Oct 30.
7
Fast splice site detection using information content and feature reduction.利用信息内容和特征约简进行快速剪接位点检测。
BMC Bioinformatics. 2008 Dec 12;9 Suppl 12(Suppl 12):S8. doi: 10.1186/1471-2105-9-S12-S8.
8
Variable-length positional modeling for biological sequence classification.用于生物序列分类的可变长度位置建模
AMIA Annu Symp Proc. 2008 Nov 6;2008:91-5.
9
Automatic detection of exonic splicing enhancers (ESEs) using SVMs.使用支持向量机自动检测外显子剪接增强子(ESEs)。
BMC Bioinformatics. 2008 Sep 10;9:369. doi: 10.1186/1471-2105-9-369.
10
Accurate splice site prediction using support vector machines.使用支持向量机进行精确的剪接位点预测。
BMC Bioinformatics. 2007;8 Suppl 10(Suppl 10):S7. doi: 10.1186/1471-2105-8-S10-S7.