• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用 TransPrise 预测水稻转录起始位点:一种新的机器学习方法。

Prediction of Rice Transcription Start Sites Using TransPrise: A Novel Machine Learning Approach.

机构信息

Ugra Research Institute of Information Technologies, Khanty-Mansiysk, Russia.

Vavilov Institute of General Genetics, Moscow, Russia.

出版信息

Methods Mol Biol. 2021;2238:261-274. doi: 10.1007/978-1-0716-1068-8_17.

DOI:10.1007/978-1-0716-1068-8_17
PMID:33471337
Abstract

As the interest in genetic resequencing increases, so does the need for effective mathematical, computational, and statistical approaches. One of the difficult problems in genome annotation is determination of precise positions of transcription start sites. In this paper, we present TransPrise-an efficient deep learning tool for predicting positions of eukaryotic transcription start sites. TransPrise offers significant improvement over existing promoter-prediction methods. To illustrate this, we compared predictions of TransPrise with the TSSPlant approach for well-annotated genome of Oryza sativa. Using a computer with a graphics processing unit, the run time of TransPrise is 250 min on a genome of 374 Mb long.We provide the full basis for the comparison and encourage users to freely access a set of our computational tools to facilitate and streamline their own analyses. The ready-to-use Docker image with all the necessary packages, models, and code as well as the source code of the TransPrise algorithm are available at http://compubioverne.group/ . The source code is ready to use and to be customized to predict TSS in any eukaryotic organism.

摘要

随着对基因重测序的兴趣日益增加,对有效数学、计算和统计方法的需求也越来越大。基因组注释中的一个难题是确定转录起始位点的精确位置。在本文中,我们提出了 TransPrise——一种用于预测真核转录起始位点位置的高效深度学习工具。TransPrise 提供了优于现有启动子预测方法的显著改进。为了说明这一点,我们将 TransPrise 的预测结果与 TSSPlant 方法在经过充分注释的 Oryza sativa 基因组上进行了比较。使用配备图形处理单元的计算机,TransPrise 在一个 374 Mb 长的基因组上的运行时间为 250 分钟。我们提供了进行比较的全部依据,并鼓励用户自由访问我们的一组计算工具,以方便和简化他们自己的分析。带有所有必要软件包、模型和代码的即用型 Docker 镜像以及 TransPrise 算法的源代码可在 http://compubioverne.group/ 获得。源代码可随时使用,并可针对任何真核生物进行 TSS 预测进行定制。

相似文献

1
Prediction of Rice Transcription Start Sites Using TransPrise: A Novel Machine Learning Approach.利用 TransPrise 预测水稻转录起始位点:一种新的机器学习方法。
Methods Mol Biol. 2021;2238:261-274. doi: 10.1007/978-1-0716-1068-8_17.
2
TransPrise: a novel machine learning approach for eukaryotic promoter prediction.TransPrise:一种用于真核生物启动子预测的新型机器学习方法。
PeerJ. 2019 Nov 1;7:e7990. doi: 10.7717/peerj.7990. eCollection 2019.
3
TSSPlant: a new tool for prediction of plant Pol II promoters.TSSPlant:一种预测植物RNA聚合酶II启动子的新工具。
Nucleic Acids Res. 2017 May 5;45(8):e65. doi: 10.1093/nar/gkw1353.
4
TSSFinder-fast and accurate ab initio prediction of the core promoter in eukaryotic genomes.TSSFinder——真核基因组中核心启动子的快速、准确从头预测。
Brief Bioinform. 2021 Nov 5;22(6). doi: 10.1093/bib/bbab198.
5
GC-compositional strand bias around transcription start sites in plants and fungi.植物和真菌中转录起始位点周围的GC组成链偏向性。
BMC Genomics. 2005 Feb 28;6:26. doi: 10.1186/1471-2164-6-26.
6
Tiling Assembly: a new tool for reference annotation-independent transcript assembly and novel gene identification by RNA-sequencing.平铺组装:一种用于通过RNA测序进行不依赖参考注释的转录本组装和新基因鉴定的新工具。
DNA Res. 2015 Oct;22(5):319-29. doi: 10.1093/dnares/dsv015. Epub 2015 Sep 3.
7
Genome-wide transcription start site mapping of Bradyrhizobium japonicum grown free-living or in symbiosis - a rich resource to identify new transcripts, proteins and to study gene regulation.日本慢生根瘤菌在自由生活或共生状态下的全基因组转录起始位点定位——这是鉴定新转录本、蛋白质以及研究基因调控的丰富资源。
BMC Genomics. 2016 Apr 23;17:302. doi: 10.1186/s12864-016-2602-9.
8
TIPR: transcription initiation pattern recognition on a genome scale.TIPR:全基因组规模的转录起始模式识别
Bioinformatics. 2015 Dec 1;31(23):3725-32. doi: 10.1093/bioinformatics/btv464. Epub 2015 Aug 8.
9
iDNA6mA-Rice-DL: A local web server for identifying DNA N6-methyladenine sites in rice genome by deep learning method.iDNA6mA-Rice-DL:一个通过深度学习方法鉴定水稻基因组中 DNA N6-甲基腺嘌呤位点的本地网络服务器。
J Bioinform Comput Biol. 2021 Oct;19(5):2150019. doi: 10.1142/S0219720021500190. Epub 2021 Jul 21.
10
Characterization of the gene for pyruvate,orthophosphate dikinase from rice, a C3 plant, and a comparison of structure and expression between C3 and C4 genes for this protein.来自C3植物水稻的丙酮酸,磷酸双激酶基因的特性分析,以及该蛋白C3和C4基因的结构与表达比较。
Plant Mol Biol. 1997 Jul;34(5):701-16. doi: 10.1023/a:1005884515840.

引用本文的文献

1
Bioinformatics in Russia: history and present-day landscape.俄罗斯的生物信息学:历史与现状
Brief Bioinform. 2024 Sep 23;25(6). doi: 10.1093/bib/bbae513.

本文引用的文献

1
Combining RNA-seq data and homology-based gene prediction for plants, animals and fungi.将 RNA-seq 数据与基于同源性的基因预测相结合,用于植物、动物和真菌。
BMC Bioinformatics. 2018 May 30;19(1):189. doi: 10.1186/s12859-018-2203-5.
2
Comparative genome based cis-elements analysis in the 5' upstream and 3' downstream region of cell wall invertase and Phenylalanine ammonia lyase in Nicotiana benthamiana.在碧冬茄的细胞壁转化酶和苯丙氨酸解氨酶的 5'上游和 3'下游区域基于比较基因组的顺式元件分析。
Comput Biol Chem. 2018 Feb;72:181-191. doi: 10.1016/j.compbiolchem.2017.11.004. Epub 2017 Nov 13.
3
Nucleotide patterns aiding in prediction of eukaryotic promoters.
有助于预测真核生物启动子的核苷酸模式。
PLoS One. 2017 Nov 15;12(11):e0187243. doi: 10.1371/journal.pone.0187243. eCollection 2017.
4
Evidence-based gene models for structural and functional annotations of the oil palm genome.用于油棕基因组结构和功能注释的基于证据的基因模型。
Biol Direct. 2017 Sep 8;12(1):21. doi: 10.1186/s13062-017-0191-4.
5
Recognition of prokaryotic and eukaryotic promoters using convolutional deep learning neural networks.使用卷积深度学习神经网络识别原核生物和真核生物启动子。
PLoS One. 2017 Feb 3;12(2):e0171410. doi: 10.1371/journal.pone.0171410. eCollection 2017.
6
TSSPlant: a new tool for prediction of plant Pol II promoters.TSSPlant:一种预测植物RNA聚合酶II启动子的新工具。
Nucleic Acids Res. 2017 May 5;45(8):e65. doi: 10.1093/nar/gkw1353.
7
Nucleotide diversity analysis highlights functionally important genomic regions.核苷酸多样性分析突出了功能上重要的基因组区域。
Sci Rep. 2016 Oct 24;6:35730. doi: 10.1038/srep35730.
8
Intron sequences that stimulate gene expression in Arabidopsis.内含子序列可刺激拟南芥基因表达。
Plant Mol Biol. 2016 Oct;92(3):337-46. doi: 10.1007/s11103-016-0516-1. Epub 2016 Aug 5.
9
ZmbZIP91 regulates expression of starch synthesis-related genes by binding to ACTCAT elements in their promoters.ZmbZIP91通过与淀粉合成相关基因启动子中的ACTCAT元件结合来调控这些基因的表达。
J Exp Bot. 2016 Mar;67(5):1327-38. doi: 10.1093/jxb/erv527. Epub 2015 Dec 20.
10
BRAKER1: Unsupervised RNA-Seq-Based Genome Annotation with GeneMark-ET and AUGUSTUS.BRAKER1:基于RNA测序的无监督基因组注释,结合GeneMark-ET和AUGUSTUS
Bioinformatics. 2016 Mar 1;32(5):767-9. doi: 10.1093/bioinformatics/btv661. Epub 2015 Nov 11.