Suppr超能文献

利用 DNA-Brnn 识别着丝粒卫星。

Identifying centromeric satellites with dna-brnn.

机构信息

Department of Data Sciences, Dana-Farber Cancer Institute, Boston, MA, USA.

Department of Biomedical Informatics, Harvard Medical School, Boston, MA, USA.

出版信息

Bioinformatics. 2019 Nov 1;35(21):4408-4410. doi: 10.1093/bioinformatics/btz264.

Abstract

SUMMARY

Human alpha satellite and satellite 2/3 contribute to several percent of the human genome. However, identifying these sequences with traditional algorithms is computationally intensive. Here we develop dna-brnn, a recurrent neural network to learn the sequences of the two classes of centromeric repeats. It achieves high similarity to RepeatMasker and is times faster. Dna-brnn explores a novel application of deep learning and may accelerate the study of the evolution of the two repeat classes.

AVAILABILITY AND IMPLEMENTATION

https://github.com/lh3/dna-nn.

摘要

摘要

人类的α卫星和卫星 2/3 贡献了人类基因组的百分之几。然而,用传统算法识别这些序列计算量很大。在这里,我们开发了 dna-brnn,这是一种递归神经网络,可以学习着丝粒重复序列的两类。它与 RepeatMasker 具有很高的相似度,速度也快了好几倍。Dna-brnn 探索了深度学习的新应用,可能会加速对这两类重复序列进化的研究。

可用性和实现

https://github.com/lh3/dna-nn。

相似文献

1
Identifying centromeric satellites with dna-brnn.利用 DNA-Brnn 识别着丝粒卫星。
Bioinformatics. 2019 Nov 1;35(21):4408-4410. doi: 10.1093/bioinformatics/btz264.
5
The evolutionary dynamics of alpha-satellite.α卫星的进化动力学
Genome Res. 2006 Jan;16(1):88-96. doi: 10.1101/gr.3810906. Epub 2005 Dec 12.

引用本文的文献

1
6
The complete sequence of a human Y chromosome.人类 Y 染色体的完整序列。
Nature. 2023 Sep;621(7978):344-354. doi: 10.1038/s41586-023-06457-y. Epub 2023 Aug 23.
7
A pangenome reference of 36 Chinese populations.36 个中国人群的泛基因组参考图谱。
Nature. 2023 Jul;619(7968):112-121. doi: 10.1038/s41586-023-06173-7. Epub 2023 Jun 14.
8
A draft human pangenome reference.人类泛基因组参考草图。
Nature. 2023 May;617(7960):312-324. doi: 10.1038/s41586-023-05896-x. Epub 2023 May 10.

本文引用的文献

3
Satellite DNA: An Evolving Topic.卫星DNA:一个不断发展的主题。
Genes (Basel). 2017 Sep 18;8(9):230. doi: 10.3390/genes8090230.
6
Using RepeatMasker to identify repetitive elements in genomic sequences.使用RepeatMasker来识别基因组序列中的重复元件。
Curr Protoc Bioinformatics. 2009 Mar;Chapter 4:4.10.1-4.10.14. doi: 10.1002/0471250953.bi0410s25.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验