• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种基于快速近似字符串匹配的基因序列数据库构建软件系统。

A software system for gene sequence database construction based on fast approximate string matching.

作者信息

Liu Zheng, Borneman James, Jiang Tao

出版信息

Int J Bioinform Res Appl. 2005;1(3):273-91. doi: 10.1504/IJBRA.2005.007906.

DOI:10.1504/IJBRA.2005.007906
PMID:18048136
Abstract

We propose a web-based software system for sequence acquisition and database construction. An example application of this system is to construct a ribosomal RNA gene (rDNA) sequence database to facilitate the study of microbial communities. A fast and accurate approximate string matching algorithm is implemented to fetch rDNA sequences sandwiched by two given primers from GenBank. A homology search algorithm based on Basic-Local-Alignment-Search-Tool (BLAST) is then used to extract rDNA sequences that do not contain the primers. This two step process leads to an rDNA sequence database for a specific taxonomic group. We consider the distance between the occurrences of the two given primers, mismatches and degeneracy when performing string matching. In the homology search, a chaining algorithm is combined with BLAST to obtain global alignments based on local alignments. This system can be used in many biological applications.

摘要

我们提出了一种基于网络的用于序列获取和数据库构建的软件系统。该系统的一个示例应用是构建核糖体RNA基因(rDNA)序列数据库,以促进对微生物群落的研究。实现了一种快速准确的近似字符串匹配算法,用于从GenBank中获取夹在两个给定引物之间的rDNA序列。然后使用基于基本局部比对搜索工具(BLAST)的同源性搜索算法来提取不含引物的rDNA序列。这个两步过程产生了针对特定分类群的rDNA序列数据库。在进行字符串匹配时,我们考虑两个给定引物出现位置之间的距离、错配和简并性。在同源性搜索中,将一种链接算法与BLAST相结合,以基于局部比对获得全局比对。该系统可用于许多生物学应用。

相似文献

1
A software system for gene sequence database construction based on fast approximate string matching.一种基于快速近似字符串匹配的基因序列数据库构建软件系统。
Int J Bioinform Res Appl. 2005;1(3):273-91. doi: 10.1504/IJBRA.2005.007906.
2
A software system for gene sequence database construction.
Conf Proc IEEE Eng Med Biol Soc. 2004;2004:2797-800. doi: 10.1109/IEMBS.2004.1403799.
3
Fast online and index-based algorithms for approximate search of RNA sequence-structure patterns.快速在线和基于索引的算法,用于近似搜索 RNA 序列-结构模式。
BMC Bioinformatics. 2013 Jul 17;14:226. doi: 10.1186/1471-2105-14-226.
4
libFLASM: a software library for fixed-length approximate string matching.libFLASM:一个用于固定长度近似字符串匹配的软件库。
BMC Bioinformatics. 2016 Nov 10;17(1):454. doi: 10.1186/s12859-016-1320-2.
5
A RAPID algorithm for sequence database comparisons: application to the identification of vector contamination in the EMBL databases.一种用于序列数据库比较的快速算法:应用于识别EMBL数据库中的载体污染。
Bioinformatics. 1999 Feb;15(2):111-21. doi: 10.1093/bioinformatics/15.2.111.
6
CLEANUP: a fast computer program for removing redundancies from nucleotide sequence databases.清理程序(CLEANUP):一款用于去除核苷酸序列数据库冗余信息的快速计算机程序。
Comput Appl Biosci. 1996 Feb;12(1):1-8. doi: 10.1093/bioinformatics/12.1.1.
7
SCARNA: fast and accurate structural alignment of RNA sequences by matching fixed-length stem fragments.SCARNA:通过匹配固定长度的茎片段实现RNA序列的快速准确结构比对。
Bioinformatics. 2006 Jul 15;22(14):1723-9. doi: 10.1093/bioinformatics/btl177. Epub 2006 May 11.
8
SS-Wrapper: a package of wrapper applications for similarity searches on Linux clusters.SS-Wrapper:用于在Linux集群上进行相似性搜索的一组包装应用程序。
BMC Bioinformatics. 2004 Oct 28;5:171. doi: 10.1186/1471-2105-5-171.
9
Multiple sequence alignment based on profile alignment of intermediate sequences.基于中间序列的轮廓比对进行多序列比对。
J Comput Biol. 2008 Sep;15(7):767-77. doi: 10.1089/cmb.2007.0132.
10
Studying long 16S rDNA sequences with ultrafast-metagenomic sequence classification using exact alignments (Kraken).使用精确比对(Kraken)通过超快速宏基因组序列分类研究长16S rDNA序列。
J Microbiol Methods. 2016 Mar;122:38-42. doi: 10.1016/j.mimet.2016.01.011. Epub 2016 Jan 23.