• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CleanEST:一个经过清洗的EST文库数据库。

CleanEST: a database of cleansed EST libraries.

作者信息

Lee Byungwook, Shin Gwangsik

机构信息

Korean BioInformation Center, KRIBB, Daejeon 305-817, Korea.

出版信息

Nucleic Acids Res. 2009 Jan;37(Database issue):D686-9. doi: 10.1093/nar/gkn648. Epub 2008 Oct 2.

DOI:10.1093/nar/gkn648
PMID:18832365
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2686460/
Abstract

The EST division of GenBank, dbEST, is widely used in many applications such as gene discovery and verification of exon-intron structure. However, the use of EST sequences in the dbEST libraries is often hampered by inconsistent terminology used to describe the library sources and by the presence of contaminated sequences. Here, we describe CleanEST, a novel database server that classified dbEST libraries and removes contaminants. We classified all dbEST libraries according to species and sequencing center. In addition, we further classified human EST libraries by anatomical and pathological systems according to eVOC ontologies. For each dbEST library, we provide two different cleansed sequences: 'pre-cleansed' and 'user-cleansed'. To generate pre-cleansed sequences, we cleansed sequences in dbEST by alignment of EST sequences against well-known contamination sources: UniVec, Escherichia coli, mitochondria and chloroplast (for plant). To provide user-cleansed sequences, we built an automatic user-cleansing pipeline, in which sequences of a user-selected library are cleansed on-the-fly according to user-selected options. The server is available at http://cleanest.kobic.re.kr/ and the database is updated monthly.

摘要

GenBank的EST部门,即dbEST,在许多应用中被广泛使用,如基因发现和外显子-内含子结构的验证。然而,dbEST文库中EST序列的使用常常受到用于描述文库来源的不一致术语以及污染序列存在的阻碍。在此,我们描述了CleanEST,一种新型的数据库服务器,它对dbEST文库进行分类并去除污染物。我们根据物种和测序中心对所有dbEST文库进行了分类。此外,我们根据eVOC本体论,通过解剖学和病理系统对人类EST文库进行了进一步分类。对于每个dbEST文库,我们提供两种不同的净化序列:“预净化”和“用户净化”。为了生成预净化序列,我们通过将EST序列与已知的污染源(UniVec、大肠杆菌、线粒体和叶绿体(对于植物))进行比对,对dbEST中的序列进行了净化。为了提供用户净化序列,我们构建了一个自动用户净化管道,其中用户选择的文库的序列会根据用户选择的选项实时进行净化。该服务器可在http://cleanest.kobic.re.kr/上获取,数据库每月更新一次。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f4a4/2686460/2ef06823cf00/gkn648f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f4a4/2686460/9b1ba55b7580/gkn648f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f4a4/2686460/2ef06823cf00/gkn648f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f4a4/2686460/9b1ba55b7580/gkn648f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f4a4/2686460/2ef06823cf00/gkn648f2.jpg

相似文献

1
CleanEST: a database of cleansed EST libraries.CleanEST:一个经过清洗的EST文库数据库。
Nucleic Acids Res. 2009 Jan;37(Database issue):D686-9. doi: 10.1093/nar/gkn648. Epub 2008 Oct 2.
2
ESTpass: a web-based server for processing and annotating expressed sequence tag (EST) sequences.ESTpass:一个用于处理和注释表达序列标签(EST)序列的基于网络的服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W159-62. doi: 10.1093/nar/gkm369. Epub 2007 May 25.
3
ChimerDB--a knowledgebase for fusion sequences.ChimerDB——融合序列知识库。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D21-4. doi: 10.1093/nar/gkj019.
4
ESTuber db: an online database for Tuber borchii EST sequences.ESTuber数据库:一个用于意大利白块菌EST序列的在线数据库。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S13. doi: 10.1186/1471-2105-8-S1-S13.
5
The Diatom EST Database.硅藻表达序列标签数据库。
Nucleic Acids Res. 2005 Jan 1;33(Database issue):D344-7. doi: 10.1093/nar/gki121.
6
Pepper EST database: comprehensive in silico tool for analyzing the chili pepper (Capsicum annuum) transcriptome.辣椒EST数据库:用于分析辣椒(辣椒属)转录组的综合电子工具。
BMC Plant Biol. 2008 Oct 9;8:101. doi: 10.1186/1471-2229-8-101.
7
PESTAS: a web server for EST analysis and sequence mining.PESTAS:用于EST分析和序列挖掘的网络服务器。
Bioinformatics. 2009 Jul 15;25(14):1846-8. doi: 10.1093/bioinformatics/btp293. Epub 2009 May 4.
8
The TIGR Plant Transcript Assemblies database.TIGR植物转录本组装数据库。
Nucleic Acids Res. 2007 Jan;35(Database issue):D846-51. doi: 10.1093/nar/gkl785. Epub 2006 Nov 6.
9
[Analysis, identification and correction of some errors of model refseqs appeared in NCBI Human Gene Database by in silico cloning and experimental verification of novel human genes].[通过新型人类基因的电子克隆和实验验证对NCBI人类基因数据库中出现的模型参考序列的一些错误进行分析、鉴定和校正]
Yi Chuan Xue Bao. 2004 May;31(5):431-43.
10
The Human EST Ontology Explorer: a tissue-oriented visualization system for ontologies distribution in human EST collections.人类 EST 本体论资源浏览器:用于在人类 EST 数据集的本体论分布中的面向组织的可视化系统。
BMC Bioinformatics. 2009 Oct 15;10 Suppl 12(Suppl 12):S2. doi: 10.1186/1471-2105-10-S12-S2.

引用本文的文献

1
Universality of the DNA methylation codes in Eucaryotes.真核生物中 DNA 甲基化密码的普遍性。
Sci Rep. 2019 Jan 17;9(1):173. doi: 10.1038/s41598-018-37407-8.
2
Fine-mapping of a major QTL controlling angular leaf spot resistance in common bean (Phaseolus vulgaris L.).控制普通菜豆(Phaseolus vulgaris L.)角斑病抗性的一个主要数量性状位点的精细定位。
Theor Appl Genet. 2015 May;128(5):813-26. doi: 10.1007/s00122-015-2472-6. Epub 2015 Mar 5.
3
Genome-wide identification and analysis of the B3 superfamily of transcription factors in Brassicaceae and major crop plants.

本文引用的文献

1
ESTpass: a web-based server for processing and annotating expressed sequence tag (EST) sequences.ESTpass:一个用于处理和注释表达序列标签(EST)序列的基于网络的服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W159-62. doi: 10.1093/nar/gkm369. Epub 2007 May 25.
2
SPODOBASE: an EST database for the lepidopteran crop pest Spodoptera.斜纹夜蛾数据库:一个针对鳞翅目农作物害虫斜纹夜蛾的EST数据库。
BMC Bioinformatics. 2006 Jun 23;7:322. doi: 10.1186/1471-2105-7-322.
3
A hitchhiker's guide to expressed sequence tag (EST) analysis.表达序列标签(EST)分析指南
在芸薹科和主要作物中全基因组鉴定和分析 B3 超家族转录因子。
Theor Appl Genet. 2013 May;126(5):1305-19. doi: 10.1007/s00122-013-2054-4. Epub 2013 Feb 2.
4
Microarray-based sketches of the HERV transcriptome landscape.基于微阵列的人类内源性逆转录病毒转录组景观草图。
PLoS One. 2012;7(6):e40194. doi: 10.1371/journal.pone.0040194. Epub 2012 Jun 28.
5
EuroPineDB: a high-coverage web database for maritime pine transcriptome.欧松数据库:一个高覆盖度的欧洲赤松转录组学网络数据库。
BMC Genomics. 2011 Jul 15;12:366. doi: 10.1186/1471-2164-12-366.
6
Protein comparison at the domain architecture level.在结构域架构层面的蛋白质比较。
BMC Bioinformatics. 2009 Dec 3;10 Suppl 15(Suppl 15):S5. doi: 10.1186/1471-2105-10-S15-S5.
Brief Bioinform. 2007 Jan;8(1):6-21. doi: 10.1093/bib/bbl015. Epub 2006 May 23.
4
ChloroplastDB: the Chloroplast Genome Database.叶绿体数据库:叶绿体基因组数据库。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D692-6. doi: 10.1093/nar/gkj055.
5
ParPEST: a pipeline for EST data analysis based on parallel computing.ParPEST:一种基于并行计算的EST数据分析流程。
BMC Bioinformatics. 2005 Dec 1;6 Suppl 4(Suppl 4):S9. doi: 10.1186/1471-2105-6-S4-S9.
6
NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins.NCBI参考序列(RefSeq):一个经过整理的基因组、转录本和蛋白质的非冗余序列数据库。
Nucleic Acids Res. 2005 Jan 1;33(Database issue):D501-4. doi: 10.1093/nar/gki025.
7
GenBank.基因银行
Nucleic Acids Res. 2005 Jan 1;33(Database issue):D34-8. doi: 10.1093/nar/gki063.
8
ESTAP--an automated system for the analysis of EST data.ESTAP——一种用于分析EST数据的自动化系统。
Bioinformatics. 2003 Sep 1;19(13):1720-2. doi: 10.1093/bioinformatics/btg205.
9
PartiGene--constructing partial genomes.部分基因——构建部分基因组。
Bioinformatics. 2004 Jun 12;20(9):1398-404. doi: 10.1093/bioinformatics/bth101. Epub 2004 Feb 26.
10
Expressed sequence tags: clean before using. Correspondence re: Z. Wang et al., computational analysis and experimental validation of tumor-associated alternative RNA splicing in human cancer. Cancer Res., 63: 655-657, 2003.表达序列标签:使用前清理。通信相关:Z. Wang等人,人类癌症中肿瘤相关可变RNA剪接的计算分析与实验验证。《癌症研究》,63卷:655 - 657页,2003年。
Cancer Res. 2003 Oct 15;63(20):6996; author reply 6996-7.