• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

人类垃圾EST序列——来自cDNA文库但未与基因组组装序列比对上的序列。

Human trash ESTs--sequences from cDNA collection that are not aligned to genome assembly.

作者信息

Panchin Alexander Y, Spirin Sergey A, Lukyanov Sergey A, Lebedev Yuri B, Panchin Yuri V

机构信息

Shemyakin and Ovchinnikov Institute of Bioorganic Chemistry, Moscow, Russia.

出版信息

J Bioinform Comput Biol. 2008 Aug;6(4):759-73. doi: 10.1142/s0219720008003709.

DOI:10.1142/s0219720008003709
PMID:18763741
Abstract

Expressed sequence tags (ESTs) represent 500-1000-bp-long sequences corresponding to mRNAs derived from different sources (cell lines, tissues, etc.). The human EST database contains over 8,000,000 sequences, with over 4,000,000,000 total nucleotides. RNA molecules are transcribed from a genomic DNA template; therefore, all ESTs should match corresponding genomes. Nevertheless, we have found in the human EST database approximately 11,000 ESTs not matching sequences in the human genome database. The presence of "trash" ESTs (TESTs) in the EST database could result from DNA or RNA contamination of the laboratory equipment, tissues, or cell lines. TESTs could also represent sequences from unidentified human genes or from species inhabiting the human body. Here, we attempt to identify the sources of human EST database contaminations. In particular, we discuss systematic contamination of the mammalian EST databases with sequences of plants.

摘要

表达序列标签(EST)代表长度为500 - 1000碱基对的序列,这些序列对应于来自不同来源(细胞系、组织等)的mRNA。人类EST数据库包含超过800万个序列,总核苷酸数超过40亿个。RNA分子是从基因组DNA模板转录而来的;因此,所有EST都应与相应的基因组匹配。然而,我们在人类EST数据库中发现了大约11000个EST与人类基因组数据库中的序列不匹配。EST数据库中“垃圾”EST(TEST)的存在可能是由于实验室设备、组织或细胞系的DNA或RNA污染所致。TEST也可能代表来自未鉴定的人类基因或寄生于人体的物种的序列。在这里,我们试图确定人类EST数据库污染的来源。特别是,我们讨论了植物序列对哺乳动物EST数据库的系统性污染。

相似文献

1
Human trash ESTs--sequences from cDNA collection that are not aligned to genome assembly.人类垃圾EST序列——来自cDNA文库但未与基因组组装序列比对上的序列。
J Bioinform Comput Biol. 2008 Aug;6(4):759-73. doi: 10.1142/s0219720008003709.
2
[Analysis, identification and correction of some errors of model refseqs appeared in NCBI Human Gene Database by in silico cloning and experimental verification of novel human genes].[通过新型人类基因的电子克隆和实验验证对NCBI人类基因数据库中出现的模型参考序列的一些错误进行分析、鉴定和校正]
Yi Chuan Xue Bao. 2004 May;31(5):431-43.
3
ESTMAP: a system for expressed sequence tags mapping on genomic sequences.ESTMAP:一种用于将表达序列标签映射到基因组序列上的系统。
IEEE Trans Nanobioscience. 2003 Jun;2(2):75-8. doi: 10.1109/tnb.2003.813928.
4
A fast and sensitive algorithm for aligning ESTs to the human genome.一种用于将EST序列与人类基因组进行比对的快速且灵敏的算法。
J Bioinform Comput Biol. 2003 Jul;1(2):363-86. doi: 10.1142/s0219720003000058.
5
A comparison of expressed sequence tags (ESTs) to human genomic sequences.表达序列标签(ESTs)与人类基因组序列的比较。
Nucleic Acids Res. 1997 Apr 15;25(8):1626-32. doi: 10.1093/nar/25.8.1626.
6
Expressed sequence tags for the chicken genome from a normalized 10-day-old White Leghorn whole embryo cDNA library: 1. DNA sequence characterization and linkage analysis.来自标准化的10日龄白来航鸡全胚胎cDNA文库的鸡基因组表达序列标签:1. DNA序列特征及连锁分析。
J Hered. 2001 Jan-Feb;92(1):1-8. doi: 10.1093/jhered/92.1.1.
7
Chicken genomics resource: sequencing and annotation of 35,407 ESTs from single and multiple tissue cDNA libraries and CAP3 assembly of a chicken gene index.鸡基因组学资源:来自单一和多个组织cDNA文库的35407条ESTs测序与注释以及鸡基因索引的CAP3组装
Physiol Genomics. 2006 May 16;25(3):514-24. doi: 10.1152/physiolgenomics.00207.2005. Epub 2006 Mar 22.
8
Systematic screening of sheep skin cDNA libraries for microsatellite sequences.对绵羊皮肤cDNA文库进行微卫星序列的系统筛选。
Cytogenet Genome Res. 2003;102(1-4):79-84. doi: 10.1159/000075729.
9
Identification of novel transcribed sequences on human chromosome 22 by expressed sequence tag mapping.通过表达序列标签定位鉴定人类22号染色体上的新转录序列。
DNA Res. 2001 Feb 28;8(1):1-9. doi: 10.1093/dnares/8.1.1.
10
Fast and sensitive algorithm for aligning ESTs to human genome.用于将EST序列与人类基因组进行比对的快速灵敏算法。
Proc IEEE Comput Soc Bioinform Conf. 2002;1:43-53.