• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用串联SAGE标签进行转录组注释。

Transcriptome annotation using tandem SAGE tags.

作者信息

Rivals Eric, Boureux Anthony, Lejeune Mireille, Ottones Florence, Pérez Oscar Pecharromàn, Tarhio Jorma, Pierrat Fabien, Ruffle Florence, Commes Thérèse, Marti Jacques

机构信息

Laboratoire d'Informatique, de Robotique et de Microélectronique, UMR 5506 CNRS-Université de Montpellier II, 161 rue Ada, 34392 Montpellier 05, France.

出版信息

Nucleic Acids Res. 2007;35(17):e108. doi: 10.1093/nar/gkm495. Epub 2007 Aug 20.

DOI:10.1093/nar/gkm495
PMID:17709346
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2034470/
Abstract

Analysis of several million expressed gene signatures (tags) revealed an increasing number of different sequences, largely exceeding that of annotated genes in mammalian genomes. Serial analysis of gene expression (SAGE) can reveal new Poly(A) RNAs transcribed from previously unrecognized chromosomal regions. However, conventional SAGE tags are too short to identify unambiguously unique sites in large genomes. Here, we design a novel strategy with tags anchored on two different restrictions sites of cDNAs. New transcripts are then tentatively defined by the two SAGE tags in tandem and by the spanning sequence read on the genome between these tagged sites. Having developed a new algorithm to locate these tag-delimited genomic sequences (TDGS), we first validated its capacity to recognize known genes and its ability to reveal new transcripts with two SAGE libraries built in parallel from a single RNA sample. Our algorithm proves fast enough to experiment this strategy at a large scale. We then collected and processed the complete sets of human SAGE tags to predict yet unknown transcripts. A cross-validation with tiling arrays data shows that 47% of these TDGS overlap transcriptional active regions. Our method provides a new and complementary approach for complex transcriptome annotation.

摘要

对数百万个表达的基因特征(标签)进行分析后发现,不同序列的数量不断增加,大大超过了哺乳动物基因组中注释基因的数量。基因表达系列分析(SAGE)能够揭示从以前未被识别的染色体区域转录而来的新的聚腺苷酸RNA。然而,传统的SAGE标签太短,无法在大型基因组中明确识别唯一的位点。在此,我们设计了一种新策略,使标签锚定在cDNA的两个不同限制性位点上。然后,通过串联的两个SAGE标签以及这些标签位点之间基因组上读取的跨越序列,初步定义新的转录本。在开发出一种定位这些标签界定的基因组序列(TDGS)的新算法后,我们首先利用从单个RNA样本并行构建的两个SAGE文库,验证了其识别已知基因的能力以及揭示新转录本的能力。我们的算法证明足够快速,可以大规模地试验这一策略。然后,我们收集并处理了完整的人类SAGE标签集,以预测未知的转录本。与平铺阵列数据的交叉验证表明,这些TDGS中有47%与转录活性区域重叠。我们的方法为复杂转录组注释提供了一种新的补充方法。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/ff7407b1d444/gkm495f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/ba7e84b70f63/gkm495f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/e593e80d7d54/gkm495f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/b26ed76bb79d/gkm495f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/dfe2b4df659a/gkm495f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/ff7407b1d444/gkm495f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/ba7e84b70f63/gkm495f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/e593e80d7d54/gkm495f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/b26ed76bb79d/gkm495f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/dfe2b4df659a/gkm495f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ed14/2034470/ff7407b1d444/gkm495f5.jpg

相似文献

1
Transcriptome annotation using tandem SAGE tags.使用串联SAGE标签进行转录组注释。
Nucleic Acids Res. 2007;35(17):e108. doi: 10.1093/nar/gkm495. Epub 2007 Aug 20.
2
[Transcriptomes for serial analysis of gene expression].[用于基因表达序列分析的转录组]
J Soc Biol. 2002;196(4):303-7.
3
Tag-based approaches for transcriptome research and genome annotation.用于转录组研究和基因组注释的基于标签的方法。
Nat Methods. 2005 Jul;2(7):495-502. doi: 10.1038/nmeth768.
4
Reverse serial analysis of gene expression (SAGE) characterization of orphan SAGE tags from human embryonic stem cells identifies the presence of novel transcripts and antisense transcription of key pluripotency genes.人类胚胎干细胞中孤儿SAGE标签的反向基因表达序列分析(SAGE)特征鉴定出新型转录本的存在以及关键多能性基因的反义转录。
Stem Cells. 2006 May;24(5):1162-73. doi: 10.1634/stemcells.2005-0304. Epub 2006 Feb 2.
5
Annotating nonspecific SAGE tags with microarray data.用微阵列数据注释非特异性SAGE标签。
Genomics. 2006 Jan;87(1):173-80. doi: 10.1016/j.ygeno.2005.08.014. Epub 2005 Nov 28.
6
Analysis of SAGE data in human platelets: features of the transcriptome in an anucleate cell.人类血小板中SAGE数据的分析:无核细胞中转录组的特征
Thromb Haemost. 2006 Apr;95(4):643-51.
7
Identitag, a relational database for SAGE tag identification and interspecies comparison of SAGE libraries.Identitag,一个用于SAGE标签识别和SAGE文库种间比较的关系数据库。
BMC Bioinformatics. 2004 Oct 6;5:143. doi: 10.1186/1471-2105-5-143.
8
Cloning of tissue-specific genes using serial analysis of gene expression and a novel computational substraction approach.利用基因表达序列分析和一种新型计算扣除法克隆组织特异性基因。
Genomics. 2001 Jul;75(1-3):70-6. doi: 10.1006/geno.2001.6586.
9
Statistical modeling of sequencing errors in SAGE libraries.SAGE文库中测序错误的统计建模
Bioinformatics. 2004 Aug 4;20 Suppl 1:i31-9. doi: 10.1093/bioinformatics/bth924.
10
Unexpected observations after mapping LongSAGE tags to the human genome.将长链SAGE标签定位到人类基因组后出现的意外观察结果。
BMC Bioinformatics. 2007 May 15;8:154. doi: 10.1186/1471-2105-8-154.

引用本文的文献

1
Combining DGE and RNA-sequencing data to identify new polyA+ non-coding transcripts in the human genome.结合 DGE 和 RNA-seq 数据鉴定人类基因组中的新 polyA+ 非编码转录本。
Nucleic Acids Res. 2014 Mar;42(5):2820-32. doi: 10.1093/nar/gkt1300. Epub 2013 Dec 18.
2
Using reads to annotate the genome: influence of length, background distribution, and sequence errors on prediction capacity.利用 reads 注释基因组:长度、背景分布和序列错误对预测能力的影响。
Nucleic Acids Res. 2009 Aug;37(15):e104. doi: 10.1093/nar/gkp492. Epub 2009 Jun 16.

本文引用的文献

1
DeepSAGE--digital transcriptomics with high sensitivity, simple experimental protocol and multiplexing of samples.深度SAGE——具有高灵敏度、简单实验方案和样本多重分析功能的数字转录组学技术。
Nucleic Acids Res. 2006;34(19):e133. doi: 10.1093/nar/gkl714. Epub 2006 Oct 5.
2
A large quantity of novel human antisense transcripts detected by LongSAGE.通过长链分析基因表达技术(LongSAGE)检测到大量新的人类反义转录本。
Bioinformatics. 2006 Oct 15;22(20):2475-9. doi: 10.1093/bioinformatics/btl429. Epub 2006 Aug 7.
3
The colorectal microRNAome.结直肠微小RNA组
Proc Natl Acad Sci U S A. 2006 Mar 7;103(10):3687-92. doi: 10.1073/pnas.0511155103. Epub 2006 Feb 27.
4
Experimental approaches to identify non-coding RNAs.鉴定非编码RNA的实验方法。
Nucleic Acids Res. 2006 Jan 25;34(2):635-46. doi: 10.1093/nar/gkj469. Print 2006.
5
Database resources of the National Center for Biotechnology Information.美国国立生物技术信息中心的数据库资源。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D173-80. doi: 10.1093/nar/gkj158.
6
Design optimization methods for genomic DNA tiling arrays.基因组DNA平铺阵列的设计优化方法
Genome Res. 2006 Feb;16(2):271-81. doi: 10.1101/gr.4452906. Epub 2005 Dec 19.
7
The transcriptional landscape of the mammalian genome.哺乳动物基因组的转录图谱。
Science. 2005 Sep 2;309(5740):1559-63. doi: 10.1126/science.1112014.
8
Fewer genes, more noncoding RNA.基因更少,非编码RNA更多。
Science. 2005 Sep 2;309(5740):1529-30. doi: 10.1126/science.1116800.
9
Repbase Update, a database of eukaryotic repetitive elements.Repbase Update,一个真核生物重复元件数据库。
Cytogenet Genome Res. 2005;110(1-4):462-7. doi: 10.1159/000084979.
10
Genome sequencing in microfabricated high-density picolitre reactors.微制造高密度皮升反应器中的基因组测序
Nature. 2005 Sep 15;437(7057):376-80. doi: 10.1038/nature03959. Epub 2005 Jul 31.