• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PhenDisco:表型发现系统,用于基因型和表型数据库。

PhenDisco: phenotype discovery system for the database of genotypes and phenotypes.

机构信息

Division of Biomedical Informatics, University of California San Diego, La Jolla, California, USA.

出版信息

J Am Med Inform Assoc. 2014 Jan-Feb;21(1):31-6. doi: 10.1136/amiajnl-2013-001882. Epub 2013 Aug 29.

DOI:10.1136/amiajnl-2013-001882
PMID:23989082
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3912702/
Abstract

The database of genotypes and phenotypes (dbGaP) developed by the National Center for Biotechnology Information (NCBI) is a resource that contains information on various genome-wide association studies (GWAS) and is currently available via NCBI's dbGaP Entrez interface. The database is an important resource, providing GWAS data that can be used for new exploratory research or cross-study validation by authorized users. However, finding studies relevant to a particular phenotype of interest is challenging, as phenotype information is presented in a non-standardized way. To address this issue, we developed PhenDisco (phenotype discoverer), a new information retrieval system for dbGaP. PhenDisco consists of two main components: (1) text processing tools that standardize phenotype variables and study metadata, and (2) information retrieval tools that support queries from users and return ranked results. In a preliminary comparison involving 18 search scenarios, PhenDisco showed promising performance for both unranked and ranked search comparisons with dbGaP's search engine Entrez. The system can be accessed at http://pfindr.net.

摘要

基因型和表型数据库(dbGaP)是由美国国家生物技术信息中心(NCBI)开发的资源,其中包含了各种全基因组关联研究(GWAS)的信息,目前可通过 NCBI 的 dbGaP Entrez 界面访问。该数据库是一个重要的资源,提供了 GWAS 数据,授权用户可以使用这些数据进行新的探索性研究或跨研究验证。然而,由于表型信息的呈现方式是非标准化的,因此找到与特定感兴趣表型相关的研究具有挑战性。为了解决这个问题,我们开发了 PhenDisco(表型发现者),这是一个用于 dbGaP 的新信息检索系统。PhenDisco 由两个主要组件组成:(1)用于标准化表型变量和研究元数据的文本处理工具,以及(2)支持用户查询并返回排名结果的信息检索工具。在涉及 18 个搜索场景的初步比较中,PhenDisco 在无排名和排名搜索比较方面均表现出了有希望的性能,优于 dbGaP 的搜索引擎 Entrez。该系统可在 http://pfindr.net 上访问。

相似文献

1
PhenDisco: phenotype discovery system for the database of genotypes and phenotypes.PhenDisco:表型发现系统,用于基因型和表型数据库。
J Am Med Inform Assoc. 2014 Jan-Feb;21(1):31-6. doi: 10.1136/amiajnl-2013-001882. Epub 2013 Aug 29.
2
NCBI's Database of Genotypes and Phenotypes: dbGaP.NCBI 的基因型和表型数据库:dbGaP。
Nucleic Acids Res. 2014 Jan;42(Database issue):D975-9. doi: 10.1093/nar/gkt1211. Epub 2013 Dec 1.
3
Text Categorization of Heart, Lung, and Blood Studies in the Database of Genotypes and Phenotypes (dbGaP) Utilizing n-grams and Metadata Features.利用n元语法和元数据特征对基因型和表型数据库(dbGaP)中的心脏、肺和血液研究进行文本分类。
Biomed Inform Insights. 2013 Jul 22;6:35-45. doi: 10.4137/BII.S11987. Print 2013.
4
Feasibility of using Clinical Element Models (CEM) to standardize phenotype variables in the database of genotypes and phenotypes (dbGaP).使用临床要素模型(CEM)对基因型和表型数据库(dbGaP)中的表型变量进行标准化的可行性。
PLoS One. 2013 Sep 18;8(9):e76384. doi: 10.1371/journal.pone.0076384. eCollection 2013.
5
GRAF-pop: A Fast Distance-Based Method To Infer Subject Ancestry from Multiple Genotype Datasets Without Principal Components Analysis.GRAF-pop:一种无需主成分分析即可基于距离推断个体祖先的快速方法,适用于多种基因型数据集。
G3 (Bethesda). 2019 Aug 8;9(8):2447-2461. doi: 10.1534/g3.118.200925.
6
GWAS Central: a comprehensive resource for the discovery and comparison of genotype and phenotype data from genome-wide association studies.GWAS 中心:一个全面的资源,用于发现和比较来自全基因组关联研究的基因型和表型数据。
Nucleic Acids Res. 2020 Jan 8;48(D1):D933-D940. doi: 10.1093/nar/gkz895.
7
The NCBI dbGaP database of genotypes and phenotypes.美国国立医学图书馆的基因型和表型数据库(NCBI dbGaP)。
Nat Genet. 2007 Oct;39(10):1181-6. doi: 10.1038/ng1007-1181.
8
Entrez Gene: gene-centered information at NCBI.Entrez基因:美国国立医学图书馆国家生物技术信息中心的基因中心信息。
Nucleic Acids Res. 2011 Jan;39(Database issue):D52-7. doi: 10.1093/nar/gkq1237. Epub 2010 Nov 28.
9
Phenotype Information Retrieval for Existing GWAS Studies.现有全基因组关联研究的表型信息检索
AMIA Jt Summits Transl Sci Proc. 2013 Mar 18;2013:4-8. eCollection 2013.
10
Plant genome resources at the national center for biotechnology information.美国国家生物技术信息中心的植物基因组资源
Plant Physiol. 2005 Jul;138(3):1280-8. doi: 10.1104/pp.104.058842.

引用本文的文献

1
Spatially Resolved Multiomics: Data Analysis from Monoomics to Multiomics.空间分辨多组学:从单组学到多组学的数据分析
BME Front. 2024 Jan 13;6:0084. doi: 10.34133/bmef.0084. eCollection 2025.
2
From Spatial-Temporal Multiscale Modeling to Application: Bridging the Valley of Death in Industrial Biotechnology.从时空多尺度建模到应用:跨越工业生物技术中的死亡谷
Bioengineering (Basel). 2023 Jun 20;10(6):744. doi: 10.3390/bioengineering10060744.
3
Identifying Datasets for Cross-Study Analysis in dbGaP using PhenX.使用 PhenX 在 dbGaP 中识别用于跨研究分析的数据集。

本文引用的文献

1
Standardizing Phenotype Variables in the Database of Genotypes and phenotypes (dbGaP) based on Information Models.基于信息模型对基因型和表型数据库(dbGaP)中的表型变量进行标准化。
AMIA Jt Summits Transl Sci Proc. 2013 Mar 18;2013:110. eCollection 2013.
2
Phenotype Information Retrieval for Existing GWAS Studies.现有全基因组关联研究的表型信息检索
AMIA Jt Summits Transl Sci Proc. 2013 Mar 18;2013:4-8. eCollection 2013.
3
Feasibility of using Clinical Element Models (CEM) to standardize phenotype variables in the database of genotypes and phenotypes (dbGaP).
Sci Data. 2022 Sep 1;9(1):532. doi: 10.1038/s41597-022-01660-4.
4
DataMed - an open source discovery index for finding biomedical datasets.DataMed——一个用于查找生物医学数据集的开源发现索引。
J Am Med Inform Assoc. 2018 Mar 1;25(3):300-308. doi: 10.1093/jamia/ocx121.
5
Improving average ranking precision in user searches for biomedical research datasets.提高用户在生物医学研究数据集搜索中的平均排名精度。
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax083.
6
A publicly available benchmark for biomedical dataset retrieval: the reference standard for the 2016 bioCADDIE dataset retrieval challenge.生物医学数据集检索的公开基准:2016 年生物 CADDIE 数据集检索挑战赛的参考标准。
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax061.
使用临床要素模型(CEM)对基因型和表型数据库(dbGaP)中的表型变量进行标准化的可行性。
PLoS One. 2013 Sep 18;8(9):e76384. doi: 10.1371/journal.pone.0076384. eCollection 2013.
4
Text Categorization of Heart, Lung, and Blood Studies in the Database of Genotypes and Phenotypes (dbGaP) Utilizing n-grams and Metadata Features.利用n元语法和元数据特征对基因型和表型数据库(dbGaP)中的心脏、肺和血液研究进行文本分类。
Biomed Inform Insights. 2013 Jul 22;6:35-45. doi: 10.4137/BII.S11987. Print 2013.
5
Identifying appropriate reference data models for comparative effectiveness research (CER) studies based on data from clinical information systems.基于临床信息系统数据,为比较有效性研究(CER)确定合适的参考数据模型。
Med Care. 2013 Aug;51(8 Suppl 3):S45-52. doi: 10.1097/MLR.0b013e31829b1e0b.
6
Statistical visualization for assessing performance of methods for safety surveillance using electronic databases.利用电子数据库评估安全性监测方法性能的统计可视化。
Pharmacoepidemiol Drug Saf. 2013 May;22(5):503-9. doi: 10.1002/pds.3419. Epub 2013 Feb 14.
7
Empirical assessment of methods for risk identification in healthcare data: results from the experiments of the Observational Medical Outcomes Partnership.医疗保健数据中风险识别方法的实证评估:观察性医疗结局伙伴关系实验的结果。
Stat Med. 2012 Dec 30;31(30):4401-15. doi: 10.1002/sim.5620. Epub 2012 Sep 27.
8
Using PhenX measures to identify opportunities for cross-study analysis.利用 PhenX 测量指标来识别跨研究分析的机会。
Hum Mutat. 2012 May;33(5):849-57. doi: 10.1002/humu.22074. Epub 2012 Apr 3.
9
Evaluating Phenotypic Data Elements for Genetics and Epidemiological Research: Experiences from the eMERGE and PhenX Network Projects.评估用于遗传学和流行病学研究的表型数据元素:eMERGE和PhenX网络项目的经验
AMIA Jt Summits Transl Sci Proc. 2011;2011:41-5. Epub 2011 Mar 7.
10
dbGaP data access requests: a call for greater transparency.dbGaP 数据访问请求:呼吁提高透明度。
Sci Transl Med. 2011 Dec 14;3(113):113cm34. doi: 10.1126/scitranslmed.3002788.