• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

两个主要复合数据库中的冗余。

Redundancy in two major compound databases.

机构信息

Department of Life Science Informatics, B-IT, LIMES Program Unit Chemical Biology and Medicinal Chemistry, Rheinische Friedrich-Wilhelms-Universität, D-53113 Bonn, Germany.

Department of Life Science Informatics, B-IT, LIMES Program Unit Chemical Biology and Medicinal Chemistry, Rheinische Friedrich-Wilhelms-Universität, D-53113 Bonn, Germany.

出版信息

Drug Discov Today. 2018 Jun;23(6):1183-1186. doi: 10.1016/j.drudis.2018.03.005. Epub 2018 Mar 17.

DOI:10.1016/j.drudis.2018.03.005
PMID:29559364
Abstract

Public repositories of compounds and activity data are of prime importance for pharmaceutical research in academic and industrial settings. Major databases have evolved over the years. Their growth is accompanied by an increasing tendency toward data sharing. This is a positive development but not without potential problems. Using ChEMBL and PubChem as examples, we show that crosstalk between databases also leads to substantial data redundancy that might not be obvious. Redundancy is an important issue because it biases data analysis and knowledge extraction and leads to inflated views of available compounds, assays and activity data. Going forward it will be important to further refine data exchange and deposition criteria and make redundancy as transparent as possible.

摘要

化合物和活性数据的公共存储库对于学术和工业环境中的药物研究至关重要。主要数据库多年来一直在发展。随着数据库的发展,数据共享的趋势也越来越明显。这是一个积极的发展,但并非没有潜在问题。我们以 ChEMBL 和 PubChem 为例,表明数据库之间的交叉也会导致大量数据冗余,而这些冗余可能并不明显。冗余是一个重要的问题,因为它会影响数据分析和知识提取,并导致对可用化合物、测定和活性数据的高估。未来,进一步完善数据交换和存储标准,并尽可能透明地处理冗余问题将非常重要。

相似文献

1
Redundancy in two major compound databases.两个主要复合数据库中的冗余。
Drug Discov Today. 2018 Jun;23(6):1183-1186. doi: 10.1016/j.drudis.2018.03.005. Epub 2018 Mar 17.
2
BindingDB and ChEMBL: online compound databases for drug discovery.BindingDB 和 ChEMBL:用于药物发现的在线化合物数据库。
Expert Opin Drug Discov. 2011 Jul;6(7):683-7. doi: 10.1517/17460441.2011.579100. Epub 2011 Apr 21.
3
PubChem 2019 update: improved access to chemical data.PubChem 2019 年更新:改善化学数据获取。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1102-D1109. doi: 10.1093/nar/gky1033.
4
Parallel worlds of public and commercial bioactive chemistry data.公共和商业生物活性化学数据的平行世界。
J Med Chem. 2015 Mar 12;58(5):2068-76. doi: 10.1021/jm5011308. Epub 2014 Dec 4.
5
Data mining a small molecule drug screening representative subset from NIH PubChem.从美国国立医学图书馆化学数据库(NIH PubChem)中挖掘小分子药物筛选代表性子集。
J Chem Inf Model. 2008 Mar;48(3):465-75. doi: 10.1021/ci700193u. Epub 2008 Feb 27.
6
The ChEMBL bioactivity database: an update.《ChEMBL 生物活性数据库更新》
Nucleic Acids Res. 2014 Jan;42(Database issue):D1083-90. doi: 10.1093/nar/gkt1031. Epub 2013 Nov 7.
7
PubChem Substance and Compound databases.美国国立医学图书馆化学物质数据库和化合物数据库。
Nucleic Acids Res. 2016 Jan 4;44(D1):D1202-13. doi: 10.1093/nar/gkv951. Epub 2015 Sep 22.
8
What is the likelihood of an active compound to be promiscuous? Systematic assessment of compound promiscuity on the basis of PubChem confirmatory bioassay data.一种活性化合物具有混杂性的可能性有多大?基于 PubChem 确证性生物测定数据对化合物混杂性进行系统评估。
AAPS J. 2013 Jul;15(3):808-15. doi: 10.1208/s12248-013-9488-0. Epub 2013 Apr 19.
9
PASS Targets: Ligand-based multi-target computational system based on a public data and naïve Bayes approach.PASS靶点:基于公共数据和朴素贝叶斯方法的基于配体的多靶点计算系统。
SAR QSAR Environ Res. 2015;26(10):783-93. doi: 10.1080/1062936X.2015.1078407. Epub 2015 Aug 25.
10
PubChem BioAssay: 2017 update.《PubChem生物测定:2017年更新》
Nucleic Acids Res. 2017 Jan 4;45(D1):D955-D963. doi: 10.1093/nar/gkw1118. Epub 2016 Nov 29.

引用本文的文献

1
Will the chemical probes please stand up?化学探针请站起来好吗?
RSC Med Chem. 2021 Jul 16;12(8):1428-1441. doi: 10.1039/d1md00138h. eCollection 2021 Aug 18.
2
Assessing the public landscape of clinical-stage pharmaceuticals through freely available online databases.通过免费的在线数据库评估临床阶段药物的公共领域情况。
Drug Discov Today. 2019 Apr;24(4):1010-1016. doi: 10.1016/j.drudis.2019.01.010. Epub 2019 Jan 25.