• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CPRiL:文献中的化合物-蛋白质关系。

CPRiL: compound-protein relationships in literature.

机构信息

Research Group Pharmaceutical Bioinformatics, Institute of Pharmaceutical Sciences, Albert-Ludwigs-Universität Freiburg, Freiburg 79104, Germany.

出版信息

Bioinformatics. 2022 Sep 15;38(18):4452-4453. doi: 10.1093/bioinformatics/btac539.

DOI:10.1093/bioinformatics/btac539
PMID:35920772
Abstract

SUMMARY

Newly discovered functional relationships of (bio-)molecules are a key component in molecular biology and life science research. Especially in the drug discovery field, knowledge of how small molecules associated with proteins plays a fundamental role in understanding how drugs or metabolites can affect cells, tissues and human metabolism. Finding relevant information about these relationships among the huge number of published articles is becoming increasingly challenging and time-consuming. On average, more than 25 000 new (bio-)medical articles are added to the literature database PubMed weekly. In this article, we present a new web server [compound-protein relationships in literature (CPRiL)] that provides information on functional relationships between small molecules and proteins in literature. Currently, CPRiL contains ∼465 000 unique names and synonyms of small molecules, ∼100 000 unique proteins and more than 9 million described functional relationships between these entities. The applied BioBERT machine learning model for the determination of functional relationships between small molecules and proteins in texts was extensively trained and tested. On a related benchmark, CPRiL yielded a high performance, with an F1 score of 84.3%, precision of 82.9% and recall of 85.7%.

AVAILABILITY AND IMPLEMENTATION

CPRiL is freely available at https://www.pharmbioinf.uni-freiburg.de/cpril.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

新发现的(生物)分子功能关系是分子生物学和生命科学研究的关键组成部分。特别是在药物发现领域,了解与蛋白质相关的小分子如何在理解药物或代谢物如何影响细胞、组织和人体代谢方面起着基础性作用。在数量庞大的已发表文章中找到这些关系的相关信息变得越来越具有挑战性和耗时。平均每周有超过 25000 篇新的(生物)医学文章被添加到文献数据库 PubMed 中。在本文中,我们介绍了一个新的网络服务器[文献中的化合物-蛋白质关系(CPRiL)],该服务器提供了文献中小分子和蛋白质之间功能关系的信息。目前,CPRiL 包含约 465000 个小分子的独特名称和同义词,约 100000 个独特蛋白质以及超过 900 万种这些实体之间描述的功能关系。用于确定文本中小分子和蛋白质之间功能关系的 BioBERT 机器学习模型经过了广泛的训练和测试。在相关基准测试中,CPRiL 的性能很高,F1 得分为 84.3%,精度为 82.9%,召回率为 85.7%。

可用性和实现

CPRiL 可在 https://www.pharmbioinf.uni-freiburg.de/cpril 免费获取。

补充信息

补充数据可在 Bioinformatics 在线获取。

相似文献

1
CPRiL: compound-protein relationships in literature.CPRiL:文献中的化合物-蛋白质关系。
Bioinformatics. 2022 Sep 15;38(18):4452-4453. doi: 10.1093/bioinformatics/btac539.
2
Compounds In Literature (CIL): screening for compounds and relatives in PubMed.文献中的化合物 (CIL):在 PubMed 中筛选化合物和相关物。
Bioinformatics. 2011 May 1;27(9):1341-2. doi: 10.1093/bioinformatics/btr130. Epub 2011 Mar 16.
3
Automated recognition of functional compound-protein relationships in literature.文献中功能化合物-蛋白质关系的自动识别。
PLoS One. 2020 Mar 3;15(3):e0220925. doi: 10.1371/journal.pone.0220925. eCollection 2020.
4
HiPub: translating PubMed and PMC texts to networks for knowledge discovery.HiPub:将PubMed和PMC文本转化为网络以进行知识发现
Bioinformatics. 2016 Sep 15;32(18):2886-8. doi: 10.1093/bioinformatics/btw511. Epub 2016 Aug 2.
5
PPaxe: easy extraction of protein occurrence and interactions from the scientific literature.PPaxe:从科学文献中轻松提取蛋白质出现和相互作用。
Bioinformatics. 2019 Jul 15;35(14):2523-2524. doi: 10.1093/bioinformatics/bty988.
6
Macromolecular crowding: chemistry and physics meet biology (Ascona, Switzerland, 10-14 June 2012).大分子拥挤现象:化学与物理邂逅生物学(瑞士阿斯科纳,2012年6月10日至14日)
Phys Biol. 2013 Aug;10(4):040301. doi: 10.1088/1478-3975/10/4/040301. Epub 2013 Aug 2.
7
Discovering research articles containing evolutionary timetrees by machine learning.利用机器学习发现包含进化时间树的研究文章。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad035.
8
Mining and evaluation of molecular relationships in literature.文献中分子关系的挖掘和评估。
Bioinformatics. 2012 Mar 1;28(5):709-14. doi: 10.1093/bioinformatics/bts026. Epub 2012 Jan 13.
9
SciMiner: web-based literature mining tool for target identification and functional enrichment analysis.SciMiner:用于靶点识别和功能富集分析的基于网络的文献挖掘工具。
Bioinformatics. 2009 Mar 15;25(6):838-40. doi: 10.1093/bioinformatics/btp049. Epub 2009 Feb 2.
10
Large-scale entity representation learning for biomedical relationship extraction.大规模实体表示学习在生物医学关系抽取中的应用。
Bioinformatics. 2021 Apr 19;37(2):236-242. doi: 10.1093/bioinformatics/btaa674.

引用本文的文献

1
StreptomeDB 4.0: a comprehensive database of streptomycetes natural products enriched with protein interactions and interactive spectral visualization.链霉菌数据库4.0:一个富含蛋白质相互作用和交互式光谱可视化的链霉菌天然产物综合数据库。
Nucleic Acids Res. 2025 Jan 6;53(D1):D724-D729. doi: 10.1093/nar/gkae1030.
2
The New Version of the ANDDigest Tool with Improved AI-Based Short Names Recognition.新版本的 ANDDigest 工具,具有改进的基于人工智能的短名称识别功能。
Int J Mol Sci. 2022 Nov 29;23(23):14934. doi: 10.3390/ijms232314934.