• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
DeepDive: Declarative Knowledge Base Construction.深度探究:声明式知识库构建
SIGMOD Rec. 2016 Mar;45(1):60-67. Epub 2016 Feb 6.
2
Incremental Knowledge Base Construction Using DeepDive.使用DeepDive进行增量知识库构建。
Proceedings VLDB Endowment. 2015 Jul;8(11):1310-1321. doi: 10.14778/2809974.2809991.
3
Extracting Databases from Dark Data with DeepDive.使用DeepDive从暗数据中提取数据库。
Proc ACM SIGMOD Int Conf Manag Data. 2016 Jun-Jul;2016:847-859. doi: 10.1145/2882903.2904442.
4
Fonduer: Knowledge Base Construction from Richly Formatted Data.丰杜尔:从丰富格式数据构建知识库。
Proc ACM SIGMOD Int Conf Manag Data. 2018 Jun;2018:1301-1316. doi: 10.1145/3183713.3183729.
5
Mindtagger: A Demonstration of Data Labeling in Knowledge Base Construction.Mindtagger:知识库构建中的数据标注演示
Proceedings VLDB Endowment. 2015 Aug;8(12):1920-1923. doi: 10.14778/2824032.2824101.
6
Declarative Learning-Based Programming as an Interface to AI Systems.基于声明式学习的编程作为人工智能系统的接口。
Front Artif Intell. 2022 Mar 14;5:755361. doi: 10.3389/frai.2022.755361. eCollection 2022.
7
Large-scale extraction of gene interactions from full-text literature using DeepDive.使用DeepDive从全文文献中大规模提取基因相互作用。
Bioinformatics. 2016 Jan 1;32(1):106-13. doi: 10.1093/bioinformatics/btv476. Epub 2015 Sep 3.
8
DETEXA: declarative extensible text exploration and analysis through SQL.DETEXA:通过SQL进行声明式可扩展文本探索与分析。
Int J Digit Libr. 2023 May 10:1-13. doi: 10.1007/s00799-023-00358-1.
9
Saul: Towards Declarative Learning Based Programming.索尔:迈向基于声明式学习的编程。
IJCAI (U S). 2015 Jul;2015:1844-1851.
10
Artificial intelligence within the chemical laboratory.化学实验室中的人工智能。
Ann Biol Clin (Paris). 1994;52(4):277-82.

引用本文的文献

1
Declarative Learning-Based Programming as an Interface to AI Systems.基于声明式学习的编程作为人工智能系统的接口。
Front Artif Intell. 2022 Mar 14;5:755361. doi: 10.3389/frai.2022.755361. eCollection 2022.
2
Amplifying Domain Expertise in Clinical Data Pipelines.增强临床数据管道中的领域专业知识。
JMIR Med Inform. 2020 Nov 5;8(11):e19612. doi: 10.2196/19612.
3
Snorkel: rapid training data creation with weak supervision.Snorkel:通过弱监督快速创建训练数据。
VLDB J. 2020;29(2):709-730. doi: 10.1007/s00778-019-00552-1. Epub 2019 Jul 15.
4
A Protein Interaction Information-based Generative Model for Enhancing Gene Clustering.基于蛋白质相互作用信息的基因聚类增强生成模型。
Sci Rep. 2020 Jan 20;10(1):665. doi: 10.1038/s41598-020-57437-5.
5
ICARUS: Minimizing Human Effort in Iterative Data Completion.伊卡洛斯:在迭代数据补全中最小化人力投入。
Proceedings VLDB Endowment. 2018 Sep;11(13):2263-2276.
6
Snorkel: Rapid Training Data Creation with Weak Supervision.Snorkel:通过弱监督快速创建训练数据
Proceedings VLDB Endowment. 2017 Nov;11(3):269-282. doi: 10.14778/3157794.3157797.
7
Big data management challenges in health research-a literature review.大数据管理在健康研究中的挑战——文献综述
Brief Bioinform. 2019 Jan 18;20(1):156-167. doi: 10.1093/bib/bbx086.
8
Gait biomechanics in the era of data science.数据科学时代的步态生物力学。
J Biomech. 2016 Dec 8;49(16):3759-3761. doi: 10.1016/j.jbiomech.2016.10.033. Epub 2016 Oct 27.

本文引用的文献

1
Incremental Knowledge Base Construction Using DeepDive.使用DeepDive进行增量知识库构建。
Proceedings VLDB Endowment. 2015 Jul;8(11):1310-1321. doi: 10.14778/2809974.2809991.
2
Large-scale extraction of gene interactions from full-text literature using DeepDive.使用DeepDive从全文文献中大规模提取基因相互作用。
Bioinformatics. 2016 Jan 1;32(1):106-13. doi: 10.1093/bioinformatics/btv476. Epub 2015 Sep 3.
3
A machine reading system for assembling synthetic paleontological databases.一种用于组装合成古生物学数据库的机器阅读系统。
PLoS One. 2014 Dec 1;9(12):e113523. doi: 10.1371/journal.pone.0113523. eCollection 2014.

深度探究:声明式知识库构建

DeepDive: Declarative Knowledge Base Construction.

作者信息

De Sa Christopher, Ratner Alex, Ré Christopher, Shin Jaeho, Wang Feiran, Wu Sen, Zhang Ce

机构信息

Stanford University.

出版信息

SIGMOD Rec. 2016 Mar;45(1):60-67. Epub 2016 Feb 6.

PMID:28344371
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5361060/
Abstract

The dark data extraction or knowledge base construction (KBC) problem is to populate a SQL database with information from unstructured data sources including emails, webpages, and pdf reports. KBC is a long-standing problem in industry and research that encompasses problems of data extraction, cleaning, and integration. We describe DeepDive, a system that combines database and machine learning ideas to help develop KBC systems. The key idea in DeepDive is that statistical inference and machine learning are key tools to attack classical data problems in extraction, cleaning, and integration in a unified and more effective manner. DeepDive programs are declarative in that one cannot write probabilistic inference algorithms; instead, one interacts by defining features or rules about the domain. A key reason for this design choice is to enable domain experts to build their own KBC systems. We present the applications, abstractions, and techniques of DeepDive employed to accelerate construction of KBC systems.

摘要

暗数据提取或知识库构建(KBC)问题是要用来自包括电子邮件、网页和PDF报告在内的非结构化数据源的信息填充SQL数据库。KBC是行业和研究领域的一个长期存在的问题,它涵盖了数据提取、清理和集成等问题。我们描述了DeepDive,这是一个结合数据库和机器学习思想来帮助开发KBC系统的系统。DeepDive的关键思想是,统计推断和机器学习是以统一且更有效的方式解决提取、清理和集成中的经典数据问题的关键工具。DeepDive程序是声明式的,即不能编写概率推断算法;相反,人们通过定义关于该领域的特征或规则来进行交互。这种设计选择的一个关键原因是使领域专家能够构建自己的KBC系统。我们展示了为加速KBC系统构建而采用的DeepDive的应用、抽象和技术。