• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Embo:一个使用信息瓶颈进行实证数据分析的Python包。

Embo: a Python package for empirical data analysis using the Information Bottleneck.

作者信息

Piasini Eugenio, Filipowicz Alexandre L S, Levine Jonathan, Gold Joshua I

机构信息

Computational Neuroscience Initiative and Department of Physics and Astronomy, University of Pennsylvania.

Toyota Research Institute.

出版信息

J Open Res Softw. 2021;9(1). doi: 10.5334/jors.322. Epub 2021 May 31.

DOI:10.5334/jors.322
PMID:37153754
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10162586/
Abstract

We present , a Python package to analyze empirical data using the Information Bottleneck (IB) method and its variants, such as the Deterministic Information Bottleneck (DIB). Given two random variables and , the IB finds the stochastic mapping of that encodes the most information about , subject to a constraint on the information that is allowed to retain about . Despite the popularity of the IB, an accessible implementation of the reference algorithm oriented towards ease of use on empirical data was missing. Embo is optimized for the common case of discrete, low-dimensional data. Embo is fast, provides a standard data-processing pipeline, offers a parallel implementation of key computational steps, and includes reasonable defaults for the method parameters. Embo is broadly applicable to different problem domains, as it can be employed with any dataset consisting in joint observations of two discrete variables. It is available from the Python Package Index (PyPI), Zenodo and GitLab.

摘要

我们展示了一个Python包,用于使用信息瓶颈(IB)方法及其变体(如确定性信息瓶颈(DIB))来分析经验数据。给定两个随机变量 和 ,IB找到 的随机映射 ,该映射在对 被允许保留关于 的信息的约束下,编码了关于 的最多信息。尽管IB很受欢迎,但缺少一个面向经验数据易于使用的参考算法的可访问实现。Embo针对离散、低维数据的常见情况进行了优化。Embo速度快,提供标准的数据处理管道,对关键计算步骤提供并行实现,并为方法参数提供合理的默认值。Embo广泛适用于不同的问题领域,因为它可以与任何由两个离散变量的联合观测组成的数据集一起使用。它可从Python包索引(PyPI)、Zenodo和GitLab获取。

相似文献

1
Embo: a Python package for empirical data analysis using the Information Bottleneck.Embo:一个使用信息瓶颈进行实证数据分析的Python包。
J Open Res Softw. 2021;9(1). doi: 10.5334/jors.322. Epub 2021 May 31.
2
The Deterministic Information Bottleneck.确定性信息瓶颈
Neural Comput. 2017 Jun;29(6):1611-1630. doi: 10.1162/NECO_a_00961. Epub 2017 Apr 14.
3
PyIOmica: longitudinal omics analysis and trend identification.PyIOmica:纵向组学分析和趋势识别。
Bioinformatics. 2020 Apr 1;36(7):2306-2307. doi: 10.1093/bioinformatics/btz896.
4
The Information Bottleneck and Geometric Clustering.信息瓶颈与几何聚类
Neural Comput. 2019 Mar;31(3):596-612. doi: 10.1162/neco_a_01136. Epub 2018 Oct 12.
5
NeuroPycon: An open-source python toolbox for fast multi-modal and reproducible brain connectivity pipelines.NeuroPycon:一个开源的 Python 工具包,用于快速进行多模态和可重复的脑连接管道。
Neuroimage. 2020 Oct 1;219:117020. doi: 10.1016/j.neuroimage.2020.117020. Epub 2020 Jun 6.
6
GReNaDIne: A Data-Driven Python Library to Infer Gene Regulatory Networks from Gene Expression Data.GReNaDIne:一个基于数据驱动的 Python 库,用于从基因表达数据中推断基因调控网络。
Genes (Basel). 2023 Jan 20;14(2):269. doi: 10.3390/genes14020269.
7
Pareto-Optimal Clustering with the Primal Deterministic Information Bottleneck.基于原始确定性信息瓶颈的帕累托最优聚类
Entropy (Basel). 2022 May 30;24(6):771. doi: 10.3390/e24060771.
8
Utility of the Python package Geoweaver_cwl for improving workflow reusability: an illustration with multidisciplinary use cases.用于提高工作流程可重用性的Python包Geoweaver_cwl的效用:多学科用例说明
Earth Sci Inform. 2023;16(3):2955-2961. doi: 10.1007/s12145-023-01045-0. Epub 2023 Jul 10.
9
The Convex Information Bottleneck Lagrangian.凸信息瓶颈拉格朗日函数。
Entropy (Basel). 2020 Jan 14;22(1):98. doi: 10.3390/e22010098.
10
pyrpipe: a Python package for RNA-Seq workflows.pyrpipe:一个用于RNA测序工作流程的Python软件包。
NAR Genom Bioinform. 2021 Jun 1;3(2):lqab049. doi: 10.1093/nargab/lqab049. eCollection 2021 Jun.

本文引用的文献

1
Information Decomposition of Target Effects from Multi-Source Interactions: Perspectives on Previous, Current and Future Work.多源相互作用中目标效应的信息分解:对过往、当前及未来工作的展望
Entropy (Basel). 2018 Apr 23;20(4):307. doi: 10.3390/e20040307.
2
Array programming with NumPy.使用 NumPy 进行数组编程。
Nature. 2020 Sep;585(7825):357-362. doi: 10.1038/s41586-020-2649-2. Epub 2020 Sep 16.
3
Pupil diameter encodes the idiosyncratic, cognitive complexity of belief updating.瞳孔直径编码了信念更新的特质性、认知复杂性。
Elife. 2020 May 18;9:e57872. doi: 10.7554/eLife.57872.
4
SciPy 1.0: fundamental algorithms for scientific computing in Python.SciPy 1.0:Python 中的科学计算基础算法。
Nat Methods. 2020 Mar;17(3):261-272. doi: 10.1038/s41592-019-0686-2. Epub 2020 Feb 3.
5
Toward a unified theory of efficient, predictive, and sparse coding.迈向高效、预测和稀疏编码的统一理论。
Proc Natl Acad Sci U S A. 2018 Jan 2;115(1):186-191. doi: 10.1073/pnas.1711114115. Epub 2017 Dec 19.
6
The Deterministic Information Bottleneck.确定性信息瓶颈
Neural Comput. 2017 Jun;29(6):1611-1630. doi: 10.1162/NECO_a_00961. Epub 2017 Apr 14.
7
Predictive information in a sensory population.感觉群体中的预测信息。
Proc Natl Acad Sci U S A. 2015 Jun 2;112(22):6908-13. doi: 10.1073/pnas.1506855112. Epub 2015 May 18.
8
Past-future information bottleneck in dynamical systems.动态系统中的过去-未来信息瓶颈
Phys Rev E Stat Nonlin Soft Matter Phys. 2009 Apr;79(4 Pt 1):041925. doi: 10.1103/PhysRevE.79.041925. Epub 2009 Apr 27.