• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

具有最佳率控制的注视点视频压缩。

Foveated video compression with optimal rate control.

机构信息

Bell Laboratories, Lucent Technologies, Murray Hill, NJ 07974, USA.

出版信息

IEEE Trans Image Process. 2001;10(7):977-92. doi: 10.1109/83.931092.

DOI:10.1109/83.931092
PMID:18249671
Abstract

Previously, fovcated video compression algorithms have been proposed which, in certain applications, deliver high-quality video at reduced bit rates by seeking to match the nonuniform sampling of the human retina. We describe such a framework here where foveated video is created by a nonuniform filtering scheme that increases the compressibility of the video stream. We maximize a new foveal visual quality metric. the foveal signal-to-noise ratio (FSNR) to determine the best compression and rate control parameters for a given target bit rate. Specifically, we establish a new optimal rate control algorithm for maximizing the FSNR using a Lagrange multiplier method defined on a curvilinear coordinate system. For optimal rate control, we also develop a piecewise R-D (rate-distortion)/R-Q (rate-quantization) model. A fast algorithm for searching for an optimal Lagrange multiplier lambda* is subsequently presented. For the new models, we show how the reconstructed video quality is affected, where the FSNR is maximized, and demonstrate the coding performance for H.263,+,++/MPEG-4 video coding. For H.263/MPEG video coding, a suboptimal rate control algorithm is developed for fast, high-performance applications. In the simulations, we compare the reconstructed pictures obtained using optimal rate control methods for foveated and normal video. We show that foveated video coding using the suboptimal rate control algorithm delivers excellent performance under 64 kb/s.

摘要

先前已经提出了一些针对注视点的视频压缩算法,这些算法在某些应用中通过寻求匹配人眼视网膜的非均匀采样,以较低的比特率提供高质量的视频。我们在这里描述了这样一个框架,其中通过非均匀滤波方案创建注视点视频,该方案增加了视频流的可压缩性。我们最大化了新的注视点视觉质量度量,即注视点信噪比(FSNR),以确定给定目标比特率下最佳的压缩和率控制参数。具体来说,我们使用定义在曲线坐标系上的拉格朗日乘子方法建立了一种新的最优率控制算法,以最大化 FSNR。对于最优的率控制,我们还开发了一种分段 R-D(率失真)/R-Q(率量化)模型。随后提出了一种用于搜索最优拉格朗日乘子 lambda*的快速算法。对于新模型,我们展示了如何在最大化 FSNR 的情况下影响重建视频质量,并演示了 H.263、++/MPEG-4 视频编码的编码性能。对于 H.263/MPEG 视频编码,我们开发了一种次优的率控制算法,用于快速、高性能的应用。在模拟中,我们比较了使用注视点和正常视频的最优率控制方法获得的重建图片。我们表明,使用次优率控制算法的注视点视频编码在 64kb/s 以下可提供出色的性能。

相似文献

1
Foveated video compression with optimal rate control.具有最佳率控制的注视点视频压缩。
IEEE Trans Image Process. 2001;10(7):977-92. doi: 10.1109/83.931092.
2
Foveation scalable video coding with automatic fixation selection.具有自动注视点选择的中央凹可扩展视频编码
IEEE Trans Image Process. 2003;12(2):243-54. doi: 10.1109/TIP.2003.809015.
3
Joint source-channel distortion modeling for MPEG-4 video.用于MPEG-4视频的联合信源-信道失真建模
IEEE Trans Image Process. 2009 Jan;18(1):90-105. doi: 10.1109/TIP.2008.2005819.
4
λ domain rate control algorithm for high efficiency video coding.用于高效率视频编码的 λ 域率控制算法。
IEEE Trans Image Process. 2014 Sep;23(9):3841-54. doi: 10.1109/TIP.2014.2336550. Epub 2014 Jul 8.
5
Optimal multidimensional bit-rate control for video communication.用于视频通信的最优多维比特率控制
IEEE Trans Image Process. 2002;11(8):873-85. doi: 10.1109/TIP.2002.801122.
6
Consistent picture quality control strategy for dependent video coding.用于相关视频编码的一致图像质量控制策略。
IEEE Trans Image Process. 2009 May;18(5):1004-14. doi: 10.1109/TIP.2009.2014259.
7
Optimal buffered compression and coding mode selection for MPEG-4 shape coding.用于MPEG-4形状编码的最优缓冲压缩和编码模式选择
IEEE Trans Image Process. 2001;10(5):686-700. doi: 10.1109/83.918562.
8
Embedded foveation image coding.嵌入式中央凹成像编码。
IEEE Trans Image Process. 2001;10(10):1397-410. doi: 10.1109/83.951527.
9
Bit allocation for dependent quantization with applications to multiresolution and MPEG video coders.基于依赖量化的比特分配及其在多分辨率和 MPEG 视频编码器中的应用。
IEEE Trans Image Process. 1994;3(5):533-45. doi: 10.1109/83.334987.
10
Iterative rate-distortion optimization of H.264 with constant bit rate constraint.具有恒定比特率约束的H.264迭代率失真优化
IEEE Trans Image Process. 2008 Sep;17(9):1605-15. doi: 10.1109/TIP.2008.2001046.

引用本文的文献

1
An Efficient Human Instance-Guided Framework for Video Action Recognition.高效的人类实例引导视频动作识别框架
Sensors (Basel). 2021 Dec 12;21(24):8309. doi: 10.3390/s21248309.
2
Biologically Inspired Deep Learning Model for Efficient Foveal-Peripheral Vision.用于高效中央凹-周边视觉的生物启发式深度学习模型
Front Comput Neurosci. 2021 Nov 22;15:746204. doi: 10.3389/fncom.2021.746204. eCollection 2021.
3
Action Recognition Using Close-Up of Maximum Activation and ETRI-Activity3D LivingLab Dataset.利用最大激活特写和 ETRI-Activity3D LivingLab 数据集进行动作识别。
Sensors (Basel). 2021 Oct 12;21(20):6774. doi: 10.3390/s21206774.
4
Despeckle Filtering for Multiscale Amplitude-Modulation Frequency-Modulation (AM-FM) Texture Analysis of Ultrasound Images of the Intima-Media Complex.用于内膜-中膜复合体超声图像多尺度调幅调频(AM-FM)纹理分析的去斑滤波
Int J Biomed Imaging. 2014;2014:518414. doi: 10.1155/2014/518414. Epub 2014 Mar 9.