• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于拉普拉斯方法的视频多方向文本检测

A Laplacian approach to multi-oriented text detection in video.

机构信息

Department of Computer Science, School of Computing, National University of Singapore, Singapore.

出版信息

IEEE Trans Pattern Anal Mach Intell. 2011 Feb;33(2):412-9. doi: 10.1109/TPAMI.2010.166.

DOI:10.1109/TPAMI.2010.166
PMID:20733217
Abstract

In this paper, we propose a method based on the Laplacian in the frequency domain for video text detection. Unlike many other approaches which assume that text is horizontally-oriented, our method is able to handle text of arbitrary orientation. The input image is first filtered with Fourier-Laplacian. K-means clustering is then used to identify candidate text regions based on the maximum difference. The skeleton of each connected component helps to separate the different text strings from each other. Finally, text string straightness and edge density are used for false positive elimination. Experimental results show that the proposed method is able to handle graphics text and scene text of both horizontal and nonhorizontal orientation.

摘要

本文提出了一种基于频域拉普拉斯的视频文字检测方法。与许多其他假设文字为水平方向的方法不同,我们的方法能够处理任意方向的文字。输入图像首先经过傅里叶-拉普拉斯滤波。然后使用 K-均值聚类根据最大差值来识别候选文字区域。每个连通分量的骨架有助于将不同的文字字符串彼此分开。最后,文字字符串的直线度和边缘密度用于消除假阳性。实验结果表明,所提出的方法能够处理水平和非水平方向的图形文字和场景文字。

相似文献

1
A Laplacian approach to multi-oriented text detection in video.基于拉普拉斯方法的视频多方向文本检测
IEEE Trans Pattern Anal Mach Intell. 2011 Feb;33(2):412-9. doi: 10.1109/TPAMI.2010.166.
2
A new approach for overlay text detection and extraction from complex video scene.一种从复杂视频场景中检测和提取叠加文本的新方法。
IEEE Trans Image Process. 2009 Feb;18(2):401-11. doi: 10.1109/TIP.2008.2008225. Epub 2008 Dec 16.
3
Multi-Spectral Fusion Based Approach for Arbitrarily Oriented Scene Text Detection in Video Images.基于多光谱融合的视频图像中任意方向场景文本检测方法。
IEEE Trans Image Process. 2015 Nov;24(11):4488-501. doi: 10.1109/TIP.2015.2465169. Epub 2015 Aug 5.
4
Text string detection from natural scenes by structure-based partition and grouping.基于结构划分和分组的自然场景文本字符串检测。
IEEE Trans Image Process. 2011 Sep;20(9):2594-605. doi: 10.1109/TIP.2011.2126586. Epub 2011 Mar 14.
5
A hybrid approach to detect and localize texts in natural scene images.一种用于检测和定位自然场景图像中文本的混合方法。
IEEE Trans Image Process. 2011 Mar;20(3):800-13. doi: 10.1109/TIP.2010.2070803. Epub 2010 Sep 2.
6
Multi-Orientation Scene Text Detection with Adaptive Clustering.多方向场景文本检测的自适应聚类方法。
IEEE Trans Pattern Anal Mach Intell. 2015 Sep;37(9):1930-7. doi: 10.1109/TPAMI.2014.2388210.
7
Contour Restoration of Text Components for Recognition in Video/Scene Images.视频/场景图像中文字组件的轮廓恢复用于识别。
IEEE Trans Image Process. 2016 Dec;25(12):5622-5634. doi: 10.1109/TIP.2016.2607426. Epub 2016 Sep 8.
8
Tracking Based Multi-Orientation Scene Text Detection: A Unified Framework With Dynamic Programming.基于跟踪的多方向场景文本检测:一种具有动态规划的统一框架。
IEEE Trans Image Process. 2017 Jul;26(7):3235-3248. doi: 10.1109/TIP.2017.2695104. Epub 2017 Apr 18.
9
Text from corners: a novel approach to detect text and caption in videos.从角落提取文本:一种新颖的视频中检测文本和标题的方法。
IEEE Trans Image Process. 2011 Mar;20(3):790-9. doi: 10.1109/TIP.2010.2068553. Epub 2010 Aug 19.
10
Text-Line Detection in Camera-Captured Document Images Using the State Estimation of Connected Components.利用连通分量的状态估计在相机拍摄的文档图像中进行文本行检测
IEEE Trans Image Process. 2016 Nov;25(11):5358-5368. doi: 10.1109/TIP.2016.2607418. Epub 2016 Sep 8.

引用本文的文献

1
Rotation-invariant features for multi-oriented text detection in natural images.自然图像中多朝向文本检测的旋转不变特征。
PLoS One. 2013 Aug 5;8(8):e70173. doi: 10.1371/journal.pone.0070173. Print 2013.