视频帧中的文本检测与提取技术
随着计算机和通信技术、宽带网络技术、音视频压缩技术以及计算机硬件技术的发展,图像和视频中的文本信息对索引、检索及高层语义的自动理解等具有重要价值。本文主要研究如何从视频帧中检测、提取与识别人工添加的文本信息。论文的主要工作如下: 首先,根据文本的特征以及目前存在视频图像的文本定位和提取算法,实现了一种基于边缘检测的文本定位方法。实现主要流程包括:对选取的视频帧图像进行灰度化处理、边缘检测、边缘图像二值化及数学形态学操作,最后定位文本区域。实验表明该方法实现简单,并且可以定位出大部分的文本区域,但当图像或视频帧中背景本身包含了丰富的边缘信息时,则定位文本区域就不够准确。 其次,对定位好的文本区域进行提取与识别,本文应用基于值分割方法来提取文本。在处理简单或者单一背景色的文字图像时,使用经典的值分割算法中的最大类间方差法(OTSU),该方法计算简单、稳定有效。在复杂背景下提取文字时,本文使用了局部自适应的值化方法。经过实验测试,得到了很好的分割效果。 最后,对提取出的文本进行去噪声等处理,最大限度地去除文本的背景,为OCR识别系统提供完整清晰的二值输入文本图像。经“尚书七号”文字识别软件对文本图像进行识别后,结果证明文字的正确识别率能达到80%左右。
【视频帧中的文本检测与提取技术】相关文章:
实验检测技术在公路工程中的应用11-22
论食品检测中红外光谱技术的运用11-20
桩基检测技术在高层建筑工程中的应用论文03-24
岩土工程中深基坑检测技术的应用探究论文03-17
计算机技术在建筑材料检测中的应用03-25
时政文本翻译中的文化自主意识11-15
无人机检测技术在桥梁检测工程的应用论文03-15
文本图像信息隐藏技术研究提纲12-04