高速电路与神经网络实验室
形 象 认 知 计 算     课题组

多媒体网页图片文字分割技术

随着网络技术的发展,互联网已经成为我们获取信息的主要途径。诸如图片的多媒体内容在网页中所占的比重在近几年中程爆发式增长,因为图片相对于纯文本而言有着更强更灵活的表现形式。由于网页图片中的文字部分能够在很大程度上体现网页的内容,所以有效的识别出图片中的内容对网页高层语义的理解、检索和索引是相当有价值的。图片文字识别技术一般分为三个部分:文字定位、文字分割和文字识别。本技术针对复杂多变的网页图像,设计了新的文字定位与分割算法,在兼顾实时性的同时保证了较高的识别率。本技术可以应用于多媒体搜索引擎、网络内容分析、精准广告、舆情分析等多个领域。