• IIANews微官网
    扫描二维码 进入微官网
    IIANews微信
    扫描二维码 关注微信
    移动客户端
  • English
2025全景工博会 菲尼克斯电气二级-以太网
机器视觉

相机字符识别难?邦纳,让OCR应用更简单!

  2019年05月05日  

  什么是OCR?

  OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

  如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,也是难点。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。所以在以往的案例中,OCR应用一直是一项挑战比较大的应用类型。

  OCR应用的操作步骤如上所示,这其中字符的分割和示教是OCR应用的难点。

  先来讲字符的分割,让我们看看下面这些例子。在下图中:每个字符之间有足够的空隙,根据好字符的长宽尺寸,甚至不用刻意设置,软件就很容易将每个字符独立开来进行识别,这是理想状态,会有很好的检测稳定性。

  当然也有糟糕的情况,而且这些情况还很常见,比如下面这些图:点阵字符、字符间距很近。这样的字串在分割的时候难度就比较大,很容易将一个字拆分成两个,或者彻底分割不清,从而导致错误识别。如果字符分割不清对后续的字符示教会产生极为不利的影响。当然这种情况有时可以调整喷码机参数让字符间距适当加大。

  更多的情况是由于生产线的抖动、包装表面不平整、喷码设备的性能降低等因素导致的字符位置变化、歪斜、波浪、弯曲、脱线、模糊等问题。二这些问题会使得打印出的字符和当初示教的字符存在差异,当差异过大时则会产生拒识、误识。当然我们可以将拒识的字符再次进行示教录入字库,可是随着时间的推移,我们可能需要不断对拒识字符进行示教,从而导致字库过大,检测速度降低。同时这套检测设备的操作体验也会极差。

  对于上述情况,BVI系列视觉软件的OCR功能在操作体验上就有很大的提升,事实上也是性能的全面提升。让我们盘点一下BVI软件在OCR应用上的优势:

  1、内置字库,无需手动示教字符(也支持手动示教);

  2、可定义格式字符格式,防止外形接近的数字和字母混乱;

  3、一个ROI读取多行字符;

  4、OCR工具专属定位功能;

  5、预处理工具强化字符对比度;

  6、读取系统时间参与日期码比对。

  如上所述,BVI软件的OCR操作就变成:拍照→设定ROI→设定字符大小→选择字库→读取比对。“字符分割”变成“设定字符大小”后,从参数的输入变成了图形化区域绘制,操作更友好。“示教字符”变成“选择字库”后将繁重的示教工作变成了几秒钟的字库选择。这一切的性能提升就是为了让OCR应用更简单更稳定。

最新视频
WAIN连接器,全链路守护数据中心的稳定运行   
利旧焕新向未来——ABB《我们的回答》第二季   
福禄克钢铁冶金行业测温解决方案专题
魏德米勒SNAP IN鼠笼式联接技术试用活动
Creo:在更短的时间内交付更好的设计
专题报道
《我们的回答》ABB电气客户故事
《我们的回答》ABB电气客户故事 ABB以电气问题解决专家之志,回答未来之问。讲述与中国用户携手开拓创新、引领行业发展、推动绿色转型的合作故事,共同谱写安全、智慧和可持续的电气化未来。
企业通讯
2026大湾区智能制造与机器人创新峰会报名
2026大湾区智能制造与机器人创新峰会报名

2026 年两会政府工作报告明确提出深入推进数字中国建设,力争将数字经济核心产业增加值占 GDP 比重提升至 12.5%

重新定义可靠传动,共同创造美好未来!
重新定义可靠传动,共同创造美好未来!

完美无谐波 GH180 变频器于1994 年问世,是变频器行业的一次重大技术变革,在可靠性和创新方面不断树立工业标准。伴

在线会议
热门标签

社区