现在大多数的新兴应用,尤其是人工智能和元宇宙,都需要计算机视觉技术。而文本行检测属于计算机视觉领域的目标检测任务,是一个当下热门且应用领域非常广的课题。
什么是计算机视觉技术?
首先,让我们来看下,什么是计算机视觉?根据IBM给其的定义,计算机视觉是人工智能 (AI)领域的一个分支,让计算机和系统能够从数字图像、视频和其他视觉输入数据中提取有意义的信息,并根据这些信息采取行动或提出建议。
计算机视觉的应用场景在我们身边是无处不在的,主要可将其归为四大类:深度感应、生物识别、AR/VR/MR、机器人与工业控制。
文本行检测痛点问题
文本行检测作为计算机视觉领域当下热门的具体应用领域课题,由于文本行目标本身的一些特性,导致想要完美的检测出各个场景下的文本行存在着以下三个痛点问题。
痛点一:文本行的形态任意
以行人为例:上图中5个行人宽高比分布在0.36~0.53
上图中5个文本行宽高比分布在0.23~9.1,分布极其不规律。
痛点二:文本行的交叉与遮挡
目前主流的文本行检测方法是在图像分割结果上使用类似于联通域判断得到结果,因此重叠的文本行无法分离。
痛点三:文本行的背景复杂
大多数目标检测任务所要检测的目标都是有固定的出现场景的,例如,行人出现在街上,汽车出现在马路上,杯子出现在桌子上等。而文字可能出现在任何地方,街上,书上,包装上…..因此任何背景都有可能,没有固定过得场景。这对检测来说是一大挑战。
迦百农技术团队直击痛点
目前市面上主流的通用类目标检测是基于框回归的方法去预测,该方法受物体形态影响较大,因此该类方法对于文本行检测精度较低。另外该类方法所预测的检测框受到特征提取的条件约束,只能够截取正矩形框,不支持带有角度的检测框。
而主流的文本行检测方法,是通过图像分割来完成的,但是由于分割方法的约束,受到遮挡与交叉的文字,并不能被很好的检测。
为了能够达到基于分割的文本行检测方法的精度,又能够很好的将重叠交叉的文字区分开来,我们将上述两种方法相结合,得到了较好的效果。
对于OCR任务,我们从两个方面着手:1、文字形态信息;2、文字语义信息。
同时该项技术已运用于我司旗下的两大产品:超集燕子极光JC326与超集燕子星球MD330。
超集燕子极光JC326:应用于真烟在非法流通中的执法工具,改变烟草专卖部门在真烟异常流通查缉工作中的手工抄录,喷码溯源、数据分析的传统模式,实现自动识别录入数据,大幅度提升烟草专卖稽查工作人员32位喷码抄录溯源效率。
超集燕子星球MD330:主要运用于解决烟草行业的专卖监管部门,在日常工作中需要对已查获或预判案件的物流面单信息进行数据采集和分析。
字体识别技术
字体识别技术是我们自主研发的课题,收集了全网的商用以及非商用字体 ,通过深度学习技术进行分类识别。目前已投入使用,且模型在不断 更新,以兼容最新出品的字体。
财务票据系统
财务会计做账需要人工录入财务票据信息,人工录入时存在以下问题:
1.速度慢,票据量大时需要很长时间。
2.当人员长时间操作出现疲劳时,可能会出现录入错误。
财务票据系统是一个直接将财物票据的照片或者电子版文档翻译成结构化数据的系统,它通过OCR技术,将图像信息转化为文字信息,并对文字信息进行结构化抽取,高效且准确。
迦百农核心技术团队
迦百农在北京、上海、深圳、厦门等多地建立研发中心,拥有完整的技术研发团队、安全运维团队、人工智能团队和技术服务团队。
其中核心技术团队来自清华大学、复旦大学、交通大学等著名学府,拥有20年+经验的信息安全专家、系统架构师、大数据挖掘专家、软硬件人工智能场景落地专家等高端人才,具有深厚的研究功底和丰富的经验。
技术团队在文本检测识别和图像识别技术上不断创新,使用人工智能技术来解决商业问题。自主研发的基于深度网络的文本检测与识别系统技术,在测试中可以对复杂条件下的纸质表单中的文字实现99%以上的识别准确率,并且在多项文本行检测和文本行识别赛事中排名前列。
我们的检测方法在阿里云天池网络图像识别长期赛中稳居前列,其中文本识别和文本检测这两项更是取得了极为突出的成绩。
在对于真烟非法流通案件处理的场景应用中,我司自研的“超集燕子极光JC326”即应用了这套OCR识别算法,单字符识别准确率为99.98%,整体32位喷码识别准确率高达97.6%,遥遥领先于全国同类竞品。目前已在厦门烟草、广州烟草、三明烟草、龙岩烟草等烟草单位得到广泛应用。
我司正在积极拓展文本识别技术的商业应用落地,以大幅提升经济生活中使用的票证、单据、表单的大规模电子化处理效率。
作为人工智能创新解决方案及咨询服务商,我司以人工智能技术为用户需求服务,帮助传统企业实现敏捷、智能、创新和规模化,旨在用人工智能技术真正为客户创造价值!
服务热线:
0591-8320-6602
网址:
www.jiabainong.net
联系电话
18120802657
售后联系
0591-8320-6602
官方邮箱
jbainong@163.com
官方qq
1983441409