QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

票据不规范,难以识别?华为云 OCR 帮你搞定

  • 2020-03-31
  • 本文字数:1194 字

    阅读完需:约 4 分钟

票据不规范,难以识别?华为云OCR帮你搞定

在医院,每天会有大量的机打票据、化验单等等,而人力物力有限的条件下,这些重要的数据,如何不影响结算、销核的准确性?


下面到了考眼力的时刻了,这样的单据里,你可以在 2 分钟内分辨清楚所有的信息,然后将这些数据录入软件系统吗?



  • 在这个票据当中,存在各种问题:

  • 内容与标题错位、串行

  • 文字行倾斜

  • 内容超出边界

  • 公章覆盖了有效内容

  • 字迹不清晰

如何解决?

显然,每天面对大量花式不规范的票据,并在短时间里高效不犯错地输出单据内容,即使最强大脑上的选手们估计也得怀疑人生了。


同时,如果这些票据用于其他的业务,比如保险理赔,医疗票据作为最核心的理算依据,需要录入的项目众多、类别庞杂,仅一张票据就需要录入上百项内容,算上复核,这样庞大的人力需求就成了重要的成本,掣肘了商业公司的基本的盈利诉求。


那么有没有解决方案呢?答案就是运用文字识别技术 OCR!


标准的文字识别其实早已实现了大规模商用,比如广泛应用的车牌识别,让交通违法无所遁形,为车辆和行人的安全保驾护航,创造了巨大的社会价值。


但是这种技术的应用场景比较狭窄,对车牌的悬挂合规性要求比较高,无法扩展到其他领域。而最近几年再次取得突破进展的人工智能技术,为 OCR 的适应性插上了腾飞的翅膀。

是时候告别低效的生产力了!

华为云也最早上线了 OCR 服务,而且为了满足多样化复杂的识别场景,做了深度的分析和研究,应用独有的 ITE 专利技术,在处理上面的类似复杂度的票据识别时,相比业界的通用能力,具有全面综合的领先优势:


  • 高度复杂的文件识与提取错误率降低了 50%

  • 错误率的大幅降低,在现有技术条件下,可以极大地降低人工干预复核成本,减少客户业务的等待时间。

  • 识别能力提升到了可以商用化的阶段

  • 如果识别能力达不到一定的指标,那么就很难应用开来,没有数倍的效率提升的话,对于企业的成本也就没有本质上的改善。

  • 金额等关键数据识别和提取准确率从 70%左右提升到 95%

  • 票据中的信息关键程度是有差别的,比如金额部分,数字的复核通常也要比汉字花费更多的时间,确保重要信息的准确度,可以帮助不同的软件系统有效提升处理效率。

成功应用案例

在人工智能在各个行业不断落地应用的这波浪潮中,国内某三甲医院也考虑把 OCR 引入到自身的业务中,在经过深入的技术验证后,选择了使用华为云的整体解决方案,以其中的 OCR 服务为例。


在引入之前,医院的票据、证照、发票在各个流程节点上都需要专人专职负责,不仅工作量大,而且如前面描述一样,票据的不规范严重降低了业务效率,也影响了业务的对接处理进度。相关数据显示,人工完成一个业务录入平均耗时大约在 5 分钟。


相比之下,采用了华为云 OCR 人工智能识别服务以后,可以自动识别票据当中的每一部分信息,精准提取出其中需要录入的数据,并且可以正确完成数据和条目的对应,秒级即可完成相同的工作,效率呈几何式增长。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/k2vWbtYYvoT-85GO3KA6ww


2020-03-31 14:41872

评论

发布
暂无评论
发现更多内容

微信朋友圈的高性能复杂度分析

Asura

模块二作业 微信朋友圈高性能分析

Geek__猫猫头

CopyOnWriteArrayList 源码分析-基础和新增

zarmnosaj

5月月更

聊聊 Kafka:Kafka 如何保证可靠性

老周聊架构

kafka 5月月更

Docker镜像制作实战:设置时区和系统编码

程序员欣宸

Docker 5月月更

Kafka到底有多高可靠?(RNG NB)

敖丙

kafka Java EE 程序员‘

架构实战营模块2-微信朋友圈分析

Geek_e8bfe4

理“ Druid 元数据”之乱

vivo互联网技术

大数据 存储 Druid Apache Druid

企业知识管理难题,现在有了一个好的解决方案

小炮

微信朋友圈的高性能复杂度架构

Pengfei

Vue框架学习笔记【第day三】

恒山其若陋兮

5月月更

【愚公系列】2022年05月 二十三种设计模式(十七)-中介者模式(Mediator Pattern)

愚公搬代码

5月月更

【愚公系列】2022年05月 二十三种设计模式(十八)-备忘录模式(Memento Pattern)

愚公搬代码

5月月更

国密在车联网安全认证场景中的应用|车联网系列专题07

EMQ映云科技

车联网 物联网 国密 emqx 5月月更

继StepN后,新的链游之光

BlockChain先知

[模块二作业]

wuli洋

要自信的对客户说 “NO”

源字节1号

在线下划线转驼峰,驼峰转下划线工具

入门小站

工具

在线HTML转ASP工具

入门小站

工具

架构实战营-模块二作业

Roy

架构实战营

【架构训练营】模块二作业

知北游

作业

SAP UI5 自动化测试工具的 qunit-redirect.js

汪子熙

JavaScript 前端开发 SAP Fiori 5月月更

架构实战营|模块2

KDA

#架构实战营

网站建设导致网站失败的十个原因

源字节1号

微信小程序 前端开发 后端开发 网站开发

如何抓住架构设计关键 - 作业

阿拉阿拉幽幽

前端食堂技术周刊第 39 期:TypeScript 4.7、Layouts RFC、Lerna 复活后的大版本 v5.0.0 、TypeScript 错误翻译器

童欧巴

JavaScript typescript 前端

架构实战营 7 期「模块二」如何抓住架构设计关键点

Steve_bot

英特尔加速创新,唤醒网络及边缘原力

科技之家

2.5TinkerPop3 升级指南

Geek_古藤模根

图数据库实战

模块二 微信朋友圈高性能架构分析

挖了蘑菇哩斯

作业 架构实战营

分析一下微信朋友圈的高性能复杂度

Geek_7a789a

票据不规范,难以识别?华为云OCR帮你搞定_行业深度_华为云产品与解决方案_InfoQ精选文章