各常见OCR图片文字识别对比总结独角马

OCR英文全称是OpticalCharacterRecognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。比如汉王OCR,百度OCR,阿里OCR、有道OCR、科大讯飞等等。其实我们自己也能感受到,OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题,拿个手机一扫,APP就能在网上帮你找到这题的答案。此次因某些需求需测试当前比较常见的各个OCR文字识别的识别率,所以总结该文档仅供参考!

具体测试图片的实例由于都是网图,就不粘贴出来了,自己可以去网上找关于印刷体(印刷体中文、英文、中英文混合)、手写体(中文、英文、中英文混合)的图片以供测试。

测试日期为2021年4月。

一、腾讯云OCR文字识别

免费次数:首次申请有1000次免费次数。但只有当月有效,也就是说哪怕你3月29日开通,到4月份也就失效了。

默认接口请求频率限制:10次/秒

需新建API密钥生成SecretId和SecretKey。具体使用示例官网有介绍,可根据自己具体所用开发语言选择不同的示例。

本人测试示例:通用印刷体识别(高精度版)、通用手写体识别、英文识别

1、英文识别(对应接口类EnglishOCR)只能识别到英文,无法识别中文(是一点都识别不了)

针对纯手写英文个人感觉在60%左右吧

2、通用印刷体识别(高精度版对应接口类GeneralAccurateOCR)能识别中英文

针对手写英文识别率估算65%左右英文可识别空格标点符号等

针对手写中文识别率95%左右

针对印刷体中英文识别率90%以上

针对多题型(机打、手写、中英混合)识别率60%吧

3、通用手写体识别(对应接口类GeneralHandwritingOCR)缺陷:英文识别不了空格标点符号等

针对手写英文识别率估算50%左右英文识别不了空格标点符号等

针对印刷体中英文识别率90%吧

返回json格式,DetectedText参数为具体识别内容。

返回示例如:

优点:文档较丰富

缺点:调用比较耗时、识别率一般

如果要使用腾讯云的话建议使用通用印刷体识别(高精度版)

二、百度云OCR文字识别

具体免费政策:根据不同接口有不同限制,从50到500不等

具体示例在API文档中也有介绍具体返回json格式,读取的内容参数为word

本人测试实例三种:试卷分析与识别、手写文字识别、通用文字识别(高精度版)

针对手写英文识别率手写文字识别最好75%

针对手写中文识别率都在90%左右

针对印刷体中英文数字混合识别率都在90%以上

针对多类型(机打、手写、中英混合)识别手写文字识别最好60%多吧

优点:文档丰富、使用不复杂

如果要用百度云Ocr建议使用手写文字识别

三、有道云Ocr文字识别

需创建应用和应用ID、应用密钥

具体费用政策:无免费体验次数,但注册时会返50元具体调用会从这50元中扣

本人测试示例:整题识别(含公式)、通用文字识别

针对手写英文识别率都还可以80%是有的

针对手写中文识别率都可以80%

针对印刷体中英文数字混合识别率都还可以90%

针对多类型(机打、手写、中英混合)识别率60%吧

返回json格式,text参数为具体读取内容

具体返回示例如:

优点:暂时想不出来

缺点:不是太友好,官方给的实例有的都是错的。调用返回错误消息比较模糊

四、阿里云OCR文字识别

单用户限制10QPS

免费政策:500次

本人测试实例:印刷文字识别-试卷识别/OCR文字识别、印刷文字识别-答题卡主观题识别

针对手写英文识别率印刷文字识别-试卷识别/OCR文字识别没法用识别率非常低、印刷文字识别-答题卡主观题识别一样拉,跟腾讯云一样识别不了空格和标点符号

针对手写中文识别率都还可以80-90%

针对印刷体中英文数字混合识别率都还可以80%

针对多类型(机打、手写、中英混合)识别率70%

返回json格式,word参数为返回的文本

优点:针对多题型识别率还可以

缺点:太杂了,不友好。找个东西都需要好久。针对纯手写英文还是算了吧

五、汉王OCR文字识别

在阿里云里面可直接找到,用法跟纯阿里云差不多

免费政策:0元/20次

本人测试实例:汉王通用文本识别、汉王手写体识别

针对手写英文识别率都还可以90%

针对手写中文识别率都还可以80%是有的

针对多类型(机打、手写、中英混合)识别率都还可以70%

优点:两种方式识别都差不多,比较稳定

缺点:感觉调用时长是最长的

综上所述:

最普通、中庸的:有道云

比较稳定的:汉王

比较友好的:百度

免费次数最少的:汉王和阿里

针对手写英文识别率阿里最差,汉王相比其他略好些(个人感觉)。其他的都还可以70%是有的针对手写中文识别率腾讯云的英文识别外,其他识别率也都在90%针对印刷体中英文数字混合识别率都还可以基本都在90%左右针对多类型(机打、手写、中英混合)的识别率汉王=>阿里>百度>腾讯=有道

另:由于某些原因科大讯飞的OCR暂未测试,据朋友测试后反馈科大讯飞的识别率能好一些,略优于汉王。

THE END
1.深国图取得一种基于云计算和边缘计算的语音识别系统设备及介质专...金融界 2024 年 11 月 13 日消息,国家知识产权局信息显示,深圳市深国图信息技术有限公司取得一项名为“一种基于云计算和边缘计算的语音识别系统、设备及介质”的专利,授权公告号 CN 113380253 B,申请日期为 2021 年 6 月。 本文源自:金融界 作者:情报员...https://www.163.com/dy/article/JGSJVFQV0519QIKK.html
2.什么是ocr识别云商店"什么是ocr识别"的相关产品有哪些?价格是多少?云市场小编为您整理了"什么是ocr识别" 相关商品,包含商品介绍、价格、服务商等信息。如有问题,您可通过拨打950808或在云商店官网提交工单联系我们,希望以下"什么是ocr识别" 商品能为您提供有效的解决方案https://marketplace.huaweicloud.com/series/1de7755447074ece81ab3abb17ea3aa2-1-S
3.文字图片OCR识别软件北京译图智讯专注于OCR识别技术,提供文字提取、图片识别等服务,主要产品有包括:ocr发票识别软件,增值税发票识别,银行流水识别,银行卡卡号识别,营业执照识别,身份证识别等.http://www.etoplive.com/
4.OCR文字识别图片提取文字合合信息,提供OCR文字识别、证件识别、银行卡识别、票据识别、表格识别、文档识别等海量识别模块,支持sdk,公有云,私有化部署等自由部署方式,满足场景需求https://b.intsig.com/ocr
1....并部署到华为昇腾NPU的详细步骤npu910bppocrPaddleOCR是飞桨推出的一套丰富的OCR工具库开源项目,支持文字检测、文字方向检测、多语种文本识别、手写体文本识别等多种OCR相关前沿算法,并提供了丰富的轻量级预训练模型和模型优化技术,可以快速部署和使用OCR功能。 https://github.com/PaddlePaddle/PaddleOCR https://blog.csdn.net/qq_54958500/article/details/143500816
2.欧美最顶尖的5家云厂商,都在押注什么?澎湃号·湃客澎湃新闻在2025财年第一财季,微软提交了一份精彩的成绩单。其中,包括Azure公共云、Windows服务器、语音识别软件Nuance和GitHub的智能云业务部门三季度营收240.92亿美元,同比增长20%,展示了微软在云计算领域的卓越实力,成为驱动微软增长的主要引擎。 Azure之所以能够迅速成长,除了依靠强大的技术支持外,还得益于公司长期以来业务布局...https://www.thepaper.cn/newsDetail_forward_29311900
3.云迁移离线采集工具采集工具文档中心云资源离线调研工具供客户采集源端平台的资源使用,目前支持对阿里云、华为云和 AWS 国际站的源端资源扫描。 如果云资源地域在境外,将扫描工具下载到境外节点进行扫描,可以减少因为网络问题造成的云厂商 API 调用失败。 准备工作 扫描工具工作需要指定云资源所在的云厂商名称, 资源所在地域 Region 和访问云资源的密钥对(...https://cloud.tencent.com/document/product/659/112539
4.公有云OCR识别服务平台公有云OCR识别服务平台 云平台OCR证件识别介绍: 文通翔云OCR云证件识别服务平台是OCR识别技术与互联网技术、云计算技术相结合的在线OCR识别服务产品,致力于成为移动互联时代OCR识别云服务的专业提供商。 基于松耦合、高复用性、易于维护的原则,我们建设了翔云OCR云识别服务平台,以统一的网络访问接口方式,对外部应用系统提...https://www.eolink.com/news/post/41190.html
5.云脉ocr云识别软件介绍来了!OCR的应用嘲有哪些?这时候就不得不借助OCR文字识别工具拉。不过如果内容不是纯中文内容的话,普通OCR文字识别是搞不定的,推荐使用【超级公式】的PDF公式识别功能; 云脉ocr云识别软件在进行ocr识别的时候具有非常大的优势,大家有兴趣可以对这款软件进行全方位的了解,上述的文字希望对大家了解云脉ocr云识别软件有所帮助。https://www.foxitsoftware.cn/scanner/jiaocheng/553.html
6.私有云ocr识别技术方案私有云ocr识别技术方案 简述:随着互联网的快速发展,人工智能发展也来越快,OCR识别就是识别图片上的文字,纸质文档识别等等,被广泛应用到技术领域,OCR的功能有很多,比如,发票识别,身份证识别,户口本识别等等,我们提供api接口,离线SDK,私有化部署,等整体解决方案。百度OCR的功能和优势 1.高精度识别:实现99%以上的高...https://www.tuidc.com/helpinfo/39620.html
7.具有OCR和AI的AzureAI视觉MicrosoftAzure阅读面部识别透明度说明 有关Azure AI 视觉的常见问题解答 全部展开|全部折叠 哪些地方提供 Azure AI 视觉? 什么是适用于 Azure AI 视觉的 SLA? 你们是存储我的图像或视频,还是将其用于产品改进? 空间分析是否会检测人脸和人的身份? Azure AI 视觉如何分析物理空间中的人? https://azure.microsoft.com/zh-cn/services/cognitive-services/face/
8.百度智能云文字识别OCR文字识别软件免费在线试用怎么样提供稳定易用的在线API、离线SDK、软件部署包多种服务形式,最高可享每天50000次免费调用,依托百度优秀的深度学习算法和海量优质数据,并针对特殊情况进行专项优化,关键字段识别准确率高达99%。 · 远程身份认证 结合OCR和人脸识别技术,实现对用户身份证件信息的自动识别和录入,同时通过人脸核身解决方案进行人脸识别和活体检...https://www.36dianping.com/space/4470401030