能批量识别,翻译,表格识别的OCR文字识别应用-白描
自白描7月19号更新了一次之后,它沉默了好久,终于在8月25号又更新了一个版本,自25号到今天,又更新了两个版本,这两个版本一直在完善细节,修改BUG,提升体验,现在,我觉得目前的功能完善的差不多了,可以向大家推荐一下了。
新版的白描最重要的几点是:识别速度更快,准确度更高;批量识别;翻译;表格识别。
1. 识别速度更快,准确度更高
这一版的白描,识别速度有了质的飞跃,大约提升了40%,准确度也比上一版更高了,市面上的识别软件对比下来,白描的速度是处于领先位置的。虽然说都用的现有的文字识别商业解决方法,但白描在其中的优化有很多很多,所以才会有这个提升。感兴趣的朋友可以找几款对比评测一下。
2. 批量识别
白描应该是第一款真正意义上的包含批量文字识别功能的OCR软件,而他开启进入批量识别模式的方式也不会让软件的界面显得赘余。
长按一张图片,即可进入批量识别模式,然后点击其他图片进行多选即可,如下图左图:
多选之后即可进入批量识别界面,如上图右图所示,在批量识别界面可以设置任何一张图片的识别语言,识别完成之后可以进入任何一张图片选择需要的文字,全部识别完成之后,最下面的大按钮会变为“合并并查看文字”,点击即可去识别结果页面查看所有文字,并对所有图片和文字进行校对。
3. 翻译
经过很多用户朋友的反馈,最终决定为白描加入翻译功能,目前,白描支持简体中文、日语、英语、韩语、法语、西班牙语、阿拉伯语、俄语、德语、葡萄牙语、意大利语、繁体中文、粤语、文言文的互译。
进入翻译功能也很方便,如下图左图,在识别结果页面的下方工具栏即可找到入口。
翻译页面如上面右图,最上方可进行翻译语言的选择。
为了更方便进入翻译,在手机桌面,可以使用 3D Touch 直接进入翻译功能。
4. 表格识别
由于很多用户反映需要表格识别的功能,白描添加了表格识别,入口如下图左图,在识别页面点击上面的文字按钮,即可出现下拉菜单,选择表格识别即可。
表格识别不像文字识别那样立即出现结果,识别完成之后需要几秒钟到几十秒的时间在服务器生成表格,因而,识别完成之后,稍等一下,就可以进入识别结果页面,识别结果页面直接显示出生成的表格,如上面右图所示,点击结果页面右上角可以将表格传到 Numbers、Excel 等软件里,或者传到电脑进行编辑。
不过,目前表格识别还在初级阶段,对于比较复杂的表格的识别度还是不行,希望用户盆友们以宽容之心陪着白描一起成长。
5. 选择文字手感顺滑,还原文字位置准确
白描上架之后,随之又出现了很多文字识别软件,白描也进行了一些借鉴,将识别的流程改为先识别后选字(可能后面还会改回去,因为我又有更好的想法了),选择文字的方式主要借鉴了搜狗输入法的文字选择方式,识别成功之后,手指滑动选择需要的文字,屏幕上会留下轨迹,没有选到的再滑过去继续选择即可,如下图左图。
对于拍的比较倾斜的照片,白描也能较好的还原文字原来的位置,如上面右图,这样就能很方便的选择需要的文字或段落了,当然,这里也不是鼓励斜着随便拍,能拍正了当然最好。
6. 校对与编辑
文字识别页面下方添加了校对功能,可以点击“校对”按钮弹出校对视图,方便识别结果与原图对比修改,不需要时再点击按钮即可消失,如下图。
7. 快捷打开第三方 APP 粘贴和分享识别结果
为了更方便的将识别结果粘贴到自己常用的平台,白描添加了管理第三方 APP 的功能,在设置里,可以打开自己常用的 APP 的开关,以显示在识别结果页面的“复制并打开”的菜单中,如下图:
对于没有的 APP 您可以反馈给我,我会考虑使用用户的多少去加入。
更多分享的按钮可以调用系统的分享模块,方便的分享给支持系统分享的各种软件。
8. 添加语言自动检测功能
因为很多用户反映,如果要识别其他国家语言每次都要选择一下很麻烦,能不能自动检测呢?目前白描加入了自动检测语言,但是自动检测仅支持中文、英语、日语、韩语的自动检测功能,其他语言需要识别的话还是要先选择语言哦。
9. 更强大的识别插件和翻译插件
白描自上架的那一天起,就有了系统相册直接调用白描插件进行识别的功能。目前,插件的功能更加强大,可以完全在识别插件里完成识别到编辑到打开其他 APP 或者翻译的一整套流程。
如上图所示,左图,在相册任选一张照片共享选择白描,即可调用识别插件在相册里快捷完成识别。右图,在 Safari 或者其他软件里选择需要翻译的文字点击共享,选择白描,即可快捷的调用翻译插件进行翻译,无需打开白描 APP 或者其他翻译软件了。
10. VoiceOver 无障碍兼容性提升
白描在开发过程中,一直注意无障碍的开发,目前,绝大多数功能都可以很好的兼容,比如,在相册里选择照片时会提示照片序号和拍摄日期,批量识别的时候会提示哪一张识别完成,哪一张在识别中,哪一张未识别等等。当然目前所做的一定还不够,白描还会继续完善。
11. 标点符号的半角与全角识别优化
自上架之日,就有用户反馈全角标点识别成半角标点的问题,现在,终于解决啦。
12. 其他
其他要说一下的就是图标啦,这一版的图标变成了一只猫咪,因为我和女朋友都喜欢猫咪,我们也养了一只白色的猫咪,叫“玄烨”,这名字是不是很霸气……之前也有很多用户盆友说会把“白描”看成“白猫”,那我们索性就把图标设计成一个猫咪吧!于是,女盆友就设计了现在的图标。如下图:
猫的整个轮廓想一个汉字“白”,也是英文 Scan 的首字母 “S” 的变体,同时,更是一只可爱的猫咪。
最后,放上几张“玄烨”的美图收尾啦~
白描会一直聆听大家的意见,越来越好~