主题:【第十二届原创】利用OCR软件快速将图片转化为文本

浏览0 回复3 电梯直达
栀子花开
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
分析者端木花之队发表于:2019/09/09 16:48:53 楼主 管理 分享 倒序浏览 只看楼主 回复 私聊
该帖子已被生活所迫设置为精华; 奖励积分记录: 生活所迫(20分)
维权声明:本文为qzxmsy原创作品,本作者与仪器信息网是该作品合法使用者,该作品暂不对外授权转载。其他任何网站、组织、单位或个人等将该作品在本站以外的任何媒体任何形式出现均属侵权违法行为,我们将追究法律责任。
9月三等奖
利用OCR软件快速将图片转化为文本
——基于《扫描识别全能王》软件
实验猿往往会遇到这样的场景,手里捧着厚厚的文献,却无法将其快速转化成文档进行利用;或者网上有丰富的文献,却需要付费或积分才能下载……遇到这些情况,以前只能抓耳挠腮,但今天这一情况却不复存在了。首先利用截图软件,将网页内容转化为图片;再利用OCR软件,快速将图片转化为文本;最后利用社交软件,将手机上的文本,传送到电脑上进行再加工和利用。下面且听我慢慢道来,如何利用扫描识别全能王及截图社交软件实现快速OCR:
1 OCR原理
OCR是Optical Character Recognition(光学字符识别)的缩写,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
以前的OCR软件多是电脑版,需要先将资料扫描成图片,然后进行识别。加上OCR识别率不高,编辑校对耗时颇多,因此OCR软件利用率并不高。随着互联网技术的发展和手机软件的繁荣,手机版OCR软件也如同雨后春笋般发展,而且目前OCR软件识别效果较好,识别后的文本基本上稍作修改即可使用,因此利用率有较大程度提高。
2《扫描识别全能王》软件简介
这是一款非常低调的软件,打开后界面非常简单。
首先进入的是“首页”,只有屏幕右下角一个“+”的图标,加上最下方“首页”、“发现”、“更多”三个模块。
点“+”号,出现“批量导入”、“相册导入”和“相机扫描”三个功能。导入后,可点击下方的“×”将这三个功能的图标暂时屏蔽,需要导入时再次点击“+”即可。
进入“发现”模块,有“文字翻译”、“文字转语音”、“拍照翻译”及“PDF生成”四个功能。
进入“更多”模块,有“做的不好戳这里骂开发者”、“做的不错!”及“关于”三个功能。“骂开发者”实际上是用户反馈意见功能,而“做的不错”是使用者向各大应用市场提交软件使用评价功能,而在“关于”里我们可以看到软件的版本(此处是2.1)及检查更新功能,以及软件作者的邮箱。
3图片化工具
不管是纸质版的文献,还是网络上不可复制或下载的文献,均需要首先转化为图片才能利用OCR软件进行识别。
对于纸质版文献,推荐采用手机拍照方式,因其像素高、速度快、可直接导入到手机版OCR软件中。当然,对于未订装的多页文件,也可用扫描仪进行连续快速扫描。
对于网络文献,如果可以直接用手机满屏阅读的,推荐采用手机截屏,可直接导入手机版OCR软件;对于电脑上才能满屏阅读的,推荐采用QQ软件的截图功能,因其方便、不需要另外安装软件。
4图片传输到手机
对于手机拍照方式,此步忽略。
对于电脑截图,可利用QQ软件的“通过QQ发送到我的手机”功能,快速将图片传输到手机上。至于截图是否传输到手机,可登录手机QQ,在“我的电脑”模块查找。
5将图片导入OCR软件
启动OCR软件,依次点击“+”、“批量导入”,在手机图片库中选择所需图片后确定,图片库中的图片即可导入OCR软件。需要注意的是,手机图片库中的图片,每次最多只能选择9张。如需要导入较多图片,可进行多次导入。
每次图片导入OCR软件后,会建立一个文件夹予以识别,文件夹上行显示“新文件夹年-月-日”,
下行显示“年-月-日 时:分:秒”。
打开文件夹,可以看到导入的图片进行了重命名,显示格式与文件夹格式类似。
多次导入有两种模式,一种是回到主界面点击“批量导入”,软件会再新建一个文件夹放置新导入的图片;另一种是打开一个原来的文件夹,点击“批量导入”,这时软件会在这个原来的文件夹内放置新导入的图片。两种模式没有太大的区别,各位可以根据自己的爱好随意选择。
6识别
对于有冗余内容的图片,识别前最好进行适当裁剪,这里需要点击图片文件图标中除识别框以外的任何地方,然后点击下方的“编辑”按钮,进入编辑状态。图片编辑其实主要就是框选需要识别的内容,可以打开右上角的“智能框选”,这样软件能自动寻找框选内容,节约框选时间。框选完成后点击屏幕右下方的“√”按钮完成编辑。然后点击屏幕下方的“识别”按钮,稍候即可完成识别。
对于无冗余内容的图片,可直接点击“识别”按钮,稍候即可完成识别。
7文本传送
推荐采用QQ进行文本传送。
识别完成后,点击屏幕右上方的“分享”按钮,然后选择“发送到我的电脑”即可完成文本传送。
不必每传送一次就到电脑QQ上复制一次,你可以传送几篇甚至几十篇文档后,集中到QQ的“我的电脑”中,将这些文档一次性复制、粘贴到文字处理软件如WORD中。
8清除缓存
对于已无利用价值的文件,包括原始图片、识别后的文本等,最好及时清除。方法是回到首页,长按文件夹名,然后文件夹会自动选中。如果有多个文件夹,可以在右侧红色小方框内打勾,最后点击屏幕上方第二个图标(垃圾桶)即可。
9软件需要改进之处
一是在同一个文件夹中,第一次导入X个文件编号为“新文档1、2、……X”,第二次导入Y个文件编号为“新文档1、2、……Y”,导致一个文件夹内有多个“新文档1”、“新文档2”……尽管不影响使用和识别(因为有时间加以辅助识别),但总感觉怪怪的。
二是添加文件的“+”号位于屏幕右下方,在某些特殊情况下可能与文档的“识别”按钮几乎完全重叠(本人手机在文件夹刚好6个文件时会发生这个情况),影响操作。建议将添加按钮“+”移动到屏幕左下方。
PS:最后附上一段操作的视频文件,供参考。发布时发现视频不能直接上传,只能搞成压缩包了,辛苦大家看的时候下载解压缩后再看了。
该帖子作者被版主 生活所迫10积分, 2经验,加分理由:鼓励原创大赛作品
为您推荐
您可能想找: 工作站及软件 询底价
专属顾问快速对接
立即提交
轶辰
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
检测老菜鸟
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
wccd
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
猜你喜欢最新推荐热门推荐更多推荐
品牌合作伙伴