徐汇区政法委领导:【独门绝活】1分钟把书中的文字录入电脑

来源:百度文库 编辑:中财网 时间:2024/04/29 14:17:50

  独门绝活:1分钟把书中的文字录入电脑(一)

       在工作中,我常常在想,要是能把纸上有用的文字快速输入到电脑中,不用打字录入便可以大大提高工作效率该有多好呀!随着科技的发展, 这个问题在不断的解决,例如,现在市场上的扫描仪就带有OCR软件,可以把扫描的文字转换到电脑中进行编辑。但是,对于我们平常人来说,大多数人都是即不想多花钱购买不常用的设备,又不想费力气打字录入,那我就给大家提供一个我刚刚发现的方法吧!现在数码相机很普遍,也很常用,我们就从这里下手吧。

工具准备:

硬件:  电脑一台 数码相机   

软件:  word2003(其它的版本我没有实验)

               doPDF (百度可以搜索下载,是一款免费的PDF制作软件)

               AJViewer软件(在百度可以搜索下载,是一款免费的阅读器)

步骤:

1、在电脑中安装 doPDF和AJViewer

2、用数码相机把需要的文字拍下来(相机和照像水平就不多谈了。照片效果越好,可以大大缩小转换文字的误差率)

例如:


3、在word中插入你用数码相机照的书上的文字(打开word——插入菜单——图片——来自文件——选择照片——插入)

4、在word中选择文件菜单——打印——在打印机选项中选择doPDF——确定——点击“浏览”选项——选择文件保存的位置和填写文件名称——保存——确定

5、按照上面的步骤,电脑会自动打开AJViewer软件,若没有自动打开该软件,可以自己打开AJViewer软件,然后在AJViewer中打开刚刚转换的PDF文件。
6、选择AJViewer中的,然后在需要的文字部分拖动鼠标画出虚线。

7、点击发送到word按钮,就可以转换成word文件了。可以编辑了

第6、7步骤图片如下:




要点提示:

1、照片一定要平整,最好对比强烈。(最最关键的部分)

2、用doPDF生成PDF文件不只一种用法,你也可以选择其它更好、更便捷的方法,这里只提供我本此的实验软件。

3、如果熟练的使用我的方法,用不了一分钟就可以转出若干的文字,大大提高了工作效率。

4、切记:输出的文字一定要校对呀!

    希望大家支持原创,给我加油。

 

              独门绝活:用数码相机录入文字(二)  

  
  用数码相机实现文字录入,拍成照片传入电脑,再用识别软件转换成文本格式。

  每当老板扔给你一叠厚厚的文件,让你一个字一个字地敲入电脑,你是不是感觉快要崩溃了?有没有想过,数码相机可以成为你多快好省的“打字员”?

  如今,数码相机已经大量地走入寻常百姓家。对普通用户来说,利用数码相机来拍摄相片,这是天经地义的事情。可是用数码相机来录入文字,恐怕在大多数人眼中就有点天方夜谭了。下面,我们就来介绍一下这个独门绝活——用数码相机来录入文字的真“功夫”。

  拍摄

  用一台300万以上像素、3倍以上光学变焦的数码相机把原稿拍摄下来。拍摄的时候一定要注意:原稿要放平,相机要端平,光线要柔和均匀。可在走廊或窗口散射光线下,也可在三基色荧光护眼台灯下拍摄。

  拍摄清楚是后面正确识别的关键,300万以上像素能保证拍摄后供识别的文字足够大;3倍以上的光学变焦能在拍摄时让原稿的每行字充满画面。笔者曾比较过,300万像素拍摄的比用200万像素拍摄的识别率明显要高。

  不要用闪光灯,光照太强烈,拍摄下来的字迹反而不清楚。

  转换

  在电脑硬盘中建立一文件夹,把拍摄到的图片存入其中。但这些图片反差很小,整个画面很灰;而且各种数码相机的图片格式也不同,OCR软件(文字识别软件)不一定都能支持,所以宜先用ACDSee或Windows自带的“画图”程序进行转换。

  笔者是在Windows自带的“画图”程序中进行转换的。首先依次点击“画图→文件→打开”,在“查找范围”中找到需要的图片,打开后点击“另存为”,在“保存类型”里选择“单色位图”。

  点击“保存”后,会跳出提示语“保存成这种格式可能会造成颜色信息丢失,你还要继续吗”,继续点击“是”,就完成了转换。转换后得到的新图片沿用原名,扩展名改为“.bmp”,自动保存在原文件夹中。

  识别

  运行OCR软件(可以从网上下载,笔者使用的是清华TH-OCR2000千禧专业版),依次点击“文件→打开”,在“查找范围”中找到你的图片。点击“命令”出现下拉菜单,如果需要全文识别,即可点击“全部识别”,OCR软件即进行识别。软件窗口的上部是经过拍摄、转换后的原稿图片,下部是识别出来的文字。识别结束后自动建立沿用原名的txt文件,保存在原文件夹中。

  如果只需识别部分文字,可按住鼠标左键在需要识别的文字部位拉出方框,出现整块黄色后,点击“识别”即可。

  整理

  在一开始建立的文件夹中找出扩展名为txt的文本文件,这便是需要的资料,对识别错误的字进行修改,特别是原文中加着重号和下划线的文字,识别率还较低。同时在文件夹中,有许多扩展名为chr、trc、sim的文件,这些是OCR识别时产生的临时文件,可全部删除。