黄圣依 家暴 天涯:超星、PDF、CAJ文件转Word的方法

来源:百度文库 编辑:中财网 时间:2024/05/04 04:49:58
使用Microsoft Office Document Image Writer虚拟打印机
1、前提需要完全安装Office2003-Office工具-Microsoft Office Document Imaging!一般默认的office安装没有OCR识别文本功能!
完全安装方法:在添加删除程序里,选择office2003,点击更改,出现了office2003安装修改界面,选择-更改删除-下一步-高级选项-office工具里找到Microsoft Office Document Imaging选择从本机安装(默认的是“第一次使用时安装”)-一路下去就ok了。接下来就可以体验office的文字识别功能了。

2、以最麻烦的超星文件为例。(建议安装ssreader3.8版本,因为3.9版对虚拟打印有限制)
在3.8版本中使用虚拟打也需要一点前期工作,点击控制面板-打印机,列表中看到Microsoft Office Document Image Writer,重命名(避免一些writer等字眼,防止超星的禁止功能),命名数字即可,比如2。
打开下载的超星文件,由于超星对书目录和正文分别记录页数,所以,如果要全部转化,需要自己算一下页数(目录+正文最后页码既可)。然后选到开始打印的页面,选择:图书-打印-从当前页开始打印-打印页数(自己计算的页数)-确定-选择打印机中选择刚才改名的 2 打印机-打印,然后弹出对话框选择打印文件(.mdi)名字和存放路径。保存完毕后mdi文件会被Microsoft Office Document Imaging程序自动打开。

3、在Microsoft Office Document Imaging打开文件中选择:工具-使用OCR识别文本。注意,如果一次打印的超星页数较多,ocr识别会花较长时间。以我的为例(670页,机器赛扬D2.66G,512M内存,耗时20分钟左右;一般十几页也就几十秒)。等待OCR识别完毕,选择:工具-将文本发送到word-保存!大功告成!

其他:如果时pdf或caj文件,打开文件后直接选择:打印-打印页数。。。等等同2、3步骤,就是如此简单。

后话:可能有人会怀疑office文字识别的准确率,经PDF文件转换验证,比用PDF Converter等转word工具还要准确,而且不用注册,没有垃圾信息。再说了,微软,大品牌,值得信赖:)