中信银行卡注销流程:将图片中的文字提取出来、将PDF文件转换成word文档以及将图片中的网址和文字去掉的方法

来源:百度文库 编辑:中财网 时间:2024/04/28 07:21:51
将图片中的文字提取出来、将PDF文件转换成word文档以及将图片中的网址和文字去掉的方法     最近这段时间,由于要编写一文档,我搜集了相关的内容。需要用到的内容在pdf文档中,因此,寻找出将pdf文件转换成word的文档或者是将pdf中的文字、图片提取出来是关键。在此,我将所用到的转换软件以及相关的要点写下来,方便有此需要的各位查阅。

        将pdf转换成word文档中,我分别试用了两个软件进行转换:(1)Adobe Acrobat 7.0 Professional(2)PDF2Word (pdf输出word)绿色汉化版 V3.0。Adobe Acrobat 7.0 用法为,用Acrobat 7.0打开pdf文件,然后打开“文件”菜单点击“另存为”然后将保存类型改为Microsoft word文档,即可将pdf转换为word文档,不过此种方法比PDF2Word 3.0的转换效果差,我试验了转换几篇pdf文档,PDF2Word 3.0的转换效果要比Acrobat 7.0好,因此建议用PDF2Word 3.0来进行转换。PDF2Word 3.0下载可点击其超链接进行下载。

        将pdf转换成word文档容易,但有种情况,将pdf文件转换成word文档后,在word文档种,里边的文字不能编辑,文字都是由一张张图片组成的,碰到这种情况,难道我们只能一个一个的看着图片将文字录入文档中再编辑吗?我找了几个软件来将图片中的文字,提取出来保存到word文档中,易于我们进行编辑、排版等操作。其中我试用感觉 用Office 2003提取图片中的文字,准确度较高。方法如下:

(1) 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行。

(2) 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。

(3)打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。
“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。

打开刚才保存的MDI类型文件,根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑这段文字了。
或者 打开MDI文档,选择“工具”菜单,选中“将文本发送到word”,然后一直按确定就可以了。完成了将图片中的文字作为文本发送到word中后,我们就可以在word中对该文档进行编辑、排版等操作了。

        将图片中的文字提取出来,我试用了其他OCR文字识别软件以及用上面这种方法来操作,提取出的文字都有些错别字或者是出现其他字符等。相对来说对于,用“Microsoft Office Document Imaging”组件来提取的方法,提取出的文字正确率较高。

  将图片中的网址和文字去掉的方法

可以用图象处理软件,比如PS,最好不要使用橡皮工具,会把想要的的背景色也给涂掉的,

建议使用图章工具,慢工出细活,只能一点一点地修改了。

       若其他朋友有更好的方法,请给予告知,大家相互学习,共同进步。