从文本转换角度看,PDF格式的文件根据其生成的方式可以分为两类。
一类是通过扫描方式获得的图象形式的文件导入到PDF文件中的,通常这类PDF文件的尺寸较大,对于这类文件的转换难度较大,并且转换的准确性还取决于图象质量的好坏,因为转换这类文件实际上需要执行OCR识别操作。最简单的方法是使用OFFICE 2003。
1、打开要转换的PDF文件Microsoft Office Document Imaging writer
2、选择打印,选取打印机为:Microsoft Office Document Imaging writer;
3、打开生成的图象文件,打开方式使用Microsoft Office Document Imaging;
4、使用该软件内置的“将文件发送到WORD”功能将可以实现转换
但是,转换的结果需要认真检查,看看是否有误码。同时,表格、格式、字体、图象需要重新编辑。这是最简单的方法。
其它的方法就是使用OCR或PDF转换软件了。
另外,有的版本的PDF阅读器本身也带有OCR功能,你也可以试着看看。
另一类PDF文件就比较简单了。因为它本身就是由文本文件转换生成的,文件的尺寸也很小,因此,使用Adobe Acrobat 阅读器本身的文本工具选中所需转换的文字块,然后复制到WORD中就可以了。