可以试试用ABBYY FineReader这个OCR识别软件来转PDF哈~
现在最新版是ABBYY FineReader 12专业版,支持100+种语言,连C++代码都能识别!简直是神器在手,转换不愁!
下面我简单说下怎么用ABBYY把PDF转成可编辑的Word文档:
工具准备:
我用的是ABBYY FineReader 11专业版,操作差不多。
操作步骤:
1. 先打开你要转的PDF,看看里面有没有中英文混排、表格、图片这些内容。
2. 打开ABBYY,欢迎界面那里有个文档语言下拉菜单,点进去选更多语言,会弹出语言设置窗口。
3. 根据你的PDF内容勾选对应的语言,比如我这个PDF有中文和C++代码,那我就把中文和C++都打上勾,然后点确定。
4. 回到主界面,我们点中间那个文件(PDF/图片)转Microsoft Word选项。
5. 接下来会让你选PDF文件,打开的时候左下角有几个选项,默认都是勾着的,如果你不需要处理图像啥的,可以取消勾选,然后点打开。
6. ABBYY开始加载PDF,自动OCR识别。如果是厚文档,加载会有点慢,别急,等一会儿。
7. 自动识别难免有错,这时候可以手动修正。比如表格被识别成普通文字了,就用表格工具把表格区域框出来,右键点读取区域,重新识别表格。
8. 图片也一样,如果图片里的文字被误识别了,可以用图片工具框住图片区域,这样识别的时候就会把它当作图片处理。
9. 如果扫描件不太清晰或者有点歪,可以点编辑图像先做一下预处理,比如调对比度、旋转、纠偏等等,这样OCR准确率会高很多。调完记得点右上角退出图像编辑器。
10. 全部识别完后,点菜单栏文件→将文档另存为→选Microsoft Word文档。当然你也可以保存成其他格式。
11. 保存窗口里选好路径,想保存完自动打开Word的话,勾选保存后打开文档,不过如果你电脑配置一般,建议别勾,不然ABBYY+Word一起跑容易卡。
保存完基本就搞定了!
打开Word看看效果,基本中英文和图片都能识别出来,版面可能有点错位,部分地方有识别错误,不过手动改一下也没啥大问题,总比你一个字一个字敲强多了!
小贴士:
- OCR识别肯定会有错,转换完记得和原PDF对照一下,特别是关键内容。
- 设置语言的时候,尽量少选。比如只有中文,就只选中文,这样识别更快更准。
- ABBYY理论上可以转任何非加密PDF,但如果扫描件太模糊或者分辨率太低,也是识别不了的。
这软件真挺好用,推荐大家试试~
现在最新版是ABBYY FineReader 12专业版,支持100+种语言,连C++代码都能识别!简直是神器在手,转换不愁!
下面我简单说下怎么用ABBYY把PDF转成可编辑的Word文档:
工具准备:
我用的是ABBYY FineReader 11专业版,操作差不多。
操作步骤:
1. 先打开你要转的PDF,看看里面有没有中英文混排、表格、图片这些内容。
2. 打开ABBYY,欢迎界面那里有个文档语言下拉菜单,点进去选更多语言,会弹出语言设置窗口。
3. 根据你的PDF内容勾选对应的语言,比如我这个PDF有中文和C++代码,那我就把中文和C++都打上勾,然后点确定。
4. 回到主界面,我们点中间那个文件(PDF/图片)转Microsoft Word选项。
5. 接下来会让你选PDF文件,打开的时候左下角有几个选项,默认都是勾着的,如果你不需要处理图像啥的,可以取消勾选,然后点打开。
6. ABBYY开始加载PDF,自动OCR识别。如果是厚文档,加载会有点慢,别急,等一会儿。
7. 自动识别难免有错,这时候可以手动修正。比如表格被识别成普通文字了,就用表格工具把表格区域框出来,右键点读取区域,重新识别表格。
8. 图片也一样,如果图片里的文字被误识别了,可以用图片工具框住图片区域,这样识别的时候就会把它当作图片处理。
9. 如果扫描件不太清晰或者有点歪,可以点编辑图像先做一下预处理,比如调对比度、旋转、纠偏等等,这样OCR准确率会高很多。调完记得点右上角退出图像编辑器。
10. 全部识别完后,点菜单栏文件→将文档另存为→选Microsoft Word文档。当然你也可以保存成其他格式。
11. 保存窗口里选好路径,想保存完自动打开Word的话,勾选保存后打开文档,不过如果你电脑配置一般,建议别勾,不然ABBYY+Word一起跑容易卡。
保存完基本就搞定了!
打开Word看看效果,基本中英文和图片都能识别出来,版面可能有点错位,部分地方有识别错误,不过手动改一下也没啥大问题,总比你一个字一个字敲强多了!
小贴士:
- OCR识别肯定会有错,转换完记得和原PDF对照一下,特别是关键内容。
- 设置语言的时候,尽量少选。比如只有中文,就只选中文,这样识别更快更准。
- ABBYY理论上可以转任何非加密PDF,但如果扫描件太模糊或者分辨率太低,也是识别不了的。
这软件真挺好用,推荐大家试试~