用ABBYY FineReader这个OCR识别软件挺不错的。现在最新版是ABBYY FineReader 12专业版,支持100多种语言,连一些编程语言都能识别。有这么好用的工具,咱当然得把它用到位,下面我就简单说说怎么用ABBYY把PDF转成可编辑的文档。
工具准备:
ABBYY FineReader 11 专业版
操作步骤:
首先打开你要转换的PDF文件,看看里面有没有多种语言、表格或者图片这些内容。
然后运行ABBYY FineReader 11,在欢迎界面点文档语言的下拉菜单,选更多语言,弹出语言编辑器窗口,把你这个PDF里包含的语言都勾上。比如我这个文件里还有C++代码,那就在里面找到C++也打个勾,设置好了就点右下角的确定。
回到主界面后,因为我们是要把PDF转成Word文档,所以点击中间那个文件(PDF/图像)转Microsoft Word。
接着会弹出选择文件的窗口,挑你要转换的PDF,注意左下角有几个默认勾上的选项,如果不想要可以取消勾选,然后点打开。
ABBYY开始加载文件并自动进行OCR识别处理。如果你的PDF页数比较多,可能要等一会儿,耐心点哈。
自动识别有时候会有错别字或格式乱的情况,这时候就可以手动修正了。你可以根据需要选择不同的工具来调整,比如表格被识别成普通文字了,那就用表格工具选中表格区域,右键选择读取区域,重新识别成表格。
如果是带文字的图片被识别错了,可以用图片工具框出图片部分,这样在识别其他文字的时候这块就会保留为图片了。
还有一个编辑图像的按钮,是用来对扫描图片做预处理的。比如有些扫描页会有点歪、对比度差或者变形,这时候先调一下图像,能提高识别准确率。处理完记得点右上角的退出图像编辑器返回上一界面。
识别完成后,点菜单栏里的文件→将文档另存为→Microsoft Word 文档。如果你想保存成别的格式也可以选对应的选项,比如Excel啊、TXT啊啥的。
这软件挺好用的,关键是要根据文件内容设置好语言和识别区域,该自动的自动,该手动的就动手改一改,效果会更好。
如果还想更高效一点,可以把常用设置保存下来,下次直接调用,省时间。大家有啥问题也可以留言一起讨论~
工具准备:
ABBYY FineReader 11 专业版
操作步骤:
首先打开你要转换的PDF文件,看看里面有没有多种语言、表格或者图片这些内容。
然后运行ABBYY FineReader 11,在欢迎界面点文档语言的下拉菜单,选更多语言,弹出语言编辑器窗口,把你这个PDF里包含的语言都勾上。比如我这个文件里还有C++代码,那就在里面找到C++也打个勾,设置好了就点右下角的确定。
回到主界面后,因为我们是要把PDF转成Word文档,所以点击中间那个文件(PDF/图像)转Microsoft Word。
接着会弹出选择文件的窗口,挑你要转换的PDF,注意左下角有几个默认勾上的选项,如果不想要可以取消勾选,然后点打开。
ABBYY开始加载文件并自动进行OCR识别处理。如果你的PDF页数比较多,可能要等一会儿,耐心点哈。
自动识别有时候会有错别字或格式乱的情况,这时候就可以手动修正了。你可以根据需要选择不同的工具来调整,比如表格被识别成普通文字了,那就用表格工具选中表格区域,右键选择读取区域,重新识别成表格。
如果是带文字的图片被识别错了,可以用图片工具框出图片部分,这样在识别其他文字的时候这块就会保留为图片了。
还有一个编辑图像的按钮,是用来对扫描图片做预处理的。比如有些扫描页会有点歪、对比度差或者变形,这时候先调一下图像,能提高识别准确率。处理完记得点右上角的退出图像编辑器返回上一界面。
识别完成后,点菜单栏里的文件→将文档另存为→Microsoft Word 文档。如果你想保存成别的格式也可以选对应的选项,比如Excel啊、TXT啊啥的。
这软件挺好用的,关键是要根据文件内容设置好语言和识别区域,该自动的自动,该手动的就动手改一改,效果会更好。
如果还想更高效一点,可以把常用设置保存下来,下次直接调用,省时间。大家有啥问题也可以留言一起讨论~