用PDF软件先把PDF文件转成图片,然后再用OCR软件识别。OCR全名叫Optical Character Recognition,说白了就是把图片上的字识别出来,变成可编辑的文字文件。TXT文件就是最基础的文本格式,不带格式、颜色这些信息。
OCR的作用就是把图片里的文字识别出来,保存成TXT这种可以修改的格式。因为图片上的字其实是像素点,没法直接改。用了OCR就能搞定,省得你一个字一个字地敲。比如你把报纸扫描成JPG图片,OCR就能帮你把上面的文字提取出来,存成TXT,超级方便。
准确率一般能到95%左右,具体还得看原图质量。常见OCR软件有尚书七号、清华紫光文通、ScanSoft、TextBridge、Presto这些。
我的回答都是自己电脑经验和网上整理的资料,不介意大家抄或者转发,但最好注明出处,我也算没白写这么多字,谢谢理解!
OCR的作用就是把图片里的文字识别出来,保存成TXT这种可以修改的格式。因为图片上的字其实是像素点,没法直接改。用了OCR就能搞定,省得你一个字一个字地敲。比如你把报纸扫描成JPG图片,OCR就能帮你把上面的文字提取出来,存成TXT,超级方便。
准确率一般能到95%左右,具体还得看原图质量。常见OCR软件有尚书七号、清华紫光文通、ScanSoft、TextBridge、Presto这些。
我的回答都是自己电脑经验和网上整理的资料,不介意大家抄或者转发,但最好注明出处,我也算没白写这么多字,谢谢理解!