启动汉王软件,导入PDF文件,系统提示拆分页面,确认后即可自动识别并完成页面拆分。


1、 启动汉王软件,导入PDF文件,确认拆分页面提示,系统将自动完成页面识别与分割。
2、 首先,打开需要处理的文档,进入第一页后按住键盘上的SHIFT键,接着用鼠标滑动至最后一页并点击,即可实现从首页到最后一页的连续选中,完成全部页面的选择操作。随后按下F8键,系统将自动启动识别程序,识别后的文本文件会默认保存在My documentsMy Hwdoc FilesHWPDFOCR80IMAGE目录中。由于识别过程是按单页进行的,每页会生成一个独立的TXT文件,因此需要将这些分散的文本文件合并为一个完整的文件。进入上述保存识别结果的文件夹,在其中新建一个文本文档,将其命名为合并.TXT。接着将该文件的扩展名由.TXT更改为.BAT,即变为合并.BAT。右键点击该批处理文件,选择编辑选项,在打开的编辑窗口中输入命令语句:copy *.txt 合并.txt或type *.txt >> 合并.txt,两种命令功能相同,任选其一即可。保存文件并关闭编辑器。双击运行该批处理文件,程序会自动将当前目录下所有扩展名为.txt的文本文件内容合并到合并.txt中,生成一个完整的汇总文本文件。注意:运行时只需双击一次,避免重复执行导致内容多次叠加。
