你是不是也遇到过,想把网页上的文字保存下来,但复制起来很麻烦,或者网页禁止直接复制,这时候,你就需要知道如何提取网页中的文字了,其实方法有很多,而且都很简单,今天就来聊聊几种常用的办法。
先看最简单的复制粘贴
这当然是最直接的方法,用鼠标选中文字,然后按Ctrl+C复制,再粘贴到文档里,不过,有时候网页会设置限制,让你无法选中文字,这时候,就需要换个思路了,你可以试试查看网页源代码,在浏览器里,右键点击页面空白处,选择“查看页面源代码”,然后,在一大堆代码里,找到你需要的那段文字,虽然看起来有点复杂,但多试几次就熟悉了。
再看浏览器自带的工具
很多浏览器都有阅读模式,开启后,页面会变得很干净,只留下文字和主要图片,这时候,复制文字就方便多了,比如Edge和Safari,都有这个功能,另外,你也可以使用浏览器的“打印”功能,不过不是真打印,选择“打印”后,在目标打印机那里,选择“另存为PDF”,这样生成的PDF文件,里面的文字通常就可以直接复制了。
使用专业的提取工具
如果上面的方法都不行,那就得请出专业工具了,市面上有很多OCR软件,它们能识别图片里的文字,你可以把整个网页截图,然后用OCR工具识别,不过,这样可能有点慢,还有一些浏览器插件,专门用来解除网页的复制限制,安装后一键就能搞定,非常方便,当然,在线工具也不错,直接把网页链接丢进去,它就能帮你把文字提取出来。
注意格式和版权问题
提取出来的文字,格式可能会乱掉,你需要自己调整一下,比如分段和换行,更重要的是,要尊重版权,提取文字用于个人学习是可以的,但如果要商用或大量传播,最好先获得授权,避免不必要的麻烦。
提取网页文字并不难,从最简单的复制,到使用专业工具,总有一款适合你,关键是要根据实际情况,选择最方便的那种,下次再遇到想保存的文字,就不用发愁了。


