Html2Text是一个有趣的免费应用程序,可帮助我们进行转换, 一个简单的纯文本文档中网页的所有内容。
如果考虑到在特定网页中提出的信息,我们可能需要将其挽救到Word文档中,这可能会带来巨大的利润。 有一定的 技巧,以使用称为Html2Text的工具 否则,在此过程中将出现一系列奇怪的字符,无非就是一个简单的对话。
为什么不复制粘贴而不使用Html2Text
有人可能会认为此时提取网页信息内容的方法更简单,更正确。 “复制和粘贴”; 尽管这确实可以提供良好的结果,但是通过此任务,可以传输大量字符,这些字符是每个网页的html编码的一部分。 我们建议使用 Html2Text,以便您拥有完全干净的文本 并且无需使用此类字符,只需执行以下操作即可实现我们的目标:
- 打开该网站,然后转到您有兴趣提取其内容的文章。
- 现在,您只需要复制属于所述文章的整个URL。
- 右键单击在浏览器中打开的文章内容的任何部分。
- 在上下文菜单中,选择“另存为«
- 在硬盘驱动器上选择一个位置,然后输入所需的名称。
- 现在打开 html2文本 并导入到您先前复制的文件中。
- 选择按钮开始转换。
这就是我们要做的 html2文本好吧,在几秒钟内 我们将有一个同名但格式为TXT的文件, 它将包含所有信息,没有任何奇怪的字符。 您必须考虑到保存网页的格式必须考虑显示“整页”的选项,否则,带有重音符号的单词或其他单词将以不寻常的方式出现。
很好,先生。 您为我省去了很多“搜索”难题。 这正是它所承诺的,也是我一直在寻找的关键词。 非常感谢。