Html2Text:将网页转换为纯文本文档的技巧

html2文本

Html2Text是一个有趣的免费应用程序,可帮助我们进行转换, 一个简单的纯文本文档中网页的所有内容。

如果考虑到在特定网页中提出的信息,我们可能需要将其挽救到Word文档中,这可能会带来巨大的利润。 有一定的 技巧,以使用称为Html2Text的工具 否则,在此过程中将出现一系列奇怪的字符,无非就是一个简单的对话。

为什么不复制粘贴而不使用Html2Text

有人可能会认为此时提取网页信息内容的方法更简单,更正确。 “复制和粘贴”; 尽管这确实可以提供良好的结果,但是通过此任务,可以传输大量字符,这些字符是每个网页的html编码的一部分。 我们建议使用 Html2Text,以便您拥有完全干净的文本 并且无需使用此类字符,只需执行以下操作即可实现我们的目标:

  • 打开该网站,然后转到您有兴趣提取其内容的文章。
  • 现在,您只需要复制属于所述文章的整个URL。
  • 右键单击在浏览器中打开的文章内容的任何部分。
  • 在上下文菜单中,选择“另存为«
  • 在硬盘驱动器上选择一个位置,然后输入所需的名称。
  • 现在打开 html2文本 并导入到您先前复制的文件中。
  • 选择按钮开始转换。

HTML2Text 02

这就是我们要做的 html2文本好吧,在几秒钟内 我们将有一个同名但格式为TXT的文件, 它将包含所有信息,没有任何奇怪的字符。 您必须考虑到保存网页的格式必须考虑显示“整页”的选项,否则,带有重音符号的单词或其他单词将以不寻常的方式出现。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   JOB

    很好,先生。 您为我省去了很多“搜索”难题。 这正是它所承诺的,也是我一直在寻找的关键词。 非常感谢。