Html2Text: Trucos para convertir una página web en un documento de texto plano

Html2Text

Html2Text es una interesante aplicación gratuita que nos ayudará a convertir, todo el contenido de una página web en un simple documento de texto plano.

Las utilidades pueden ser inmensas si tomamos en cuenta, que la información que ha sido propuesta en una página web específica, quizá la necesitemos rescatar hacia un documento de Word; existen determinados trucos para usar esta herramienta llamada Html2Text pues caso contrario, toda una serie de caracteres extraños llegarán a aparecer en éste proceso que no es más, que una simple conversación.

Porque no copiar y pegar en lugar de utilizar a Html2Text

Alguien podría llegar a pensar en este momento, que una vía más fácil y correcta para poder extraer el contenido de información de una página web se encuentra en el «copiar y pegar»; si bien es cierto que eso puede ofrecer buenos resultados, pero con dicha tarea se pueden llegar a transferir una gran cantidad de caracteres que forman parte de la codificación html de cada página web. Te recomendamos usar a Html2Text para que tengas a un texto completamente limpio y libre de este tipo de caracteres, debiendo únicamente hacer lo siguiente para lograr nuestro objetivo:

  • Abre la página web y dirígete hacia el artículo en el que estas interesado extraer su contenido.
  • Ahora sólo tienes que copiar toda la dirección URL que pertenece a dicho artículo.
  • Haz clic con el botón derecho del ratón en cualquier parte del contenido del artículo que has abierto en el navegador.
  • Del menú contextual elige la opción que dice «Guardar como«
  • Elige una ubicación del disco duro y escribe el nombre que tu desees.
  • Ahora abre Html2Text e importa al archivo que copies anteriormente.
  • Seleccionar al botón para que inicie la conversión.

Html2Text 02

Eso es todo lo que necesitamos hacer con Html2Text, pues en cuestión de segundos lograremos tener a un archivo con el mismo nombre pero en formato TXT, el cual contendrá toda la información sin ningún tipo de caracteres extraños. Debes tomar en cuenta, que el formato para guardar la página web tiene que contemplar a la opción que dice «página completa» pues caso contrario, palabras con tilde u otras más, aparecerán de forma inusual.


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.

  1.   JOB dijo

    Muy bueno sí señor. Me has evitado muchos quebraderos de cabeza de búsqueda «googlística». Es justo lo que promete y lo que buscaba con las palabras clave que he puesto. Muchas gracias.