Html2Text: Trucs per convertir una pàgina web en un document de text pla

Html2Text

Html2Text és una interessant aplicació gratuïta que ens ajudarà a convertir, tot el contingut d'una pàgina web en un simple document de text pla.

Les utilitats poden ser immenses si tenim en compte, que la informació que ha estat proposada en una pàgina web específica, potser la necessitem rescatar cap a un document de Word; existeixen determinats trucs per emprar aquesta eina anomenada Html2Text doncs cas contrari, tot un seguit de caràcters estranys arribaran a aparèixer en aquest procés que no és més, que una simple conversa.

Perquè no copiar i enganxar en lloc d'utilitzar a Html2Text

Algú podria arribar a pensar en aquest moment, que una via més fàcil i correcta per poder extreure el contingut d'informació d'una pàgina web es troba en el «Copiar i enganxar»; si bé és cert que això pot oferir bons resultats, però amb aquesta tasca es poden arribar a transferir una gran quantitat de caràcters que formen part de la codificació html de cada pàgina web. Et recomanem fer servir a Html2Text perquè tinguis a un text completament net i lliure d'aquest tipus de caràcters, havent únicament fer el següent per assolir el nostre objectiu:

  • Obre la pàgina web i aneu en direcció a l'article en què estàs interessat damunt la taula.
  • Ara només has de copiar tota l'adreça URL que pertany a aquest article.
  • Fes clic amb el botó dret de ratolí en qualsevol part de l'contingut de l'article que has obert al navegador.
  • De el menú de context tria l'opció que diu «desa«
  • Tria una ubicació del disc dur i escriu el nom que tu vulguis.
  • Ara obre Html2Text i importa a l'arxiu que copiïs anteriorment.
  • Seleccionar el botó perquè iniciï la conversió.

Html2Text 02

Això és tot el que necessitem fer amb Html2Text, Ja que en qüestió de segons aconseguirem tenir a un arxiu amb el mateix nom però en format TXT, el qual contindrà tota la informació sense cap tipus de caràcters estranys. Has de tenir en compte, que el format per desar la pàgina web ha de contemplar l'opció que diu «pàgina completa» doncs cas contrari, paraules amb accent o altres més, apareixeran de forma inusual.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   JOB va dir

    Molt bo sí senyor. M'has evitat molts mals de cap de recerca «googlística». És just el que promet i el que buscava amb les paraules clau que he posat. Moltes gràcies.