Den " jsoup " Java -biblioteket inneholder en funksjon som fjerner en Java streng av alle HTML- koder og konverterer innholdet til ren tekst. Dette biblioteket er nyttig når du ønsker å laste ned nettsider og nettstedet HTML og evaluere bare teksten i programmet. Innholdet er igjen , slik at du kan lagre innhold til en database eller lagre innholdet i en fil på den lokale serveren . Instruksjoner
en
Høyreklikk Java -filen du vil redigere, og velg " Åpne med . " Klikk Java applet redaktør i listen over programmer for å åpne koden .
2
Finn HTML strengen du vil analysere og skape ren tekst variabel. Følgende kode oppretter en variabel til å lagre de analyserte HTML-innhold : en
Document klartekst = null;
3
analysere HTML til ren tekst og lagre resultatet til " ; klartekst "variable . Følgende kode viser deg hvordan å analysere HTML-kodene :
klartekst = Jsoup.parse (html ) ;
Erstatt " html" med din egen HTML streng
.