Datamaskin
  | Hjem | Hardware | Nettverk | Programmering | Software | Feilsøking | Systems | 
Programmering  
  • C /C + + Programming
  • Computer Programmeringsspråk
  • Delphi Programming
  • Java Programming
  • JavaScript Programmering
  • PHP /MySQL programmering
  • Perl Programming
  • Python Programming
  • Ruby Programming
  • Visual Basics Programming
  •  
    Datamaskin >> Programmering >> Python Programming >> Content
    Hvordan Skrap & Parse Adresser
    Skraping og parsing er to nært beslektede nettstedet data -mining praksis. Jo mer generelt, parsing , refererer til bryte ned data i sine enkelte bestanddeler . Når ungdomsskole engelsklærer ba deg om å diagram setninger , var du parsing ordene til disse setningene for sine ordklasser . Skraping mer spesifikt refererer til web-sider analyseringen for bestemte typer data , i dette tilfellet , adresser. Programmeringsspråket Python og " BeautifulSoup " forlengelse tillate brukeren å skrape og analysere nettsteder i noen få linjer med kode. Du trenger
    Python 2.6 eller høyere
    BeautifulSoup 3.2
    Vis flere instruksjoner
    en

    Installer BeautifulSoup ved å laste ned den nyeste versjonen fra simpelt ut programvare og untar /unzip filen. Åpne et terminal vindu og skriv inn følgende kommando: My- iMac: ~ meg $ python Downloads/BeautifulSoup-3.2.0/python setup.py install
    p Dette forteller Python tolk for å kjøre BeautifulSoup install script som kan finnes i BeautfulSoup mappen som ligger i Nedlastinger- mappen
    2

    Type Python ved ledeteksten , trykker Enter og import BeautifulSoup : . My- iMac: ~ meg $ python >>> import BeautifulSoup
    3

    Kjør følgende skript for å åpne en nettside og skrive ut alle Universal Resource Locator ( web-adresser ) du kan finne i en side : >>> import urllib2 >> ; > page = urllib2.urlopen ( " http://www.THE URL DU ØNSKER å skrape HER ") >>> suppe = BeautifulSoup (side ) >>> soup.findAll ( 'a ') >>> print soup.strip ( ) >>> printThis skriptet vil åpne en web side , analysere html , søker du etter tag der Web- adresser er innebygd, fjerne kodene og la teksten .

    früher :

     Weiter:
      Relatert Artike
    ·Hvordan Synkroniser Køer Via XML - RPC i Python 
    ·Hvordan lese en CSV Column & Konverter til Python 
    ·Hvordan bruke lokale variabler i Python Scripts 
    ·Hvordan bruke Tk Toolkit Med Python 
    ·Hvordan Design Accounting Software 
    ·Hvordan skrive en e-post Miner for Python 
    ·Hvordan skrive kode for CPU programmering 
    ·Hva er Python Hacking 
    ·Hvordan Split en streng i en liste i Python 
    ·Hvordan få Lengde av en fil på Python 
      Anbefalte artikler
    ·VBA-makroer Trening 
    ·Hvordan slette linjer fra tekstfil i PowerShell 
    ·Slik fjerner duplikater fra Array Perl 
    ·Hvordan skrive en DOS Script 
    ·Hvordan laste ned en Bitmap fil i Android SDK 
    ·DIY stepper stasjoner 
    ·PHP SPL Typer 
    ·Slik utfører du en Bruker Acceptance Test ( UAT ) 
    ·Hvordan få objektegenskap navn i en matrise i PHP 
    ·Hvordan overstyre en statisk metode i Java 
    Copyright ©  Datamaskin  http://www.datamaskin.biz/