? En edderkopp er et program som logger koblinger mellom websider. Edderkopper kan skrives i alle programmeringsspråk , inkludert PHP. Du kan få en edderkopp program skrevet i PHP enten ved å laste ned en, eller skrive en. En rekke av edderkopp funksjon biblioteker er tilgjengelige for PHP. PHP
PHP er et programmeringsspråk skrevet for å lage dynamiske websider . En dynamisk nettside er en hvis innhold endres i henhold til brukerens handlinger eller ringe parametere. Websider er skrevet i Hypertext Markup Language , eller HTML. HTML er en formatering system, men ikke et programmeringsspråk. Nettsidene er lagret og levert i sin opprinnelige tilstand. Denne formen for filen kalles en statisk webside . Web- sider laget av PHP ta form av en HTML- mal med programmeringskode satt inn i kroppen av dokumentet . Når programmet heter , er de blokkprogrammering henrettet , og erstatte seg selv med HTML.
Spider
En edderkopp er også kalt en Web Crawler eller en Web Bot. Formålet med denne kategorien av programmet er å dokumentere Web- sider på World Wide Web . Programmet trenger en webside som utgangspunkt . Som kalles en «ætt». Det følger da en link på denne siden, til en annen side og deretter følger en link på denne siden, til en annen side og så videre . Edderkoppen kan skrives å logge informasjon om hver side det besøk , eller bare merk sin eksistens . Søkemotor edderkopper kopiere hver side støtt inn i søkemotorens database der andre programmer utføre videre analyse. Selv om mange edderkopp implementeringer har en rekke oppgaver , er det lov å gå over fra en side til en annen oppgave som definerer programmet som en edderkopp.
Programmering Spiders
Selv om en edderkopp kan skrives på alle språk , Java , Perl og C # er de mest populære språkene for disse programmene . Dette er hovedsakelig fordi programmerere som spesialiserer seg på Web -programmering er kjent med disse språk. Python og PHP brukes også , igjen , fordi disse språk har basseng En ferdigheter følge av de Web- samfunnet.
Method
PHP er vanligvis brukes til å generere websider som blir deretter presentert for ber om nettlesere. Nettlesere har den aktive rollen som søker et nettsted og ber om en side fra webserveren . PHP rolle er vanligvis statisk . En PHP program som opererer som en edderkopp har å etterligne nettlesere ved å be om websider fra webservere . Websider transporteres med Hypertext Transfer Protocol . Dette laster ikke ned en fil som inneholder siden, men kopierer ut koden for siden og bærer det i kroppen av meldingen svarer på en forespørsel for en side. PHP edderkoppen har å lese i innholdet i meldingen. Det lagrer ikke på siden , men skanner innkommende tekst for web- linker . Koblingen kan være i alle formater, fordi HTML butikker koblinger med en kode som " " slik at programmet bare har å se etter disse symbolene og kopiere ut teksten , der " .. . "vises i dette eksemplet. Søke gjennom tekst og stripping ut bestemte deler kalles " parsing " i programmering språkbruk .