programmeringsspråket Python bruker regulære uttrykk for mønstergjenkjenning . Programmerere ofte bruker regulære uttrykk for å søke tekst for mønstre av bokstaver, symboler og tall. Kraften av regulære uttrykk kommer fra det faktum at de ikke er vant til å søke etter noe spesifikt, som ordet "hund" , i stedet søker de etter ord som samsvarer med et bestemt mønster , for eksempel e- domenenavn. For eksempel kan du bruke Python til å erstatte de domenenavnene til en liste over e-postadresser som bruker regulære uttrykk. Du trenger
datamaskin med programmeringsspråket Python installert
Vis flere instruksjoner
en
Åpne IDLE tekst editor som kommer sammen med Python språk ved å klikke på ikonet . IDLE tekst editor ikonet ligger i Python mappe på listen over installerte programmer (under Alle programmer i Windows Start-menyen , og i Programmer-mappen i OSX ) . En tom kildekoden filen åpnes i hovedredaktør vindu
2
Inkluder ' re ' modulen ved å skrive denne linjen på toppen av kildekoden filen: .
Import re
3
Erklærer en streng og tildele noen e-postadresser til det, slik som dette : en
emailaddresses = ' William@amail.com , John@bmail.com , Bruce @ cmail.com '
4
Lag et regulært uttrykk som søker etter alle mulige tekst permutasjoner i gyldige e-postadresser . Regulære uttrykk arbeide ved å søke etter et mønster av tegn i en tekststreng . Mønsteret du er interessert i er noen to ord med seg et @ -symbolet . Siden e-postadresser har mange gyldige tegn , vil du matche alle mulige tegn i hvert ord før og etter @ -symbolet . Dette gjøres med det vanlige uttrykket [ \\ w \\ - . ] , Og ved å legge til et + til slutten av det, kan du gjenta dette for alle tegnene . Den ferdige regulært uttrykk kan lagres til en streng som dette : en
regexPattern = r ' ( [ . \\ W \\ - ] + ) @ ( [ . \\ W \\ - ] + ) '
5
Lag et regulært uttrykk som erstatter alle domenenavn med " zmail.com . " I dette regulært uttrykk , den backreference karakter sekvensen \\ 1 brukes til å erstatte domenet av e-postadressene . Den backreference henviser til et sted i et regulært uttrykk omringet i parentes . Ved å bruke det vanlige uttrykket til den første backreference , sparer du e-postadressen , men kast den gamle domenenavnet. Du kan deretter legge til et nytt domenenavn , som " @ zmail.com . ' For å lagre denne andre regulært uttrykk til en variabel , kan du skrive dette : en
regexReplacement = r '\\ 1@zmail.com '
6
Påfør regulære uttrykk til streng som inneholder e-postadressene som dette : en
emailaddresses = re.sub ( regexPattern , regexReplacement , emailaddresses )
7
Print ut e-postadressene ved hjelp av denne linjen med kode . Python 3 bruker denne syntaksen for utskrift : print ( emailaddresses ) , mens Python to bruker denne syntaksen : print emailaddresses
8
Kjør programmet ved å trykke på F5 -tasten . . Programmet produksjonen er : en
William@zmail.com , John@zmail.com , Bruce@zmail.com