Oppdager substantiver i Python krever ferdighetene til en programmerer og en lingvist . Det engelske språket selv legger feller for de djerve lingvist med sin rike morfologisk tvetydighet . For eksempel kan ordet " kors " være et flertall substantiv eller en tredje person til stede - verb . Heldigvis har skaperne av Natural Language Toolkit Python -modul utviklet en del - av -tale taggeren som står for disse vanskelighetene og kan merke ord engelske setninger med sine respektive deler av talen , blant substantiver . Du trenger
2.4 Python , 2.5, eller 2.6
Natural Language Toolkit Python Modul
Vis flere instruksjoner
en
Last ned og installer Python -modul Natural Language verktøykasse fra ntlk.org prosjektets hjemmeside . Du må kanskje installere flere moduler for å støtte NLTK .
2
Åpne et terminal vindu og begynne et Python -økt ved å skrive Python på kommandolinjen . Når Python er oppe og går , påkalle NLTK modul med kommandoen import NLTK . Instruksjonene og kommandoer se slik ut på Mac OS X : en
My- MacBook -Pro : ~ pna1 $ python
Python 2.6.1 ( r261 : 67515 , 24 juni 2010 , 21:47 : 49 )
[ GCC 4.2.1 (Apple Inc. build 5646 ) ] på darwin
Type " hjelp" , " copyright" , "kreditt" eller " lisens " for mer informasjon.
>>> import nltk
>>>
3
Påkall ordklasse taggeren og skriv setningen i du vil oppdage substantiver ved å skrive inn følgende kommandoer og data på Python melding:
>>> text = nltk.word_tokenize ( «Mannen krysser gaten for å selge kors. ")
>>> nltk.pos_tag ( tekst)
4
Trykk på retur -tasten etter >>> nltk.pos_tag ( tekst)
[ ,"('The ', ' DT ') , (' mann ', ' NN ') , (' kors ', ' VBZ ') , (' den ', ' DT ') , (' gate ', ' NN ' ) , ( 'til' , 'TO ') , (' selge ', ' VB ') , (' kors ', ' NNS ') , (' . ', ' . ') ]
>> >
NLTK har korrekt merket hvert ord i setningen . Spesielt har det oppdaget substantiver og merket dem som enkeltstående substantiver med NN ( mann, gate ) og flertall substantiver med NNS ( kors ) og har riktig merket den første forekomsten av kors som et verb med merkelappen VBZ .