Microsoft Word bruker en kombinasjon av algoritmer og NLP-teknikker (natural language processing) for å telle ordene du skriver. Slik fungerer det:
1. Tekstsegmentering :Word deler først dokumentet i mindre segmenter, for eksempel setninger, avsnitt og seksjoner.
2. Ordidentifikasjon :Den bruker NLP-teknikker for å identifisere ord innenfor disse segmentene. Ordgrenser bestemmes vanligvis av mellomrom, skilletegn og andre spesialtegn.
3. Ekskludering av spesialtegn :Word ekskluderer ulike spesialtegn som mellomrom, tegnsetting og linjeskift fra ordtellingen.
4. Telle ord :Word teller hver streng med tegn som gjenkjennes som et ord og øker den interne ordtelleren tilsvarende.
5. Håndtering av bindestrek :Ord med bindestrek regnes vanligvis som et enkelt ord, forutsatt at bindestreken ikke er på slutten av en linje.
6. Telle unike ord :Word teller hvert unike ord i dokumentet. Hvis et ord vises flere ganger, telles det bare én gang i ordtellingen.
7. Oppdater visning av ordtelling :Sanntidsordtellingen oppdateres og vises i statuslinjen nederst i Word-vinduet, slik at du kan spore fremgangen din mens du skriver.
Totalt sett tilbyr Microsoft Words ordtellingsmekanisme en rimelig nøyaktig måte å bestemme hvor mange ord du har skrevet inn i et dokument. Det er imidlertid verdt å merke seg at enkelte spesialtegn og formatering kan påvirke antallet i visse scenarier.