Tekstkompresjonsteknikken som erstatter ofte brukte ord med et enkelt tegn kalles
substitusjon .
Slik fungerer det:
1. Identifiser hyppige ord: Algoritmen analyserer teksten og identifiserer ord som vises hyppigst.
2. Tildel enkelt tegn: Hvert hyppige ord tildeles et unikt enkelt tegn (vanligvis ikke en del av det opprinnelige alfabetet).
3. Bytt ord: Originalteksten blir deretter skannet, og hvert hyppige ord erstattes med det tildelte enkelttegn.
4. Lagre kartleggingen: Kartleggingen av tegn til ord lagres separat, slik at den kan brukes til å dekomprimere teksten senere.
Eksempel:
La oss si at de hyppige ordene i en tekst er "The" og "og" "er" og "til."
* kartlegging:
* "" -> 'a'
* "og" -> 'B'
* "er" -> 'C'
* "til" -> 'd'
* Komprimert tekst: "Dette er en flott dag av det solfylte d gå utenfor."
Merk: Denne teknikken er enkel, men ofte ikke veldig effektiv for å komprimere store mengder tekst. Det kan være mer effektivt når det kombineres med andre teknikker som koding av løpelengder.