Typen komprimering som erstatter spesialtegn for å gjenta mønstre kalles
run-lengde koding (RLE) .
Slik fungerer det:
* Identifiser gjentatte sekvenser: RLE skanner dataene som leter etter påfølgende forekomster av samme karakter (eller mønster).
* Bytt ut med en kode: Den gjentatte sekvensen erstattes deretter med en kode som inneholder:
* Karakteren i seg selv.
* Antall ganger det gjentas.
Eksempel:
Originaltekst:"AAABBBCCCDDDE"
RLE kodet tekst:"3a3b4c3d1e"
Fordeler med RLE:
* Enkelt å implementere.
* Effektiv for data med mange gjentatte mønstre, som bilder, faksoverføringer eller tekstfiler.
Ulemper ved RLE:
* Ikke veldig effektiv for data med få repetisjoner.
* Kan faktisk øke størrelsen på data med mye tilfeldighet.
Andre kompresjonsteknikker du kan være interessert i:
* Huffman -koding: Bruker koder med variabel lengde basert på hyppigheten av tegn.
* Lempel-Ziv (LZ) algoritmer: Finner gjentatte mønstre og erstatter dem med kortere koder, vanligvis ved hjelp av en ordbok.
* aritmetisk koding: Representerer data som en enkelt brøkdel, ved å bruke sannsynligheter for å oppnå høyere kompresjonsforhold.