Abeceda

Zdroj je reprezentovaný zdrojovou abecedou S.
kde ; , sú symboly zdrojovej abecedy. Ďalej existuje kódová abeceda A.
kde ; , sú symboly kódovej abecedy, teda symboly, ktoré sú výstupom kompresného algoritmu. V najjednoduchšom prípade sú tieto dve abecedy zhodné. Kódovanie je potom vlastne proces priradenia kódového slova zdrojovému symbolu.
Pri vytváraní tabuľky, ktorá určuje toto priradenie, aby bol proces čo najefektívnejší, nám pomáha aspoň približná znalosť frekvenčného výskytu jednotlivých znakov (distribučná funkcia). Samozrejme musí platiť . V ďalšom texte budeme značiť skráteným zápisom .

V 19. storočí vznikol asi najznámejší takýto kód. Vytvoril ho F. B. Morse pre telegrafiu priradením kratších kódových reťazcov častejšie sa vyskytujúcim písmenám (znakom) a dlhšie písmenám s menšou pravdepodobnosťou výskytu. Morseova abeceda mapuje 26 znakov anglickej abecedy do štvorprvkovej abecedy (dot, dash, mark, space).