V počítači sú všetky informácie uložené ako nuly a jednotky. Na uloženie textovej informácie teda potrebujeme kódovanie, ktoré text prevedie na nuly a jednotky. V 60. rokoch 20. storočia za týmto účelom vznikla ASCII tabuľka, ktorá znakom priraďovala čísla od 0 do 255 a tieto čísla sa následne zapísali v binárnej sústave do jedného bytu.
ASCII kódovanie však umožňovalo kódovať iba písmená anglickej abecedy a niektoré ďalšie základné znaky. Preto bol neskôr vyvinutý štandard Unicode, ktorý umožňuje zápis nielen základných písmen, ale aj iných svetových abecied a mnohých ďalších symbolov (napr. snehuliaka: ☃). Aké ďalšie znaky sa v Unicode nachádzajú, si môžete pozrieť tu. Kým Unicode priraďuje znakom čísla, rôzne kódovania (napr. UTF-8) určujú, ako tieto čísla previesť na jednotky a nuly, ktoré sa uložia v počítači. Napr. Unicode kóduje snehuliaka ako číslo 2603 v šestnástkovej sústave. UTF-8 toto číslo zakóduje do troch bytov s hodnotami 11100010, 10011000 a 10000011.