Oxfordský anglický a španělský slovník, tezaurus a překladatel ze španělštiny do angličtiny
Vynálezce Morseovy abecedy, Samuel Morse (1791-1872), potřeboval vědět to proto, aby mohl dát nejjednodušší kódy nejčastěji používaným písmenům. Udělal to jednoduše spočítáním počtu písmen v sadách tiskáren typu. Čísla, ke kterým přišel, byly:
12 000 | E | 2500 | F |
9 000 | T | 2 000 | W, Y |
8 000 | A, I , N, O, S | 1700 | G, P |
6400 | H | 1600 | B |
6200 | R | 1200 | V |
4400 | D | 800 | K |
4 000 | L | 500 | Q |
3 400 | U | 400 | J, X |
3 000 | C, M | 200 | Z |
Nicméně udává četnost písmen v anglickém textu, kterému dominuje relativně malý počet běžných slov. U slovních her je to často četnost písmen v angličtině ish slovník bez ohledu na frekvenci slov, která je zajímavější. Provedli jsme analýzu písmen vyskytujících se ve slovech uvedených v hlavních položkách Stručného Oxfordského slovníku (11. vydání revidováno, 2004) a přišli jsme s následující tabulkou:
Třetí sloupec představuje proporce, přičemž nejmenší běžné písmeno (q) rovné 1. Písmeno E je při tvorbě jednotlivých anglických slov více než 56krát častější než Q.
Frekvence písmen na začátku slov je opět jiná. Existuje více anglických slov začínajících na písmeno „s“ než na jakékoli jiné písmeno. (Je to hlavně proto, že shluky jako „sc“, „sh“, „sp“ a „st“ fungují téměř jako samostatná písmena.) Písmeno „e“ pochází pouze z poloviny pořadí a písmeno „x“ nepřekvapivě přijde poslední.