Oxfordin englanninkielinen ja espanjalainen sanakirja, tesaurus ja espanjasta englanniksi kääntäjä
Morse-koodin keksijä, Samuel Morse (1791-1872), tarvitsi tietää jotta hän voisi antaa yksinkertaisimmat koodit yleisimmin käytetyille kirjaimille. Hän teki sen yksinkertaisesti laskemalla kirjainsarjan tulostinsarjojen tyypissä. Hänen keksimänsä luvut olivat:
12 000 | E | 2500 | F |
9000 | T | 2000 | W, Y |
8000 | A, I , N, O, S | 1700 | G, P |
6400 | H | 1600 | B |
6200 | R | 1200 | V |
4400 | D | 800 | K |
4000 | L | 500 | Q |
3400 | U | 400 | J, X |
3000 | C, M | 200 | Z |
Tämä antaa englanninkielisen tekstin taajuuden, jota hallitsee suhteellisen pieni määrä yleisiä sanoja.Sanapeleissä se on usein englannin kirjainten taajuus ish sanasto sanojen taajuudesta riippumatta, mikä on kiinnostavampaa. Teimme analyysin kirjaimista, jotka esiintyvät Concise Oxford Dictionary -sivuston (11. painos tarkistettu, 2004) päämerkinnöissä luetelluissa sanoissa, ja esitimme seuraavan taulukon:
Kolmas sarake edustaa mittasuhteita vähiten yleinen kirjain (q) yhtä suuri kuin 1. Kirjain E on yli 56 kertaa yleisempi kuin Q yksittäisten englanninkielisten sanojen muodostamisessa.
Kirjainten taajuus sanojen alussa on jälleen erilainen. On enemmän englanninkielisiä sanoja, jotka alkavat kirjaimella ”s” kuin millään muulla kirjaimella. (Tämä johtuu pääasiassa siitä, että klusterit, kuten ”sc”, ”sh”, ”sp” ja ”st”, toimivat melkein kuin itsenäiset kirjaimet.) Kirjain ”e” tulee vasta suunnilleen puolivälissä järjestystä ja kirjain ”x” ei yllättäen viimeinen.