Trencar una "xifra"

Com hem vist, a l'art d'escriure missatges xifrats, d'inventar algorismes i claus, se li diu criptografia. Al de trencar la xifra, descobrir què diuen els missatges sense saber ni els algorismes ni les claus, se li en diu criptoanàlisi. Cada vegada que s'ha inventat una xifra s'ha intentat descobrir una forma d'invalidar-la. El criptoanàlisi tracta de buscar els punts febles de cada mètode de xifrat. El nostre exemple del principi, que consistia en invertir l'ordre de les lletres, és un mètode feble, fàcil de descobrir.

El primer llibre de criptoanàlisi conegut és el Manuscrit sobre el desxiframent de missatges en clau, una obra del segle IX escrita pel filòsof àrab Abū Yūsuf Ya´qūb ibn Isḥāq al-Kindī.

Al Kindi Manuscrit
Al Kindi Primera pàgina del Manuscrit

La idea d'Al kindi va ser la següent:

A totes les llengües hi ha unes lletres que apareixen més sovint que altres

Per exemple, en català les lletres més freqüents, són les següents:

Freqüències altes  Freqüències mitjanes Freqüències baixes Freqüències molt baixes
E 13,89 O 5,71 V 1,40 H 0,72
A 12,55 U 4,18 Q 1,35 X 0,52
S 8,43 D 3,94 B 1,32 J 0,30
I 6,99 C 3,60 G 1,28 Y 0,18
R 6,76 M 3,16 Ç 1,06 Z 0,006
L 6,74 P 2,72 F 1,00 K 0,004
N 6,40         W 0,001
T 6,11            

Si en un text clar la lletra E o la lletra A seran les més freqüents, les lletres que les substitueixin en el text xifrat també seran les més abundants. Per tant, si comptem quantes vegades surt cada lletra en un missatge xifrat i mirem les que surten més vegades tindrem les primeres pistes importants.

Aquestes coincidències de freqüències seran més grans quan més llarg sigui el text o quan més missatges tinguem. Un missatge curt com aquest: "A la zebra de Zanzíbar li fan zum-zum les orelles perquè el xim de Xerta li xiuxiueja moixaines que li xoquen" té més zetes i ics de les normals.

 

Intenta desxifrar un missatge
Aquí tens un missatge codificat. Si prems el botó per demanar l'estadística de les lletres recordaràs quines són les més freqüents en la nostra llengua i quantes vegades surt cadascuna en el text.

 

Algunes idees més sobre criptoanàlisi

Segur que intentant desxifrar el missatge anterior has utilitzat algunes idees més.

Si cliques aquí podràs veure una petita llista i mirar quines has fet servir

El missatge anterior ha estat xifrat amb un mètode molt antic. Sabem per Suetònio que el va fer servir Juli Cèsar al segle I a.n.e i, tot i no ser molt difícil de desxifrar, es va fer servir durant molt de temps. Per exemple a la Guerra de Secessió Nordamericana del segle XIX.

És un mètode de xifrat monoalfabètic: l'alfabet normal es substitueix per un altre nou.

Tots els codis monoalfabètics es descodifiquen mirant les freqüències de cada lletra.

Juli César

Quan un criptoanalista intenta desxifrar un codi sense saber el mètode ni la clau es diu que ataca el codi. El primer atac sempre consisteix en l'anàlisi de freqüències.

Tens una eina informàtica d'anàlisi informàtic de freqüències