Crypté ? Cryptanalysez !

Pour venir à bout des pires chiffres de substitution, il fallait un niveau élevé de connaissances dans plusieurs disciplines telles que la linguistique, les statiques et les mathématiques. Or cette conjonction eut précisément lieu à partir du milieu du VIIème s. apr. J.C., quand la culture islamique commença à se répandre dans le monde arabe. Non seulement les savants s’appropriaient les avancées d’autres civilisations (Égypte, Babylone, Inde, Chine, etc.) pour mieux progresser, mais le développement de l’érudition religieuse — et en particulier de l’étude très poussée du Coran — leur permit d’acquérir une expérience inégalée en linguistique.

C’est donc dans ce terreau fertile qu’apparut, au IXème s., la cryptanalyse : la recherche des techniques permettant de déduire le texte clair d’un texte chiffré, sans connaître la clef. On doit le premier traité connu au savant arabe Al-Kindi, son Du Déchifrement des messages cryptographiques ayant été retrouvé en 1987 dans les archives ottomanes d’Istanbul.

Le principe repose sur la fréquence des lettres présentes dans le texte chiffré. En français, par exemple, les lettres les plus fréquentes sont, dans l’ordre, ESANTIRULO… (voir encadré ci-dessous). Dans un chiffre de substitution, chaque lettre est remplacée par une seule autre. Si bien que si les X sont majoritaires dans le texte chiffré, il y a de grandes chances qu’il corresponde au e dans le texte clair. De même que des G en grand nombre (mais inférieur au X) peuvent correspondre au a « en clair »… et ainsi de suite !

La recette d’Al-Kindi

Pour « cryptanalyser » un chiffre de substitution, le savant arabe Al-Kindi a découvert la marche à suivre :

  1. On détermine la fréquence de chaque lettre ou symbole dans le texte crypté, puis on les classe par ordre de fréquence décroissante. (Par ex.: X, G, O, B, R…)
  2. On compare la liste obtenue à la table des fréquences dans une langue donnée. (Par ex. en français l’incontournable esantirulo…)
  3. On remplace la n-ième lettre la plus fréquente dans le texte crypté par la n-ième lettre la plus fréquente dans la langue considérée. (Ici le français : Xe, Gs, Oa, etc.)
  4. On affine de manière à faire apparaître des mots, puis le texte complet intelligible. Cette 4e étape demande un peu d’astuce et d’intuition, mais on prend vite le pli. Par exemple, si on voit apparaître « al fiat beiu », on peut raisonnablement se dire que a et i doivent être inversées pour qu’on obtienne : « il fait beau ». Il suffit de vérifier si c’est compatible avec le reste du texte et, de « fal en iagualle », il se clarifie complètement ! En fait, plus le texte crypté est long, plus la fréquence de ses lettres sera proche de celle observée dans la langue.

Fréquence des lettres de la langue française

(en %)

e : 17,76 t : 7,30 l : 5,89 p : 3,24 g : 1,10 x : 0,54 k :
s : 8,23 i : 7,23 o : 5,34 m : 2,72 f : 1,06 y : 0,21 w :
a : 7,68 r : 6,81 d : 3,60 q : 1,34 b : 0,80 j : 0,19
n : 7,61 u : 6,05 c : 3,32 v : 1,27 h : 0,64 z : 0,07

Fréquence des bigrammes

(sur 10 000 mots)

es : 305 on : 164 qu : 134 is : 103 ra : 92 ta : 85 sa : 75
le : 246 er : 163 an : 130 la : 101 in : 90 ep : 82
en : 242 te : 163 ne : 124 ec : 100 ur : 88 nd : 80
de : 215 se : 155 em : 113 ti : 98 co : 87 ns : 79
re : 209 et : 143 it : 112 ce : 98 ar : 86 pa : 78
nt : 197 el : 141 me : 104 ed : 96 tr : 86 us : 76

Fréquence
des lettres doublées

(sur 10 000 mots)

ss : 73 pp : 16
ee : 66 ff : 10
ll : 66 cc : 8
tt : 29 aa : 3
nn : 24 uu : 3
mm : 20 ll : 2
rr : 17 gg : 1

Fréquence des
bigrammes de voyelles

(sur 10 000 mots)

ou : 118 ui : 68
ai : 117 au : 64
ie : 94 oi : 52
eu : 89 io : 49
ue : 85


Pages : 1 2 3 4 5 6 7 8 9

Tags: , , , , , , , , , , , , , , , , , , , ,

Cet article a été publié le Mardi 27 janvier 2009 à 0 h 21 min et est classé dans Cryptographie, Histoire, Histoire des Sciences. Vous pouvez suivre les commentaires sur cet article en vous abonnant au flux RSS 2.0 des commentaires. Les commentaires et les pings sont actuellement fermés.

Les commentaires sont fermés pour le moment.