Crypté ? Cryptanalysez !
Pour venir à bout des pires chiffres de substitution, il fallait un niveau élevé de connaissances dans plusieurs disciplines telles que la linguistique, les statiques et les mathématiques. Or cette conjonction eut précisément lieu à partir du milieu du VIIème s. apr. J.C., quand la culture islamique commença à se répandre dans le monde arabe. Non seulement les savants s’appropriaient les avancées d’autres civilisations (Égypte, Babylone, Inde, Chine, etc.) pour mieux progresser, mais le développement de l’érudition religieuse — et en particulier de l’étude très poussée du Coran — leur permit d’acquérir une expérience inégalée en linguistique.
C’est donc dans ce terreau fertile qu’apparut, au IXème s., la cryptanalyse : la recherche des techniques permettant de déduire le texte clair d’un texte chiffré, sans connaître la clef. On doit le premier traité connu au savant arabe Al-Kindi, son Du Déchifrement des messages cryptographiques ayant été retrouvé en 1987 dans les archives ottomanes d’Istanbul.
Le principe repose sur la fréquence des lettres présentes dans le texte chiffré. En français, par exemple, les lettres les plus fréquentes sont, dans l’ordre, ESANTIRULO… (voir encadré ci-dessous). Dans un chiffre de substitution, chaque lettre est remplacée par une seule autre. Si bien que si les X sont majoritaires dans le texte chiffré, il y a de grandes chances qu’il corresponde au e dans le texte clair. De même que des G en grand nombre (mais inférieur au X) peuvent correspondre au a « en clair »… et ainsi de suite !
La recette d’Al-Kindi
Pour « cryptanalyser » un chiffre de substitution, le savant arabe Al-Kindi a découvert la marche à suivre :
- On détermine la fréquence de chaque lettre ou symbole dans le texte crypté, puis on les classe par ordre de fréquence décroissante. (Par ex.: X, G, O, B, R…)
- On compare la liste obtenue à la table des fréquences dans une langue donnée. (Par ex. en français l’incontournable esantirulo…)
- On remplace la n-ième lettre la plus fréquente dans le texte crypté par la n-ième lettre la plus fréquente dans la langue considérée. (Ici le français : X → e, G → s, O → a, etc.)
- On affine de manière à faire apparaître des mots, puis le texte complet intelligible. Cette 4e étape demande un peu d’astuce et d’intuition, mais on prend vite le pli. Par exemple, si on voit apparaître « al fiat beiu », on peut raisonnablement se dire que a et i doivent être inversées pour qu’on obtienne : « il fait beau ». Il suffit de vérifier si c’est compatible avec le reste du texte et, de « fal en iagualle », il se clarifie complètement ! En fait, plus le texte crypté est long, plus la fréquence de ses lettres sera proche de celle observée dans la langue.
Fréquence des lettres de la langue française
(en %)
e : | 17,76 | t : | 7,30 | l : | 5,89 | p : | 3,24 | g : | 1,10 | x : | 0,54 | k : | — | ||||||
s : | 8,23 | i : | 7,23 | o : | 5,34 | m : | 2,72 | f : | 1,06 | y : | 0,21 | w : | — | ||||||
a : | 7,68 | r : | 6,81 | d : | 3,60 | q : | 1,34 | b : | 0,80 | j : | 0,19 | ||||||||
n : | 7,61 | u : | 6,05 | c : | 3,32 | v : | 1,27 | h : | 0,64 | z : | 0,07 |
Fréquence des bigrammes
(sur 10 000 mots)
es : | 305 | on : | 164 | qu : | 134 | is : | 103 | ra : | 92 | ta : | 85 | sa : | 75 | ||||||
le : | 246 | er : | 163 | an : | 130 | la : | 101 | in : | 90 | ep : | 82 | ||||||||
en : | 242 | te : | 163 | ne : | 124 | ec : | 100 | ur : | 88 | nd : | 80 | ||||||||
de : | 215 | se : | 155 | em : | 113 | ti : | 98 | co : | 87 | ns : | 79 | ||||||||
re : | 209 | et : | 143 | it : | 112 | ce : | 98 | ar : | 86 | pa : | 78 | ||||||||
nt : | 197 | el : | 141 | me : | 104 | ed : | 96 | tr : | 86 | us : | 76 |
Fréquence
des lettres doublées
(sur 10 000 mots)
ss : | 73 | pp : | 16 | |
ee : | 66 | ff : | 10 | |
ll : | 66 | cc : | 8 | |
tt : | 29 | aa : | 3 | |
nn : | 24 | uu : | 3 | |
mm : | 20 | ll : | 2 | |
rr : | 17 | gg : | 1 |
Fréquence des
bigrammes de voyelles
(sur 10 000 mots)
ou : | 118 | ui : | 68 | |
ai : | 117 | au : | 64 | |
ie : | 94 | oi : | 52 | |
eu : | 89 | io : | 49 | |
ue : | 85 |
Tags: Al-Kindi, Analyse de fréquences, Antoine et Bonaventure Rossignol, Blaise de Vigenère, Cabinets noirs, Charles Babbage, Chiffre de César, Clef de chiffrement, Codes secrets, cryptanalyse, Cryptographie, cryptologie, cryptologue, Étienne Bazeries, Marie Stuart, Masque de fer, Protocole, Simon Singh, Substitution, Thomas Phelippes, Transposition