- Home
- /
- 02 – Kryptologie
- /
- 02.04 – Kryptanalyse
- /
- 02.04.03 – Friedman-Test
Eine weitere Methode, eine polyalphabetische
Verschlüsselung anzugreifen, wurde von Friedmann (US-Colonel, 1891-1969)
beschrieben. Sie erfordert eine hinreichend große Anzahl von
Geheimtextbuchstaben.
Mit dem Test wird auf Grundlage statistischer Methoden geprüft,
mit welcher Wahrscheinlichkeit zwei willkürlich herausgegriffene
Buchstaben gleich sind. Verglichen mit sprachtypischen
Wahrscheinlichkeiten lässt sich in etwa die Schlüsselwortlänge
ermitteln.
Ein deutschsprachiger Text hat einen Koinzidenz-Index von
0,0763. Ein mit einem zweibuchstabigen Schlüsselwort verschlüsselter
Text hat den Wert 0,057; bei einem vierbuchstabigen Schlüsselwort weist
der Koinzidenz-Index den Wert 0,048 auf. Je länger das Schlüsselwort,
desto mehr nähert sich der Wert der rein statistischen Verteilung mit
dem Wert 0,0385 an.
Dieser Wert, Koinzidenz-Index, wird nach einer mathematischen Ableitung- vereinfacht beschrieben – wie folgt berechnet:
Dazu ermittelt man das Vorkommen eines jeden Buchstabens ni des Alphabets im Geheimtext sowie die Gesamtzahl aller Buchstaben n im Geheimtext. Durch Einsetzen der Werte in die obige Gleichung erhält man den Index I.
Im Falle des Beispieltextes, welcher weiter oben schon im Kasiski-Test untersucht wurde, ergibt dies:
A |
204 |
N |
243 |
B |
115 |
O |
177 |
C |
310 |
P |
478 |
D |
219 |
Q |
193 |
E |
481 |
R |
291 |
F |
188 |
S |
222 |
G |
337 |
T |
323 |
H |
187 |
U |
187 |
I |
478 |
V |
401 |
J |
117 |
W |
228 |
K |
235 |
X |
154 |
L |
272 |
Y |
217 |
M |
398 |
Z |
200 |
Gesamt = 6855 |
Index= 0.044483
Dieser
Wert liegt erheblich unter 0,048, so dass von einem Schlüsselwort in
der Größe 5 ausgegangen werden kann. Wie der Kasiski-Test schon zeigte,
lautete das Wort „ALICE“ und ist fünfbuchstabig.
Sowohl die Berechnungen zu Kasiski als auch die oben aufgeführte
Berechnung nach Friedman läßt eine gewisse Unsicherheit zu; man muß
quasi raten, ob der Schlüssel 4-, 5- oder 6-stellig oder ein
ganzzahliges Vielfaches davon ist.
Friedman läßt aber auch eine andere Berechnung als den globalen
Koinzidenz-Faktor zu: sie berechnet den Autokoinzidenz-Index für jeden
Buchstaben des Geheimtextes durch zyklische Verschiebung des Textes
gegen sich selbst. Man erhält eine Vielzahl von Indizes, im Grunde
soviele wie Zeichen im Text, die man als Grafik darstellen kann..
Deutliche Abweichungen treten dabei als sich wiederholende Spitzen in
der Grafik auf. In unserem Beispiel stellt sich das wie folgt dar.
1 | 0,02990518 |
|
2 | 0,03705325 |
|
3 | 0,03778264 |
|
4 | 0,03646973 |
|
5 | 0,0643326 |
<— |
6 | 0,03792852 |
|
7 | 0,03763676 |
|
8 | 0,03574034 |
|
9 | 0,03603209 |
|
10 | 0,08285923 |
<— |
11 | 0,03559446 |
|
12 | 0,03719912 |
|
13 | 0,03311451 |
|
14 | 0,03836616 |
|
15 | 0,07877462 |
<— |
16 | 0,0353027 |
|
17 | 0,03997082 |
|
18 | 0,04040846 |
|
19 | 0,03661561 |
|
20 | 0,07687819 |
<— |
21 | 0,03574034 |
|
22 | 0,03690737 |
|
23 | 0,03997082 |
|
24 | 0,03705325 |
|
25 | 0,07221007 |
<— |
26 | 0,0345733 |
|
… | … |
|
Diese Darstellung ist nur wenig übersichtlich: sie soll ein erster Schritt für die Gesamtanalyse sein.
Betrachten wir die Kappawerte mal nicht für alle Buchstaben, sondern beschränken uns auf einige wenige:
An diesen Grafiken wird eindrucksvoll die Macht der Statistik dokumentiert. Musste man bei Kasiski oder Friedman für den globalen Autokoinzidenzwert noch ein wenig auf das Gefühl, den Bauch, achten, so zeigen diese Abbildungen durch die Lage der Spitzen die Länge von 5 als Schlüsselwort. Und dies über eine Periode von bis über 6000 Einzelwerten, ohne Abweichung.