02.04.03 – Friedman-Test

Eine weitere Methode, eine polyalphabetische Verschlüsselung anzugreifen, wurde von Friedmann (US-Colonel, 1891-1969) beschrieben. Sie erfordert eine hinreichend große Anzahl von Geheimtextbuchstaben.

Mit dem Test wird auf Grundlage statistischer Methoden geprüft, mit welcher Wahrscheinlichkeit zwei willkürlich herausgegriffene Buchstaben gleich sind. Verglichen mit sprachtypischen Wahrscheinlichkeiten lässt sich in etwa die Schlüsselwortlänge ermitteln.

Ein deutschsprachiger Text hat einen Koinzidenz-Index von 0,0763. Ein mit einem zweibuchstabigen Schlüsselwort verschlüsselter Text hat den Wert 0,057; bei einem vierbuchstabigen Schlüsselwort weist der Koinzidenz-Index den Wert 0,048 auf. Je länger das Schlüsselwort, desto mehr nähert sich der Wert der rein statistischen Verteilung mit dem Wert 0,0385 an.

Dieser Wert, Koinzidenz-Index, wird nach einer mathematischen Ableitung- vereinfacht beschrieben – wie folgt berechnet:

Friedman-Test Gleichung

Dazu ermittelt man das Vorkommen eines jeden Buchstabens ni des Alphabets im Geheimtext sowie die Gesamtzahl aller Buchstaben n im Geheimtext. Durch Einsetzen der Werte in die obige Gleichung erhält man den Index I.

Im Falle des Beispieltextes, welcher weiter oben schon im Kasiski-Test untersucht wurde, ergibt dies:

A

204

N

243

B

115

O

177

C

310

P

478

D

219

Q

193

E

481

R

291

F

188

S

222

G

337

T

323

H

187

U

187

I

478

V

401

J

117

W

228

K

235

X

154

L

272

Y

217

M

398

Z

200

Gesamt = 6855

Index= 0.044483

Dieser Wert liegt erheblich unter 0,048, so dass von einem Schlüsselwort in der Größe 5 ausgegangen werden kann. Wie der Kasiski-Test schon zeigte, lautete das Wort „ALICE“ und ist fünfbuchstabig.

Sowohl die Berechnungen zu Kasiski als auch die oben aufgeführte Berechnung nach Friedman läßt eine gewisse Unsicherheit zu; man muß quasi raten, ob der Schlüssel 4-, 5- oder 6-stellig oder ein ganzzahliges Vielfaches davon ist.

Friedman läßt aber auch eine andere Berechnung als den globalen Koinzidenz-Faktor zu: sie berechnet den Autokoinzidenz-Index für jeden Buchstaben des Geheimtextes durch zyklische Verschiebung des Textes gegen sich selbst. Man erhält eine Vielzahl von Indizes, im Grunde soviele wie Zeichen im Text, die man als Grafik darstellen kann.. Deutliche Abweichungen treten dabei als sich wiederholende Spitzen in der Grafik auf. In unserem Beispiel stellt sich das wie folgt dar.

1 0,02990518

 

2 0,03705325

 

3 0,03778264

 

4 0,03646973

 

5 0,0643326

<—

6 0,03792852

 

7 0,03763676

 

8 0,03574034

 

9 0,03603209

 

10 0,08285923

<—

11 0,03559446

 

12 0,03719912

 

13 0,03311451

 

14 0,03836616

 

15 0,07877462

<—

16 0,0353027

 

17 0,03997082

 

18 0,04040846

 

19 0,03661561

 

20 0,07687819

<—

21 0,03574034

 

22 0,03690737

 

23 0,03997082

 

24 0,03705325

 

25 0,07221007

<—

26 0,0345733

 

 

Verteilung komplette Daten

Diese Darstellung ist nur wenig übersichtlich: sie soll ein erster Schritt für die Gesamtanalyse sein.

Betrachten wir die Kappawerte mal nicht für alle Buchstaben, sondern beschränken uns auf einige wenige:

Verteilung Wert 0 bis 500
Verteilung Werte 5000 bis 5500

An diesen Grafiken wird eindrucksvoll die Macht der Statistik dokumentiert. Musste man bei Kasiski oder Friedman für den globalen Autokoinzidenzwert noch ein wenig auf das Gefühl, den Bauch, achten, so zeigen diese Abbildungen durch die Lage der Spitzen die Länge von 5 als Schlüsselwort. Und dies über eine Periode von bis über 6000 Einzelwerten, ohne Abweichung.