Excel-Vorlage Konfusionsmatrix zum Download

Excel-Vorlage Konfusionsmatrix zum Download
Excel-Vorlage Konfusionsmatrix zum Download

Eine Konfusionsmatrix ist ein nützliches Werkzeug, um die Leistung von Klassifikationsmodellen zu bewerten. Mit der zum Download-vorliegenden Excel-Vorlage kannst du die Konfusionsmatrix einfach erstellen und die wichtigsten Kennzahlen automatisch berechnen. In diesem Blogbeitrag erkläre ich dir, wie du die Vorlage verwendest und welche Informationen sie dir liefert, damit die KI-Modelle richtig bewerten kannst!

Die Konfusionsmatrix der Excel-Vorlage als Download

Du kannst die Vorlage der Konfusionsmatrix direkt hier und kostenlos herunterladen:

Im Weiteren findest du nun eine Beschreibung zum Aufbau und zur Interpretation. Grundsätzlich gilt: Solange du nur die gelb-hinterlegten Felder in der Vorlage befüllst, sollte schon einmal alles funktionieren.

Aufbau der Vorlage

Ansicht Vorlage Konfusionsmatrix
Ansicht Vorlage Konfusionsmatrix

Die Excel-Vorlage besteht aus einem Blatt, welches aus unterschiedlichen Bereichen besteht:

  • Titel
  • Übersicht als Erklärung
  • Input-Daten
  • Häufigkeitsverteilung
  • Ergebnisse

Diese Bereiche schauen wir uns im Folgenden etwas detaillierter an.

Titel

In der ersten Zeile kannst du erst einmal einen Titel für dein Projekt vergeben.

Übersicht

Hier findest du eine erste Übersicht einer Konfusionsmatrix, mit einer Erklärung, welches Feld für welche Daten steht. Du siehst die vier Felder auch im Folgenden noch einmal abgebildet:

KonfusionsmatrixTatsächlich: PositivTatsächlich: Negativ
Vorhergesagt: PositivTrue Positive (TP)False Positive (FP)
Vorhergesagt: NegativFalse Negative (FN)True Negative (TN)
Übersicht Konfusionsmatrix

Eingabe- bzw. Input-Daten

Anschließend folgt eine Tabelle mit den Input-Daten. Trage in die vier gelben Felder folgende Zahlen ein:

  • True Positive (TP): Hier trägst du die Anzahl der korrekt als positiv vorhergesagten Fälle ein.
  • False Positive (FP): Hier trägst du die Anzahl der tatsächlich negativen Fälle ein, die fälschlicherweise als positiv vorhergesagt wurden.
  • False Negative (FN): Hier trägst du die Anzahl der tatsächlich positiven Fälle ein, die fälschlicherweise als negativ vorhergesagt wurden.
  • True Negative (TN): Hier trägst du die Anzahl der korrekt als negativ vorhergesagten Fälle ein.

Verteilung der Anteile

Außerdem folgt danach eine Berechnung der Anteile. Sie stellt die Verteilung der Häufigkeiten der einzelnen Einwertungen in Prozent dar. Die Summe der Prozentzahlen ergibt immer 100%.

Berechnung der Kennzahlen & Ergebnis

Abschließend werden die wichtigsten Kennzahlen aus den Eingabewerten der Konfusionsmatrix automatisch berechnet. Daneben findest du auch jeweils die Formeln, die zur Berechnung herangezogen werden. Die Kennzahlen umfassen:

Genauigkeit (Accuracy)

Die Genauigkeit gibt an, wie oft das Modell richtig lag.

Genauigkeit = (TP + TN) / (TP + TN + FP + FN)

Präzision (Precision)

Die Präzision gibt an, wie viele der als positiv vorhergesagten Fälle tatsächlich positiv sind.

Präzision = TP / (TP + FP)

Sensitivität (Recall) oder Trefferquote

Die Sensitivität gibt an, wie gut das Modell die tatsächlichen positiven Fälle erkennt.

Sensitivität = TP / (TP + FN)

Spezifität (Specificity)

Die Spezifität gibt an, wie gut das Modell die tatsächlichen negativen Fälle erkennt.

Spezifität = TN / (TN + FP)

Negativ vorhergesagter Wert

Diese Kennzahl gibt an, wie viele der als negativ vorhergesagten Fälle tatsächlich negativ sind.

Negativ vorhergesagter Wert = TN / (TN + FN)

Falsch-positiv Rate

Die Falsch-positiv Rate zeigt, wie viele der tatsächlich negativen Fälle fälschlicherweise als positiv vorhergesagt wurden.

Falsch-positiv Rate = FP / (FP + TN)

Falsch-negative Rate

Die Falsch-negative Rate zeigt, wie viele der tatsächlich positiven Fälle fälschlicherweise als negativ vorhergesagt wurden.

Falsch-negative Rate = FN / (FN + TP)

False Discovery Rate

Die False Discovery Rate (FDR) zeigt, wie viele der als positiv vorhergesagten Fälle tatsächlich negativ sind.

False Discovery Rate = FP / (FP + TP)

F1-Score

Der F1-Score ist das harmonische Mittel von Präzision und Sensitivität. Er gibt eine Balance zwischen den beiden Kennzahlen.

F1-Score = 2 * Precision * Recall / (Precision+ Recall)

Bzw.

F1-Score = 2 * TP / (2 * TP + FP + FN)

Verwendung der Vorlage

Im Folgenden nun noch einmal als Überblick, wie du die Vorlage verwenden solltest:

  1. Daten eingeben: Trage die Werte für True Positive, False Negative, False Positive und True Negative in die entsprechenden Zellen im ersten Blatt ein.
  2. Kennzahlen berechnen: Wechsel zum zweiten Blatt, um die automatisch berechneten Kennzahlen zu sehen.
  3. Interpretation: Verwende die berechneten Kennzahlen, um die Leistung deines Modells zu bewerten.

Interpretation der Ergebnisse

Nun, da wir die Ergebnisse erzielt haben, müssen wir diese noch interpretieren. Dabei hilft dir die folgende Übersicht:

  • Hohe Genauigkeit: Das Modell liegt insgesamt häufig richtig.
  • Hohe Präzision: Wenn das Modell etwas als positiv vorhersagt, ist es sehr wahrscheinlich auch positiv.
  • Hohe Sensitivität: Das Modell erkennt die meisten positiven Fälle.
  • Hohe Spezifität: Das Modell erkennt die meisten negativen Fälle korrekt.
  • Negativ vorhergesagter Wert: Ein hoher Wert bedeutet, dass das Modell gut darin ist, negative Fälle korrekt zu identifizieren.
  • Falsch-positiv Rate: Ein niedriger Wert ist wünschenswert, da es bedeutet, dass das Modell nur wenige falsche positive Vorhersagen macht.
  • Falsch-negative Rate: Ein niedriger Wert ist ebenfalls wünschenswert, da es bedeutet, dass das Modell nur wenige falsche negative Vorhersagen macht.
  • False Discovery Rate: Ein niedriger Wert bedeutet, dass von den als positiv vorhergesagten Fällen nur wenige tatsächlich negativ sind.
  • Hoher F1-Score: Gute Balance zwischen Präzision und Sensitivität.

Fazit zu Excel-Vorlage Konfusionsmatrix zum Download

Die Excel-Vorlage zur Konfusionsmatrix ist ein praktisches Werkzeug, um die Leistung von Klassifikationsmodellen zu bewerten. Mit den automatisch berechneten Kennzahlen kannst du schnell und einfach feststellen, wie gut dein Modell arbeitet und wo es Verbesserungsbedarf gibt. Egal ob in der Medizin, bei der Spam-Erkennung, bei der Betrugserkennung oder bei der Datenextraktion aus Dokumenten – die Konfusionsmatrix ist ein unverzichtbares Werkzeug für jeden, der mit Daten arbeitet!

Klicke, um diesen Beitrag zu bewerten!
[Gesamt: 0 Durchschnitt: 0]

Bleibe immer up to date

Trag dich ein, um über weitere tolle Inhalte informiert zu werden!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*