Excel-Vorlage Konfusionsmatrix zum Download
Eine Konfusionsmatrix ist ein nützliches Werkzeug, um die Leistung von Klassifikationsmodellen zu bewerten. Mit der zum Download-vorliegenden Excel-Vorlage kannst du die Konfusionsmatrix einfach erstellen und die wichtigsten Kennzahlen automatisch berechnen. In diesem Blogbeitrag erkläre ich dir, wie du die Vorlage verwendest und welche Informationen sie dir liefert, damit die KI-Modelle richtig bewerten kannst!
Die Konfusionsmatrix der Excel-Vorlage als Download
Du kannst die Vorlage der Konfusionsmatrix direkt hier und kostenlos herunterladen:
Im Weiteren findest du nun eine Beschreibung zum Aufbau und zur Interpretation. Grundsätzlich gilt: Solange du nur die gelb-hinterlegten Felder in der Vorlage befüllst, sollte schon einmal alles funktionieren.Aufbau der Vorlage
Die Excel-Vorlage besteht aus einem Blatt, welches aus unterschiedlichen Bereichen besteht:
- Titel
- Übersicht als Erklärung
- Input-Daten
- Häufigkeitsverteilung
- Ergebnisse
Diese Bereiche schauen wir uns im Folgenden etwas detaillierter an.
Titel
In der ersten Zeile kannst du erst einmal einen Titel für dein Projekt vergeben.
Übersicht
Hier findest du eine erste Übersicht einer Konfusionsmatrix, mit einer Erklärung, welches Feld für welche Daten steht. Du siehst die vier Felder auch im Folgenden noch einmal abgebildet:
Konfusionsmatrix | Tatsächlich: Positiv | Tatsächlich: Negativ |
---|---|---|
Vorhergesagt: Positiv | True Positive (TP) | False Positive (FP) |
Vorhergesagt: Negativ | False Negative (FN) | True Negative (TN) |
Eingabe- bzw. Input-Daten
Anschließend folgt eine Tabelle mit den Input-Daten. Trage in die vier gelben Felder folgende Zahlen ein:
- True Positive (TP): Hier trägst du die Anzahl der korrekt als positiv vorhergesagten Fälle ein.
- False Positive (FP): Hier trägst du die Anzahl der tatsächlich negativen Fälle ein, die fälschlicherweise als positiv vorhergesagt wurden.
- False Negative (FN): Hier trägst du die Anzahl der tatsächlich positiven Fälle ein, die fälschlicherweise als negativ vorhergesagt wurden.
- True Negative (TN): Hier trägst du die Anzahl der korrekt als negativ vorhergesagten Fälle ein.
Verteilung der Anteile
Außerdem folgt danach eine Berechnung der Anteile. Sie stellt die Verteilung der Häufigkeiten der einzelnen Einwertungen in Prozent dar. Die Summe der Prozentzahlen ergibt immer 100%.
Berechnung der Kennzahlen & Ergebnis
Abschließend werden die wichtigsten Kennzahlen aus den Eingabewerten der Konfusionsmatrix automatisch berechnet. Daneben findest du auch jeweils die Formeln, die zur Berechnung herangezogen werden. Die Kennzahlen umfassen:
Genauigkeit (Accuracy)
Die Genauigkeit gibt an, wie oft das Modell richtig lag.
Genauigkeit = (TP + TN) / (TP + TN + FP + FN)
Präzision (Precision)
Die Präzision gibt an, wie viele der als positiv vorhergesagten Fälle tatsächlich positiv sind.
Präzision = TP / (TP + FP)
Sensitivität (Recall) oder Trefferquote
Die Sensitivität gibt an, wie gut das Modell die tatsächlichen positiven Fälle erkennt.
Sensitivität = TP / (TP + FN)
Spezifität (Specificity)
Die Spezifität gibt an, wie gut das Modell die tatsächlichen negativen Fälle erkennt.
Spezifität = TN / (TN + FP)
Negativ vorhergesagter Wert
Diese Kennzahl gibt an, wie viele der als negativ vorhergesagten Fälle tatsächlich negativ sind.
Negativ vorhergesagter Wert = TN / (TN + FN)
Falsch-positiv Rate
Die Falsch-positiv Rate zeigt, wie viele der tatsächlich negativen Fälle fälschlicherweise als positiv vorhergesagt wurden.
Falsch-positiv Rate = FP / (FP + TN)
Falsch-negative Rate
Die Falsch-negative Rate zeigt, wie viele der tatsächlich positiven Fälle fälschlicherweise als negativ vorhergesagt wurden.
Falsch-negative Rate = FN / (FN + TP)
False Discovery Rate
Die False Discovery Rate (FDR) zeigt, wie viele der als positiv vorhergesagten Fälle tatsächlich negativ sind.
False Discovery Rate = FP / (FP + TP)
F1-Score
Der F1-Score ist das harmonische Mittel von Präzision und Sensitivität. Er gibt eine Balance zwischen den beiden Kennzahlen.
F1-Score = 2 * Precision * Recall / (Precision+ Recall)
Bzw.
F1-Score = 2 * TP / (2 * TP + FP + FN)
Verwendung der Vorlage
Im Folgenden nun noch einmal als Überblick, wie du die Vorlage verwenden solltest:
- Daten eingeben: Trage die Werte für True Positive, False Negative, False Positive und True Negative in die entsprechenden Zellen im ersten Blatt ein.
- Kennzahlen berechnen: Wechsel zum zweiten Blatt, um die automatisch berechneten Kennzahlen zu sehen.
- Interpretation: Verwende die berechneten Kennzahlen, um die Leistung deines Modells zu bewerten.
Interpretation der Ergebnisse
Nun, da wir die Ergebnisse erzielt haben, müssen wir diese noch interpretieren. Dabei hilft dir die folgende Übersicht:
- Hohe Genauigkeit: Das Modell liegt insgesamt häufig richtig.
- Hohe Präzision: Wenn das Modell etwas als positiv vorhersagt, ist es sehr wahrscheinlich auch positiv.
- Hohe Sensitivität: Das Modell erkennt die meisten positiven Fälle.
- Hohe Spezifität: Das Modell erkennt die meisten negativen Fälle korrekt.
- Negativ vorhergesagter Wert: Ein hoher Wert bedeutet, dass das Modell gut darin ist, negative Fälle korrekt zu identifizieren.
- Falsch-positiv Rate: Ein niedriger Wert ist wünschenswert, da es bedeutet, dass das Modell nur wenige falsche positive Vorhersagen macht.
- Falsch-negative Rate: Ein niedriger Wert ist ebenfalls wünschenswert, da es bedeutet, dass das Modell nur wenige falsche negative Vorhersagen macht.
- False Discovery Rate: Ein niedriger Wert bedeutet, dass von den als positiv vorhergesagten Fällen nur wenige tatsächlich negativ sind.
- Hoher F1-Score: Gute Balance zwischen Präzision und Sensitivität.
Fazit zu Excel-Vorlage Konfusionsmatrix zum Download
Die Excel-Vorlage zur Konfusionsmatrix ist ein praktisches Werkzeug, um die Leistung von Klassifikationsmodellen zu bewerten. Mit den automatisch berechneten Kennzahlen kannst du schnell und einfach feststellen, wie gut dein Modell arbeitet und wo es Verbesserungsbedarf gibt. Egal ob in der Medizin, bei der Spam-Erkennung, bei der Betrugserkennung oder bei der Datenextraktion aus Dokumenten – die Konfusionsmatrix ist ein unverzichtbares Werkzeug für jeden, der mit Daten arbeitet!
Bleibe immer up to date
Trag dich ein, um über weitere tolle Inhalte informiert zu werden!
Schreibe einen Kommentar