Confusion ( Karmaşıklık )Matrix Nedir Ve Ne İşe Yarar ?
Sınıflandırma sistemlerinin performansını değerlendirmek, modelin doğruluğunu anlamak ve hataları belirlemek için önemli araçlardan biri karmaşıklık matrisidir. Bu matris, sınıflandırma modelinin tahminlerini gerçek sınıflarla karşılaştırarak bir dizi parametreyi gösterecek bir tablodur. Bu yazımızda karmaşıklık matrisinin nasıl oluşturulduğunu, temel özelliklerini ve yorumunu inceleyeceğiz.
Confusion ( Karmaşıklık ) Matrisi Nedir ?
Karmaşıklık matrisi, sınıflandırma problemlerinde modelin performansını objektif bir şekilde değerlendirmek amacıyla kullanılan önemli bir araçtır. Bu matris, modelin gerçek değerleri ne kadar doğru tahmin ettiğini ve hatalarını hangi kategorilerde yaptığını gösteren bir özet sunar. İki boyutlu bir tablo olarak temsil edilen karışıklık matrisi, dört temel bileşeni içerir: true positive (TP), false positive (FP), true negative (TN) ve false negative (FN). TP, doğru pozitif tahminleri; FP, yanlış pozitif tahminleri; TN, doğru negatif tahminleri; FN ise yanlış negatif tahminleri temsil eder. Bu değerler, sınıflandırma modelinin performansını açıkça ortaya koyar ve modelin hangi sınıfları ne kadar başarıyla ayırt ettiğini belirler. Karmaşıklık matrisi, sınıflandırıcı tarafından yapılan hataların türleri hakkında detaylı bir anlayış sağlayarak, modelin geliştirilmesi ve ayarlanması için önemli bir rehber olarak kullanılır. Literatürde sıklıkla başvurulan bu değerlendirme aracı, sınıflandırma problemlerinde modelin doğruluğunu, hassasiyetini ve duyarlılığını belirlemede güvenilir bir yol sunar.
Temel Bileşenlere Detaylı Bakış Atalım :
True Positive (TP): Modelin doğru bir şekilde bir sınıfı tahmin ettiği durumları temsil eder. Örneğin, hastalıklı bir kişiyi doğru bir şekilde tanımlamak.
False Positive (FP): Modelin yanlış bir şekilde bir sınıfı tahmin ettiği durumları temsil eder. Yanlış bir şekilde sağlıklı bir kişiyi hastalıklı olarak tanımlamak gibi.
True Negative (TN): Modelin doğru bir şekilde bir sınıfı tahmin etmediği durumları temsil eder. Örneğin, sağlıklı bir kişiyi doğru bir şekilde tanımlamak.
False Negative (FN): Modelin yanlış bir şekilde bir sınıfı tahmin etmediği durumları temsil eder. Yanlış bir şekilde hastalıklı bir kişiyi sağlıklı olarak tanımlamak gibi.
Peki Ya Matrisi Nasıl Oluşturuyoruz ?
Karmaşıklık matrisi, gerçek sınıflar ve modelin tahminleri kullanılarak oluşturulur. Örneğin, bir sınıflandırma problemi için, modelin tahminleri ve gerçek sınıfları içeren bir veri seti kullanılır. Bu veri seti üzerinden TP, FP, TN ve FN değerleri hesaplanır ve karmaşıklık matrisi oluşturulur.
Matrisi Yorumlayalım:
Karmaşıklık matrisi temel metrikler şunlardır:
- Doğruluk (Accuracy): (TP + TN) / (TP + TN + FP + FN)
- Hassasiyet (Precision): TP / (TP + FP)
- Duyarlılık (Recall): TP / (TP + FN)
- F1 Skoru: 2 * (Precision * Recall) / (Precision + Recall)
REFERANSLAR