Článek
Co je to tedy tá záhadná confusion matrix ?
Je to výsledek učícího se programu, porovnání testovacích, od fit vzorce nezávislých dat a predpověděných dat vytvořených na základě fitu trénovacích dat. Tento výsledek má formu čtyř čísel které je potřeba číst diagonálně - jsou to čísla ve dvoch sloupcích a dvou řádcích - zleva true positives, false positives, ve druhém řádku false negatives a true negatives. Tj. true positive je hodnota, údaj, který systém předpověděl jako pozitivní a on skutečně byl pozitivní. False positive byl předpověděn jako positive, ale ve skutečnosti byl negative. False negative - předpověď byla negative ale skutečná hodnota byla positive. True negative - předpověď a hodnota - negativní - se shodují.
Confusion matrix slouží jako měření výkonnosti modelu a na její základě se vypočítává tzv. accuracy kdy se kalkuluje proporce správně klasifikovaných případů - pozitivních i negativních. Vzorec - A = TP + TN /TP+TN+FP+FN.
Jsou samozřejmě i jiné ukazatele ale pro začátek to stačí.
Jistě chápete, že význam confusion matrix je značný, protože ukazuje na výkonnost modelu a bude pro každý model pro daná data jiný - proto je tak důležité vybrat správný model, no současné cloud databáze umožňují automatický výběr modelu, tj. může ho používat každý kdo ovládá cloud nastavení neboli cloud konzoli a to i bez znalosti statistických metod.
No cesta k ní je dlouhá a právě s ní v nasledovné části začneme.