Hjem I nyhederne Hvorfor er en forvirringsmatrix nyttigt i maskinlæring?

Hvorfor er en forvirringsmatrix nyttigt i maskinlæring?

Anonim

Q:

Hvorfor er en forvirringsmatrix nyttigt i ML?

EN:

Der er en række måder at tale om, hvorfor en forvirringsmatrix er værdifuld i maskinlæring (ML) - men en af ​​de enkleste måder er at forklare, at forvirringsmatrixen er en ressource til datavisualisering.

En forvirringsmatrix giver seerne mulighed for at se et øjeblik på resultaterne af at bruge en klassifikator eller anden algoritme. Ved at bruge en enkel tabel til at vise analyseresultater, koges forvirringsmatrixen i det væsentlige ned dine output til en mere fordøjelig visning.

Forvirringsmatrixen bruger specifik terminologi til at arrangere resultater. Der er ægte positive og sande negative såvel som falske positive og falske negativer. For en mere kompliceret forvirringsmatrix eller en baseret på sammenligningsklassificering kan disse værdier vises som værende faktiske og forudsagte klasser for to forskellige objekter.

Uanset den semantiske terminologi grupperes resultaterne i en firkantet (eller rektangulær) tabel.

Denne opfattelse gør det lettere for analytikere at se, hvor nøjagtigt en algoritme var ved klassificering af resultater. (Læs nye generatorer sætte moderne algoritmer til at arbejde med ASCII Art.)

Brugbarheden af ​​forvirringsmatrixen har at gøre med ML-projekternes kompleksitet og også med den måde, hvorpå information formateres og leveres til brugerne. Forestil dig en streng lineære resultater, inklusive falske positiver, falske negativer, ægte positive og sande negativer. (Læs maskinlæring 101.)

En bruger bliver nødt til at tabulere alle disse lineære resultater i en graf for at forstå, hvordan algoritmen fungerede, og hvor nøjagtig den var. Med forvirringsmatrix præsenteres denne information simpelthen i en stærk visuel model.

Antag f.eks., At maskinen bliver bedt om at klassificere 20 billeder, hvoraf fem er frugter og fem er grøntsager. Hvis en forvirringsmatrix indeholder følgende indhold (fra venstre til højre): 7, 5, 3, 5, viser matrixen, at syv blev korrekt identificeret som grøntsager, mens tre korrekt blev klassificeret som frugter.

De andre 10 er som repræsenteret resultater, hvor programmet ikke identificerede billedet korrekt.

Forvirringsmatrixen vil være nyttig i alle slags ML-analyser. Ved at observere denne ressource kan brugerne finde ud af, hvordan de håndterer problemer som dimensionalitet og overfitting og andre måder at optimere en algoritme.

Hvorfor er en forvirringsmatrix nyttigt i maskinlæring?