Q:
Hvorfor er datavisualisering nyttig til maskinlæringsalgoritmer?
EN:Disciplinen med datavisualisering giver os praktisk taget uendelige måder at vise, hvad der sker med maskinlæringsalgoritmer. Det er værd at tænke nøjagtigt på, hvorfor datavisualisering er så vigtig, og hvorfor det frigiver så meget kreativ kraft for så mange mennesker, der engagerer sig i maskinlæringsprocesser.
For at forstå værdien af datavisualisering til maskinlæring skal du bare se på en hvilken som helst af de algoritmer, der bruges til at skabe disse banebrydende og innovative programmer.
En af de enkleste er beslutningstræet. Uden at komme i aktiveringsfunktioner eller skjulte lag eller lignende, er beslutningstræet blot sæt af binære knuder. Men selv det enkle beslutningstræ er meget vanskeligt for folk at beskrive eller skrive om. Det er meget lettere, når det visualiseres på en skærm eller på en side. Når du ser hver knude og dens forbindelser til andre knudepunkter, vises det hele let.
Lad os nu tage en af de mest byzantinske og detaljerede maskinlæringsalgoritmetyper - det neurale netværk.
På nogle måder er neurale netværk virkelig samlinger af maskinlæringsalgoritmer. Den grundlæggende opsætning består af et inputlag, skjulte lag og et outputlag. Aktiveringsfunktionerne hjælper de enkelte digitale neuroner med at behandle vægtede input.
Alle disse elementer og alle disse processer forklares meget lettere gennem datavisualisering end ved hjælp af mundtlige eller skriftlige beskrivelser. Du kan sige, at et neuralt netværk har vægtede input, der flyder ind i et inputlag, og at de samles sammen i et skjult lag og konsolideres til et givet output, men når du bruger en visuel figur til at vise, hvordan dette fungerer, det menneskelige øje og det menneskelige hjernen låses fast på det på en meget mere direkte og nyttig måde.
På en måde kan du se kraften i datavisualisering, selv uden at tage maskinlæring i betragtning. Tilbage i dagene med lineær programmering ville compilere og computersprogstudier give programmerere valget om at indstille et trin-for-trin-testprogram, hvor de kunne inspicere værdierne for variabler i små visuelle bokse. Igen hjalp dette med at vise, hvad der sker i en eksekvering meget bedre end bare at læse gennem en kodebase.
Maskinindlæring er hyperintensiv programmering - det er probabilistisk programmering, og det er grunden til, at datavisualisering virkelig hjælper os med at få vores hoveder rundt om, hvad der sker med en given algoritme eller proces.