Q:
Hvorfor er bias versus variation af betydning for maskinlæring?
EN:At forstå udtrykkene "bias" og "varians" i maskinlæring hjælper ingeniører til mere fuldt ud at kalibrere maskinindlæringssystemer til at tjene deres tilsigtede formål. Bias versus varians er vigtig, fordi det hjælper med at styre nogle af de afvejninger, der foregår i maskinlæringsprojekter, der bestemmer, hvor effektivt et givet system kan være til virksomhedsbrug eller andre formål.
Når man forklarer bias versus varians, er det vigtigt at bemærke, at begge disse problemer kan kompromittere dataresultater på meget forskellige måder.
Gratis download: Machine Learning og Why It Matters |
Bias kan beskrives som et problem, der resulterer i unøjagtige klynger - det er en situation, hvor maskinlæring kan give mange resultater med præcision, men gå glip af mærket med hensyn til nøjagtighed. I modsætning hertil er varians en "spredning" af information - det er en vildhed, en data, der viser en række resultater, hvoraf nogle kan være nøjagtige, men mange af disse falder uden for en bestemt præcisionszone for at gøre det samlede resultat mindre nøjagtig og meget mere "støjende."
Faktisk forklarer nogle eksperter, der beskriver varians, at variantresultater har en tendens til at "følge støjen", hvor resultater med høj partiskhed ikke går langt nok til at udforske datasæt. Dette er en anden måde at kontrastere problemet med bias med variansproblemet - eksperter forbinder bias med underfitting, hvor systemet muligvis ikke er fleksibelt nok til at inkludere et sæt optimale resultater. I modsætning hertil ville varians være en slags modsætning - hvor overfitting gør systemet for skrøbeligt og delikat til at modstå en masse dynamiske ændringer. Ved at se på bias versus varians gennem denne linse af kompleksitet, kan ingeniører tænke på, hvordan man optimerer montering af et system for at gøre det ikke for komplekst, ikke for enkelt, men bare komplekst nok.
Dette er to måder, hvor filosofien om bias versus varians er nyttig ved design af maskinlæringssystemer. Det er altid vigtigt at arbejde med maskinstyrke for at forsøge at få et samlet sæt af resultater, der er nøjagtige til den anvendelse, de anvendes til. Det er også altid vigtigt at se på varians i at forsøge at kontrollere kaoset eller vildheden i stærkt spredte eller spredte resultater og håndtere støj i et givet system.
