Hjem Trends Hvad er en enkel måde at beskrive bias og varians i maskinlæring?

Hvad er en enkel måde at beskrive bias og varians i maskinlæring?

Anonim

Q:

Hvad er en enkel måde at beskrive bias og varians i maskinlæring?

EN:

Der er et vilkårligt antal komplicerede måder at beskrive bias og varians i maskinlæring. Mange af dem bruger markant komplekse matematiske ligninger og viser gennem grafer, hvordan specifikke eksempler repræsenterer forskellige mængder af både bias og varians.

Her er en enkel måde at beskrive bias, varians og bias / varians afveksling i maskinlæring.

I sin kerne er bias en forenkling. Det kan være vigtigt at tilføje definitionen af ​​bias en eller anden antagelse eller antaget fejl.

Hvis et meget partisk resultat ikke var i fejl - hvis det var på pengene - ville det være meget nøjagtigt. Problemet er, at den forenklede model indeholder en eller anden fejl, så den ikke er i tyret - den betydelige fejl bliver ved med at blive gentaget eller endda forstærket, når maskinlæringsprogrammet fungerer.

Den enkle definition af variansen er, at resultaterne er for spredte. Dette fører ofte til overkompleksitet i programmet og problemer mellem test- og træningssæt.

Høj varians betyder, at små ændringer skaber store ændringer i output eller resultater.

En anden måde at blot beskrive varians på er, at der er for meget støj i modellen, og det bliver derfor sværere for maskinindlæringsprogrammet at isolere og identificere det virkelige signal.

Så en af ​​de enkleste måder at sammenligne bias og varians er at foreslå, at maskinindlæringsingeniører skal gå en fin linje mellem for meget bias eller forenkling og for meget varians eller overkompleksitet.

En anden måde at repræsentere denne brønd er med et firekvadrantdiagram, der viser alle kombinationer af høj og lav varians. I kvadranten med lav bias / lav varians er alle resultaterne samlet i en nøjagtig klynge. I et resultat med høj bias / lav varians samles alle resultaterne sammen i en unøjagtig klynge. I et resultat med lav bias / høj varians er resultaterne spredt rundt om et centralt punkt, der ville repræsentere en nøjagtig klynge, mens datapunkterne i et resultat med høj bias / høj varians er spredt og kollektivt unøjagtige.

Hvad er en enkel måde at beskrive bias og varians i maskinlæring?