Hjem I nyhederne Hvorfor er valg af funktioner så vigtig i maskinlæring?

Hvorfor er valg af funktioner så vigtig i maskinlæring?

Anonim

Q:

Hvorfor er valg af funktioner så vigtig i maskinlæring?

EN:

Valg af funktioner er ekstremt vigtigt i maskinlæring primært fordi det tjener som en grundlæggende teknik til at dirigere brugen af ​​variabler til det, der er mest effektivt og effektivt for et givet maskinlæringssystem.

Eksperter taler om, hvordan funktionsvalg og ekstraktion af funktioner fungerer for at minimere forbandelsen af ​​dimensionalitet eller hjælpe med at tackle overfitting - dette er forskellige måder at tackle ideen om overdrevent kompleks modellering.

Gratis download: Machine Learning og Why It Matters

En anden måde at sige dette er, at valg af funktioner hjælper med at give udviklere værktøjer til kun at bruge de mest relevante og nyttige data i maskinlæringsuddannelsessæt, hvilket dramatisk reducerer omkostninger og datavolumen.

Et eksempel er ideen om at måle en kompleks form i skala. Når programmet skalerer, identificerer det et større antal datapunkter, og systemet bliver meget mere kompliceret. Men en kompleks form er ikke det typiske datasæt, som et maskinindlæringssystem bruger. Disse systemer bruger muligvis datasæt, der har meget forskellige niveauer af varians mellem forskellige variabler. I klassificering af arter kan ingeniører f.eks. Bruge funktionsvalg til kun at studere de variabler, der giver dem de mest målrettede resultater. Hvis hvert dyr på diagrammet har det samme antal øjne eller ben, kan disse data fjernes, eller andre mere relevante datapunkter kan udvindes.

Funktionsvalg er den kritiske proces, som ingeniører dirigerer maskinlæringssystemer mod et mål. Ud over ideen om at fjerne kompleksitet fra systemer i skala, kan valg af funktioner også være nyttigt til at optimere aspekter af, hvad eksperter kalder "bias variance trade-off" i maskinlæring.

Årsagerne til, at valg af funktion hjælper med bias og variansanalyse, er mere komplicerede. En undersøgelse fra Cornell University om valg af funktion, biasvarians og bagging tjener til at illustrere, hvordan funktionsvalg hjælper med projekter.

Ifølge forfatterne undersøger papiret "mekanismen, ved hvilken valg af funktion forbedrer nøjagtigheden af ​​overvåget læring."

Undersøgelsen siger endvidere:

En empirisk bias / variansanalyse, når funktionen vælges fremad, indikerer, at det mest nøjagtige funktionssæt svarer til det bedste biasvarians-kompromisspunkt for indlæringsalgoritmen.

Når man diskuterer brugen af ​​stærk eller svag relevans, taler forfatterne om valg af funktion som ”en variansreduktionsmetode” - dette giver mening, når man tænker på varians som i det væsentlige variationen i en given variabel. Hvis der ikke er nogen afvigelse, kan datapunktet eller matrisen i det væsentlige være ubrugelig. Hvis der er ekstremt høj varians, kan det udvikle sig til hvad ingeniører kan tænke på som "støj" eller irrelevante, vilkårlige resultater, som er vanskelige for maskinlæringssystemet at styre.

I lyset af dette er valg af funktioner en grundlæggende del af design i maskinlæring.

Hvorfor er valg af funktioner så vigtig i maskinlæring?