Hjem Udvikling Hvordan kan begrebet ligevægt informere om maskinlæringsprojekter?

Hvordan kan begrebet ligevægt informere om maskinlæringsprojekter?

Anonim

Q:

Hvordan kan begrebet ligevægt informere om maskinlæringsprojekter?

EN:

Generelt vil en ligevægt informere maskinlæring ved at søge at stabilisere maskinlæringsmiljøer og skabe resultater med en kompatibel blanding af deterministiske og probabilistiske komponenter.

Eksperter beskriver en "ligevægt" som en situation, hvor rationelle aktører i et maskinlæringssystem når en enighed om strategisk handling - især Nash-ligevægten i spilteori involverer to eller flere af disse rationelle aktører, som konsoliderer strategier ved at erkende, at ingen spiller drager fordel af ændring af en bestemt strategi, hvis de andre spillere ikke ændrer deres.

Gratis download: Machine Learning og Why It Matters

En særlig populær og enkel demonstration af Nash-ligevægt involverer en simpel matrix, hvor to spillere hver vælger et binært resultat.

Ovenstående er en temmelig teknisk måde at beskrive ligevægt på, og hvordan det fungerer. En meget mere uformel måde at illustrere konceptet med ligevægt, især ovenstående eksempel på to rationelle skuespillere, der hver især har binært valg, er at tænke over, hvad I kan kalde scenariet "gå mod hinanden i gymnasiet".

Lad os antage, at to mennesker går i forskellige retninger ned ad en gymnasiel hall (eller en hvilken som helst anden type område), der kun har plads til to personer i bredden. De to åbne stier er de binære resultater. Hvis de to rationelle aktører vælger forskellige binære resultater, der ikke er i konflikt med hinanden, vil de gå forbi hinanden og sige hej. Hvis de vælger to modstridende binære resultater - går de i det samme rum, og et af dem bliver nødt til at give efter.

I ovenstående eksempel, hvis de to rationelle aktører vælger de to kompatible og ikke-modstridende resultater, er den generelle konsensus, at ingen af ​​dem vinder ved at ændre deres strategi - i dette tilfælde deres vandrerute - hvis den anden person ikke ændrer deres.

Ovenstående udgør en ligevægt, der kan modelleres i enhver given maskinlæringskonstruktion. Givet dette enkle eksempel vil resultatet altid være de to rationelle aktører, der samarbejder, eller med andre ord, to mennesker, der går forbi hinanden.

Det modsatte kunne kaldes en "ulighed" - hvis de to rationelle aktører vælger modstridende resultater, som nævnt, bliver en af ​​dem nødt til at give efter. Imidlertid kunne ML-programmets modellering af dette smides i en uendelig sløjfe, hvis begge beslutter at give efter - meget som to personer, der skal flytte for at forsøge at rumme hinanden og stadig fortsætte med at gå mod kollision.

Ligevægte som den ovenfor vil generelt blive brugt i maskinlæring for at skabe konsensus og stabilisere modeller. Ingeniører og udviklere vil kigge efter de scenarier og situationer, der drager fordel af ligevægt, og arbejder på at ændre eller håndtere dem, der ikke gør det. Når man ser på eksempler i den virkelige verden, der svarer til ML-ligevægte, er det let at se, hvordan denne form for analyse i maskinlæringssystem er unikt instruktivt til at finde ud af, hvordan man modellerer menneskelig adfærd ved at skabe rationelle skuespillere og agenter. Det er bare et glimrende eksempel på, hvordan en ligevægt kan bruges til at gøre fremskridt i anvendelsen af ​​maskinlæringssystemer.

Hvordan kan begrebet ligevægt informere om maskinlæringsprojekter?