Q:
Hvad er nogle af farerne ved at bruge maskinlæring impulsivt?
EN:Maskinlæring er en kraftfuld ny teknologi - og det er noget, som mange virksomheder taler om. Det er dog ikke uden dets problemer med hensyn til implementering og integration i virksomhedspraksis. Mange af de potentielle problemer med maskinlæring kommer fra dens kompleksitet og hvad det kræver for virkelig at oprette et vellykket projekt til maskinlæring. Her er nogle af de største faldgruber man skal passe på.
En ting, der kan hjælpe, er at ansætte et erfarent maskinuddannelsesteam til at hjælpe.
Et af de værste resultater ved at bruge maskinlæring dårligt er, hvad du kan kalde “dårlig intel.” Dette er gener, når det gælder at udstryge de slags beslutningsstøttesystemer, som maskinlæring giver, men det er meget mere alvorligt, når det anvendes til enhver form for kritisk system. Du kan ikke have dårlige input, når du betjener et selvkørende køretøj. Du kan ikke have dårlige data, når dine maskinlæringsbeslutninger påvirker rigtige mennesker. Selv når det udelukkende bruges til ting som markedsundersøgelser, kan dårlig intelligens virkelig synke din virksomhed. Antag, at maskinlæringsalgoritmer ikke træffer nøjagtige og målrettede valg - og derefter går ledere blindt sammen med, hvad computerprogrammet beslutter! Det kan virkelig ødelægge enhver forretningsproces. Kombinationen af dårlige ML-resultater og dårlig menneskelig tilsyn rejser risici.
Et andet relateret problem er dårlige resultater af algoritmer og applikationer. I nogle tilfælde fungerer maskinlæring muligvis lige på et grundlæggende niveau, men er ikke helt præcist. Du har måske virkelig klodsede applikationer med omfattende problemer, og en fejlliste en kilometer lang, og brug en masse tid på at prøve at rette alt, hvor du kunne have haft et meget strammere og mere funktionelt projekt uden at bruge maskinlæring overhovedet. Det er som at prøve at sætte en massiv motor med høj hestekræfter i en kompakt bil - den skal passe.
Det bringer os til et andet stort problem med maskinlæring iboende - problemet med overfitting. Ligesom din maskinindlæringsproces skal passe til din forretningsproces, skal din algoritme passe til træningsdataene - eller for at sige det på en anden måde, så skal træningsdataene passe til algoritmen. Den enkleste måde at forklare overfitting er med eksemplet på en to-dimensionel kompleks form som grænsen til en nationalstat. Montering af en model betyder, at du skal bestemme, hvor mange datapunkter du vil lægge i. Hvis du kun bruger seks eller otte datapunkter, vil din grænse se ud som en polygon. Hvis du bruger 100 datapunkter, vil din kontur se hele sammen. Når du overvejer at anvende maskinlæring, skal du vælge den rigtige tilpasning. Du vil have nok datapunkter til at systemet fungerer godt, men ikke for mange til at slå det ned i kompleksitet.
Resulterende problemer har at gøre med effektivitet - hvis du løber ind i problemer med overfitting, algoritmer eller applikationer, der fungerer dårligt, får du sunkede omkostninger. Det kan være svært at skifte kursus og tilpasse sig og måske slippe af med maskinlæringsprogrammer, der ikke går godt. Indkøb til valg af gode mulighedsomkostninger kan være et problem. Så virkelig er vejen mod succesfuld maskinlæring nogle gange fyldt med udfordringer. Tænk over dette, når du prøver at implementere maskinlæring i en virksomheds kontekst.