Q:
Hvad er bedre, en platform eller en bringe-din-egen maskinlæringsalgoritme på AWS?
EN:I disse dage integrerer mange virksomheder maskinelæringsløsninger i deres analyseværktøjssæt for at forbedre brand management, forbedre kundeoplevelsen og øge driftseffektiviteten. Maskinlæringsmodeller er kernekomponenten i maskinlæringsløsninger. Modeller trænes ved hjælp af matematiske algoritmer og store datasæt for at gøre pålidelige forudsigelser. To almindelige eksempler på forudsigelser er (1) at bestemme, om et sæt finansielle transaktioner indikerer svig eller (2) vurdering af forbrugernes stemning omkring et produkt, baseret på input indsamlet fra sociale medier.
Amazon SageMaker er en fuldt administreret service, der lader udviklere og datavidenskabere bygge, træne og implementere maskinindlæringsmodeller. I SageMaker kan du bruge out-of-the-box-algoritmer eller gå med din egen-sti til en mere tilpasset løsning. Begge valg er gyldige og tjener lige så godt som grundlaget for en vellykket løsning til maskinlæring.
(Editorens note: Du kan se andre alternativer til SageMaker her.)
SageMakers out-of-the-box algoritmer inkluderer populære, meget optimerede eksempler på billedklassificering, naturligt sprogbehandling osv. Den komplette liste kan findes her .
- Fordele uden for boksen: Disse algoritmer er forudoptimeret (og gennemgår løbende forbedringer). Du kan være oppe, køre og implementere hurtigt. Derudover er AWS automatisk hyperparametertuning tilgængelig.
- Overvejelser ude af boksen: De kontinuerlige forbedringer, der er nævnt ovenfor, giver muligvis ikke resultater så forudsigeligt som om du havde fuld kontrol over implementeringen af dine algoritmer.
Hvis disse algoritmer ikke er egnede til dit projekt, har du tre andre valg: (1) Amazons Apache Spark Library, (2) brugerdefineret Python-kode (der bruger TensorFLow eller Apache MXNet) eller (3) "bring din egen", hvor du er i det væsentlige ubegrænset, men bliver nødt til at oprette et Docker-billede for at træne og tjene din model (du kan gøre det ved at bruge instruktionerne her ).
Medbring-din-egen tilgang giver dig fuld frihed. Dette kan vise sig at være attraktivt for datavidenskabsmænd, der allerede har opbygget et bibliotek med brugerdefineret og / eller proprietær algoritmisk kode, der muligvis ikke er repræsenteret i det aktuelle out-of-the-box sæt.
- Bring-Your-Own Fordele: Aktiverer fuld kontrol over hele datalogi-pipeline sammen med brugen af proprietær IP.
- Medbring dine egne overvejelser: Dockerisering er påkrævet for at træne og tjene den resulterende model. At inkorporere algoritmiske forbedringer er dit ansvar.
Uanset dit valg af algoritme er SageMaker på AWS en tilgang værd at overveje i betragtning af hvor meget fokus der er lagt på brugervenlighed fra et datavidenskabeligt perspektiv. Hvis du nogensinde har forsøgt at migrere et maskinlæringsprojekt fra dit lokale miljø til et vært, vil du blive overrasket over, hvor sømløs SageMaker gør det. Og hvis du starter fra bunden, er du allerede flere trin tættere på dit mål, i betragtning af hvor meget der allerede er lige ved hånden.