Q:
Hvordan kan nye maskinlæringsfunktioner muliggøre udvinding af lagerdokumenter til økonomiske data?
EN:En af de spændende nye grænser for maskinlæring og AI er, at forskere og ingeniører går i gang med forskellige måder at bruge helt nye typer ressourcer til at forudsige bestandsbevægelse og investeringsresultater. Dette er en enorm spiludveksler i den finansielle verden og vil revolutionere investeringsstrategier på en meget dyb måde.
En af grundideerne til at udvide denne type bestandsundersøgelser er computervingvistik, der involverer modellering af naturligt sprog. Eksperter undersøger, hvordan man bruger tekstdokumenter, fra SEC-arkiver til aktionærbreve til andre perifere tekstbaserede ressourcer for at udvide eller finjustere aktieanalyse eller udvikle helt nye analyser.
Gratis download: Machine Learning og Why It Matters |
Den vigtige ansvarsfraskrivelse er, at alt dette kun gøres muligt gennem splinternye fremskridt inden for neurale netværk, maskinindlæring og naturlig sproganalyse. Før fremkomsten af ML / AI brugte computerteknologier mest lineær programmering til at "læse" input. Tekstdokumenter var for stærkt ustrukturerede til at være nyttige. Men med de fremskridt, der er gjort inden for analyse af naturligt sprog inden for de sidste par år, finder forskere, at det er muligt at "mine" naturlige sprog til kvantificerbare resultater eller med andre ord resultater, der kan beregnes på en eller anden måde.
Nogle af de bedste beviser og mest nyttige eksempler på dette kommer fra forskellige afhandlinger og doktorgradsarbejder tilgængelige på nettet. I et papir, "Applications of Machine Learning and Computational Linguistics in Financial Economics, ", der blev offentliggjort april 2016, forklarer Lili Gao kapabelt relevante processer, der er specifikke for udvinding af virksomheds SEC-arkivering, opkald til aktionærer og meddelelser på sociale medier.
"Udtrækning af meningsfulde signaler fra ustrukturerede og højdimensionelle tekstdata er ikke en let opgave, " skriver Gao. "Med udviklingen af maskinindlæring og computing-sproglige teknikker kan bearbejdning og statistisk analyse af tekstdokumentopgaver imidlertid udføres, og mange anvendelser af statistisk tekstanalyse i samfundsvidenskab har vist sig at være succesrige." Fra Gaos diskussion af modellering og kalibrering i abstraktet viser det hele udviklede dokument, hvordan nogle af denne type analyser fungerer detaljeret.
Andre kilder til aktive projekter inkluderer sider som denne GitHub-projektopgave, og denne IEEE-ressource taler specifikt om at få værdifuld økonomisk information fra "Twitter sentimentanalyse."
Hovedpunkterne er, at brugen af disse nye NLP-modeller driver hurtig innovation i brugen af alle mulige tekstdokumenter, ikke kun til økonomisk analyse, men til andre former for banebrydende opdagelser, der slører den traditionelt etablerede linje mellem "sprog" og "data."