Hjem Lyd Hvad er minedrift af tekstdata? - definition fra techopedia

Hvad er minedrift af tekstdata? - definition fra techopedia

Indholdsfortegnelse:

Anonim

Definition - Hvad betyder minedrift af tekstdata?

Minedrift af tekstdata indebærer kombination af et tekstdokument eller en ressource for at få værdifuld struktureret information. Dette kræver sofistikerede analytiske værktøjer, der behandler tekst for at hente specifikke nøgleord eller nøgledatapunkter fra hvad der betragtes som relativt rå eller ustrukturerede formater.

Tekstdata mining er også kendt som text mining eller text analytics.

Techopedia forklarer minedrift af tekstdata

I minedrift af tekstdata bruger konstruerede systemer ting som taksonomier og leksikalsk analyse til at bestemme, hvilke dele af et tekstdokument er værdifulde som udvindede data. Statistiske modeller er almindeligvis nyttige, og systemer kan også bruge heuristik eller algoritmisk gætteri for at prøve at bestemme, hvilke dele af en tekst der er vigtig. Andre kontrolsystemer inkluderer tagging og nøgleordsanalyse, hvor værktøjer ser efter specifikke korrekte navneord eller andre tags og nøgleord for at finde ud af, hvad der skrives om.

En anden unik komponent i tekstminedrift kaldes ofte sentimentanalyse. I følelsesanalyse, som generelt er meget vanskeligere end statistisk analyse, prøver analytiske værktøjer at finde ud af stemningen eller følelsen bag den skrevne tekst og andre aspekter af det, den adresserer på et meget subjektivt og intuitivt niveau. Med fremkomsten af ​​kunstige intelligensværktøjer er der gjort meget fremskridt inden for sentimentanalyse, således at moderne tekstdata-mining er mere end bare at indsamle kvantitative referencer og involverer at bringe konceptuelle modeller på højt niveau til tekstminedrift for at finde ud af nye og unikke måder at aggregerer værdifulde data.

Hvad er minedrift af tekstdata? - definition fra techopedia