Indholdsfortegnelse:
Definition - Hvad betyder ustrukturerede data?
Ustrukturerede data repræsenterer alle data, der ikke har en genkendelig struktur. Det er uorganiseret og rått og kan være ikke-tekstligt eller tekstligt. For eksempel er e-mail en fin illustration af ustrukturerede tekstdata. Det inkluderer tid, dato, modtager- og afsenderoplysninger og emne osv., Men et e-mail-organ forbliver ustruktureret. Ustrukturerede data kan også identificeres som løst strukturerede data, hvor datakilderne inkluderer en struktur, men ikke alle data i et datasæt følger den samme struktur.
I kundeorienterede virksomheder kan dataene, der findes i en ustruktureret form, undersøges for at forbedre forhold til markedsføring og styring af kundeforhold (CRM). Da apps på sociale medier, såsom Facebook og Twitter, går i mainstream, vil ustruktureret dataudvikling sandsynligvis overstige fremskridtene med strukturerede data.
Techopedia forklarer ustrukturerede data
Ustrukturerede data henviser til data, der følger en formular, der er mindre ordnet end elementer som regnearksider, databasetabeller eller andre lineære eller ordnede datasæt. Faktisk er udtrykket "datasæt" nyttigt, fordi det er forbundet med data, der er i pæne, tilgængelige arrays, uden noget ekstra indhold, og som er knyttet eller mærket i en bestemt struktur.
Andre forekomster af ustrukturerede tekstdata inkluderer Word-dokumenter, PowerPoint-præsentationer, direktemeddelelser, samarbejdssoftware, dokumenter, bøger, stillinger på sociale medier og medicinske poster. Ikke-tekstuelle ustrukturerede data oprettes generelt i medier, såsom MP3-lydfiler, JPEG-billeder og Flash-videofiler osv.
Ustrukturerede data inkluderer normalt ikke en foruddefineret datamodel, og de stemmer muligvis ikke godt med relationstabeller. Ustrukturerede data er normalt teksttunge. Det kan dog indeholde numre og datoer samt fakta. Dette fører til uklarheder, der er vanskelige at identificere ved hjælp af konventionelle softwareprogrammer.
Opbevaring af enorme mængder ustrukturerede data, der genereres i en virksomhed, hvis de ikke administreres dårligt, kan føre til højere udgifter. Data i papirkopier eller i elektronisk format skal scannes for at et søgeprogram kan analysere ideer, afhængigt af ord, der bruges i visse sammenhænge. Dette er kendt som enterprise eller semantisk søgning.