Indholdsfortegnelse:
Definition - Hvad betyder ekstraktion?
Ekstraktion er processen med at hente relevant information fra datakilder i et specifikt mønster til brug i et datalagermiljø. Ekstraktion tilføjer mening til dataene og er det første trin i datatransformationsprocessen. Ekstraktion udvælger kun visse data, der passer til en tilstand eller kategori fra en enorm samling af data, der kommer fra forskellige kilder.
Techopedia forklarer Ekstraktion
I et datalagermiljø skal en enorm samling af data, der kommer fra forskellige strukturer og ustrukturerede kilder, behandles, transformeres og opbevares for at udlede meningsfulde konklusioner og forudsigelser. Dataene, der kommer fra de primære kilder, skal importeres til datalagringssystemet på en systematisk måde, der gør det nemt at udføre de forskellige handlinger på data. Denne proces kaldes ekstraktion. Ekstraktion tilføjer struktur til ellers ustrukturerede data ved at følge visse regler. Følgende er nogle af de teknikker, der anvendes til dataekstraktion:
- Mønstermatchning
- Tabelbaseret tilgang
- Tekstanalyse