Indholdsfortegnelse:
Definition - Hvad betyder dataprofilering?
Dataprofilering er en teknik, der bruges til at undersøge data til forskellige formål, såsom at bestemme nøjagtighed og fuldstændighed. Denne proces undersøger en datakilde såsom en database for at afdække de fejlagtige områder i dataorganisationen. Implementering af denne teknik forbedrer datakvaliteten.
Dataprofilering kaldes også dataopdagelse.
Techopedia forklarer dataprofilering
Dataprofilering er metoden til at undersøge de tilgængelige data i en datakilde og indsamle statistikker og oplysninger om disse data. Sådanne statistikker er med til at identificere metadatas brug og datakvalitet. Denne metode er vidt brugt i opbevaring af virksomhedsdata.
Dataprofilering klargør strukturen, forholdet, indholdet og afledningsreglerne for data, som hjælper med til forståelsen af afvigelser inden for metadata. Dataprofilering bruger forskellige former for beskrivende statistikker, herunder gennemsnit, minimum, maksimum, percentil, frekvens og andre aggregater såsom tælling og sum. Den yderligere metadatainformation, der er opnået under profileringen, er datatype, længde, diskrete værdier, unikhed og abstrakt typegenkendelse.
