Indholdsfortegnelse:
Definition - Hvad betyder dataskrubbe?
Datascrubber refererer til proceduren til ændring eller fjernelse af ufuldstændige, forkerte, unøjagtigt formaterede eller gentagne data i en database. Det centrale mål med datascrub er at gøre dataene mere nøjagtige og konsistente.
Datascrub er en vigtig strategi for at sikre, at databaser forbliver nøjagtige. Det er især vigtigt i datakrævende industrier, herunder telekommunikation, forsikring, bank og detailhandel. Datascrubber evaluerer systematisk data for mangler eller fejl ved hjælp af opslagstabeller, regler og algoritmer.
Datascrubber kaldes også datarensning.
Techopedia forklarer dataskrubber
Databasefejl er almindelige og kan stamme fra følgende:- Menneskelige fejl under dataindtastning
- Fusion af database
- Fravær af branche eller virksomhedsspecifikke datastandarder
- Ældre systemer, der indeholder forældede data
Generelt består et databaseskrubningsværktøj af løsninger, der er ideelle til at rette op på flere specifikke slags fejl, såsom at finde duplikatposter eller udskifte manglende postnumre. At slå sammen forkerte eller korrupte data er det mest komplicerede problem. Det beskrives endda som problemet med "beskidte data", fordi det koster organisationer millioner af dollars hvert år. Dette fænomen øges med introduktionen af mere komplekse forretningsmiljøer med flere systemer og data. Datascrubber hjælper organisationer med at tackle sådanne problemer ved at tilvejebringe kraftfulde dataskrubningsværktøjer til at identificere og udrydde datafeil.
