Hjem Databaser Hvorfor skal ledere beskytte sig mod databededundans?

Hvorfor skal ledere beskytte sig mod databededundans?

Anonim

Q:

Hvorfor skal ledere beskytte sig mod databededundans?

EN:

Databaseadministratorer og andre it-fagfolk skal beskytte sig mod "databasredundans" eller "dataredundans" på grund af alle de negative virkninger, som redundans kan have i et databasesystem eller miljø. Hvor end et bestemt stykke data kopieres, enten i to felter i en database eller i to forskellige databasemiljøer, kan det have konsekvenser for dataindhentning.

En af de første grunde til at undgå dataredundans er, at det kan være spildt eller overdreven.

Det er vigtigt at påpege, at nogle typer af dataredundans er planlagt for at beskytte og sikkerhedskopiere data. Andre stammer imidlertid fra dårlig eller ineffektiv kodning eller manglende opmærksomhed på bedste praksis. I mange tilfælde medfører store mængder dataredundans, at databasen hurtigt vokser ud over en rimelig størrelse. Med dette i tankerne gøres mange bestræbelser på at bekæmpe dataredundans for at spare plads i en database og følgelig for at reducere omkostninger og vedligeholdelsesindsats. Dette skal dog gøres med øje for praktisk - ingeniører kan øve sig på noget, der kaldes data deduplication, men det skal gøres på en måde, der er effektiv.

For eksempel kan databaseadministratorer udforske noget som at fjerne en streng fra et gentaget felt, såsom en delt kunde eller firmanavn, og erstatte den med en simpel variabelreference, hvor strengen holdes et andet sted. Dette kan spare plads i en database - men det kan også kræve mere serveraktivitet for at udføre en given forespørgsel, så det er måske ikke så effektivt, som det ser ud til.

En anden stor grund til at deduplisere data eller undgå dataredundans er på grund af den forvirring, der kan resultere. Overflødige data i en database kan forårsage forskellige typer afvigelser. En af disse kaldes en opdateringsanomali - opdateringsafvik sker, når en post indtastes igen med opdaterede oplysninger, men opdateringen kommer ikke tilbage til den originale post. I en sådan situation kan der være tre forskellige poster for en bestemt virksomhedsmedarbejder med tre forskellige jobtitler og tre forskellige adresser, fordi personens oplysninger ikke blev opdateret i hele databasen, men kun på den sidst indtastede post.

Som foreslået af eksperter, kan databaseadministratorer undgå dataredundans ved design. De kan også engagere sig i datanormaliseringspraksis, der kan løse opdateringsanomalier og andre former for afvigelser ved at standardisere måderne, hvorpå databasetabellenes poster føres. Databaseadministratorer kan også forfølge dataduplikationsbestræbelser, der rydder op og standardiserer data på andre måder. Alt dette tjener formålet med at skabe renere databasetabeller, gøre databaseposter mere konsistente og forhindre alle hovedpine og komplekse problemer forbundet med uplanlagt dataredundans.

Hvorfor skal ledere beskytte sig mod databededundans?