Q:
Mere er ikke altid bedre. Hvordan kan organisationer reducere støj i deres data for at opnå målrettet, nøjagtig analyse?
EN:Med de store datasystemer er et af de store spørgsmål for virksomhederne, hvordan man holder disse projekter godt målrettede og effektive. Mange af de værktøjer og ressourcer, der er bygget til big data, er bygget til at opsugge store mængder information i et bredt net. De er ikke altid så opmærksomme på forfining af disse data og holder dem enkle. Der er dog nogle bedste praksis, der opstår i branchen for at skabe mere målrettede og nyttige big data-projekter.
En søjle i en målrettet big data-tilgang er at bruge de rigtige softwareværktøjer og ressourcer. Ikke alle analyser og big datasystemer er de samme. Nogle kan mere effektivt filtrere for store eller irrelevante data og give virksomhederne mulighed for bare at fokusere på de væsentlige kendsgerninger, der vil bestemme deres kerneprocesser og operationer.
En anden vigtig del af dette involverer mennesker. Inden man bliver involveret i et big data-projekt, og mens man køber software til sælger, forfølger implementering og uddannelse af andre, er en central gruppe af mennesker nødt til at være ansvarlig for processen og delegere også research og brainstorming-opgaver. Dette kan gøre en big data-tilgang til en præcis, kirurgisk metode, der vil forbedre virksomheden uden at blive for højt og forstyrre den daglige drift.
F.eks. Kan task kræfter eller andre kernegrupper sætte sig ned og se detaljeret på måderne, hvorpå implementering vil blive foretaget, hvordan virksomheden vil begynde at evaluere datasættene, hvordan de krydser indeksregnskaber, hvilken type papir eller digitale præsentationer, de vil bruge til at formidle denne information, hvordan de vil oprette nyttige rapporter osv. Disse detaljer vil beskytte virksomheden mod oppustning af big data.
Efterhånden som virksomheder begynder at erhverve flere leverandørtjenester, udføre mere big data-crunching og gøre IT-arkitekturer mere komplekse, har de lært at adskille de mest følsomme data fra alt andet.
En måde at gøre dette på er at skabe et lagdelt system. For eksempel kan et kernedatasæt med kunde-id'er og historier opbevares i en specielt vedligeholdt database under en bestemt cloud-sikkerhedskontrakt eller på stedet. Andre datasæt kan opholde sig i mindre specialiserede datamiljøer, enten fordi de er mindre følsomme med hensyn til dataforbrud, eller fordi de er mindre direkte relevante for den analyse, virksomheden udfører. Systemer med flere niveauer eller flerniveau muliggør omkostningseffektiv implementering af big data.
Dette er nogle af de måder, virksomhederne bliver smarte med at få big data på den rigtige måde. I stedet for blot at støvsuge op alle data, de kan få, behandler de visse datasæt som mest kritiske for at få mest mulig forretningsundersøgelse med mindst mulig anstrengelse.