Indholdsfortegnelse:
Definition - Hvad betyder parallel dataanalyse?
Parallel dataanalyse er en metode til analyse af data ved hjælp af parallelle processer, der kører samtidig på flere computere.
Processen bruges til analyse af store datasæt, såsom store telefonopkaldsposter, netværkslogfiler og webopbevaringssteder for tekstdokumenter, der kan være for store til at blive placeret i en enkelt relationsdatabase. Metoden bruges ofte i Big Data Analytics og generel dataanalyse.
Techopedia forklarer Parallel Data Analyse
Det primære koncept bag parallel dataanalyse er parallelisme, defineret i computing som samtidig udførelse af processer.
Dette opnås ofte ved at bruge flere processorer eller endda flere computere og er en almindelig praksis i distribueret computing. I den parallelle analyse af data udfører forskellige computere, der udfører forskellige aspekter af dataanalyse, disse processer samtidig og konsoliderer senere resultaterne i en enkelt stor rapport.
Årsagen til denne parallelisme er hovedsageligt at gøre analyse hurtigere, men det er også fordi nogle datasæt kan være for dynamiske, for store eller simpelthen for uhåndterlige til at blive placeret effektivt i en enkelt relationsdatabase. Resultatet ville være, at disse datasæt er placeret i forskellige databaser, der er optimeret til den slags data og i forskellige maskiner, så lineær analyse er simpelthen ikke en effektiv mulighed.