Indholdsfortegnelse:
Big data, det iørefaldende navn for massive mængder af strukturerede, ustrukturerede eller semistrukturerede data, er notorisk vanskeligt at fange, gemme, administrere, dele, analysere og visualisere, i det mindste ved hjælp af traditionelle database- og softwareapplikationer. Derfor har big datateknologier potentialet til at administrere og behandle store datamængder effektivt og effektivt. Og det er Apache Hadoop, der giver rammerne og de tilhørende teknologier til at behandle store datasæt på tværs af computerklynger på en distribueret måde. Så for virkelig at forstå big data, skal du forstå lidt om Hadoop. Her skal vi se på de øverste udtryk, du vil høre med hensyn til Hadoop - og hvad de betyder.
Webinar: Big Iron, Meet Big Data: Befriende Mainframe Data med Hadoop & Spark Tilmeld dig her |
Men først et kig på, hvordan Hadoop fungerer
Inden du går ind i Hadoop-økosystemet, skal du forstå to grundlæggende ting klart. Den første er, hvordan en fil gemmes i Hadoop; det andet er, hvordan lagrede data behandles. Alle Hadoop-relaterede teknologier arbejder hovedsageligt på disse to områder og gør det mere brugervenligt. (Få det grundlæggende om, hvordan Hadoop fungerer i, hvordan Hadoop hjælper med at løse Big Data-problemet.)
Nu videre til betingelserne.