Indholdsfortegnelse:
Definition - Hvad betyder Hadoop Ecosystem?
Hadoop-økosystemet henviser til de forskellige komponenter i Apache Hadoop-softwarebiblioteket, samt tilbehør og værktøjer, der leveres af Apache Software Foundation til disse typer softwareprojekter, og til måderne, de arbejder sammen på.
Hadoop er en Java-baseret ramme, der er ekstremt populær til håndtering og analyse af store datasæt.
Techopedia forklarer Hadoop Ecosystem
Både den centrale Hadoop-pakke og dens tilbehør er for det meste open source-projekter, der er licenseret af Apache. Ideen om et Hadoop-økosystem involverer brugen af forskellige dele af det centrale Hadoop-sæt, såsom MapReduce, en ramme til håndtering af store mængder data, og Hadoop Distribueret filsystem (HDFS), et sofistikeret filhåndteringssystem. Der er også YARN, en Hadoop ressource manager.
Ud over disse kerneelementer i Hadoop har Apache også leveret andre former for tilbehør eller komplementære værktøjer til udviklere. Disse inkluderer Apache Hive, et dataanalyseværktøj; Apache Spark, en generel motor til behandling af big data; Apache Pig, et datastrømsprog; HBase, et databaseværktøj; og også Ambarl, som kan betragtes som en Hadoop-økosystemadministrator, da det hjælper med at administrere brugen af disse forskellige Apache-ressourcer sammen. Da Hadoop bliver de facto standard for dataindsamling og bliver allestedsnærværende i mange organisationer, lærer ledere og udviklingsledere alt om Hadoop-økosystemet, og hvilke slags ting der er involveret i en generel Hadoop-opsætning.