Indholdsfortegnelse:
Definition - Hvad betyder Hadoop Cluster?
En Hadoop-klynge er en hardwareklynge, der bruges til at lette brugen af open source Hadoop-teknologi til datahåndtering. Klyngen består af en gruppe noder, der er processer, der kører på enten en fysisk eller virtuel maskine. Hadoop-klyngen arbejder i koordinering for at håndtere ustrukturerede data og producere dataresultater.
Techopedia forklarer Hadoop Cluster
Hadoop-klyngen fungerer på en master / slave-model. En knude, der hedder NameNode, er Hadoop-masteren. Denne knude kommunikerer med forskellige DataNode-noder i klyngen for at understøtte operationer. Hadoop-klynger bruger typisk også andre Apache-open source-teknologier som Apache MapReduce og Apache Yarn - Garnplanlæggeren hjælper med at dirigere samarbejdsaktivitet af forskellige noder i systemet, som muligvis kører på virtuelle maskiner eller containere. Generelt bruges Hadoop-klynger til alle mulige virksomhedsteknologier og forudsigelig analyse, produkt- og serviceudvikling, styring af kundeforhold og meget mere.
