Indholdsfortegnelse:
Definition - Hvad betyder Apache Kudu?
Apache Kudu er medlem af open source Apache Hadoop-økosystemet. Det er en open source-lagermotor beregnet til strukturerede data, der understøtter tilfældig adgang med lav latens sammen med effektive analytiske adgangsmønstre. Det blev designet og implementeret for at bygge bro mellem det bredt anvendte Hadoop Distribuerede Filsystem (HDFS) og HBase NoSQL Database. Selvom disse systemer stadig kan vise sig at være fordelagtige, kan Apache Kudu imødekomme mange almindelige arbejdsmængder, da det dramatisk kan forenkle deres arkitektur.
Techopedia forklarer Apache Kudu
Apache Kudu blev primært udviklet som et projekt hos Cloudera. De fleste af de hidtidige bidrag har været af udviklere ansat af Cloudera. Under udgivelsen blev kun bekvemmelighedsbinarier inkluderet i Clouderas oplagringssteder, men det vedtog kildefrigivelsesprocessen for Apache Software Foundation (ASF) efter tilslutning til inkubatoren. Det er specifikt designet til brugssager, der kræver hurtig analyse af hurtige data. Det blev konstrueret til at drage fordel af næste generations hardware- og in-memory-behandling. Det sænker forespørgsels latency markant for Apache Impala og Apache Spark. Det distribuerer data gennem søjleopbevaringsmotor eller gennem vandret partitionering, og replikerer derefter hver partition ved hjælp af Raft-konsensus, hvilket giver lav gennemsnitstids-til-gendannelse og lave hale latenser.
Selvom Kudu er et produkt designet inden for rammerne af Apache Hadoop-økosystemet, understøtter det også integration med andre dataanalyseprojekter både ind og ud af ASF.
Apache Kudu viser sig at være effektiv, da den kan behandle analytiske arbejdsbelastninger i realtid på tværs af et enkelt lagringslag, hvilket giver arkitekterne fleksibilitet til at tackle en bredere vifte af anvendelsessager uden eksotiske løsninger.
