Hjem Lyd Hvad er open source big data-analyse? - definition fra techopedia

Hvad er open source big data-analyse? - definition fra techopedia

Indholdsfortegnelse:

Anonim

Definition - Hvad betyder Open Source Big Data Analytics?

Open source big data-analyse refererer til brugen af ​​open source-software og værktøjer til analyse af store mængder data for at indsamle relevant og handlingsrig information, som en organisation kan bruge til at fremme sine forretningsmæssige mål. Den største spiller inden for open source big data-analyse er Apache's Hadoop - det er det mest anvendte softwarebibliotek til behandling af enorme datasæt på tværs af en klynge computere ved hjælp af en distribueret proces til parallelisme.

Techopedia forklarer Open Source Big Data Analytics

Open source big data analytics bruger open source software og værktøjer til at udføre big data analytics ved enten at bruge en hel softwareplatform eller forskellige open source værktøjer til forskellige opgaver i processen med dataanalyse. Apache Hadoop er det mest kendte system til analyse af big data, men andre komponenter er påkrævet, før et reelt analysesystem kan sættes sammen.

Hadoop er open source-implementeringen af ​​MapReduce-algoritmen, der er skabt af Google og Yahoo, så det er grundlaget for de fleste analysesystemer i dag. Mange big data-analyseværktøjer bruger open source, inklusive robuste databasesystemer som open-source MongoDB, en sofistikeret og skalerbar NoSQL-database, der er meget velegnet til big data-applikationer såvel som andre.

Open-source big data-analysetjenester inkluderer:

  • Dataindsamlingssystem
  • Kontrolcenter til administration og overvågning af klynger
  • Maskinindlæring og data mining bibliotek
  • Ansøgningskoordinationstjeneste
  • Beregn motor
  • Udførelsesramme
Hvad er open source big data-analyse? - definition fra techopedia