Indholdsfortegnelse:
Definition - Hvad betyder SQL på Hadoop?
SQL on Hadoop er en type analytisk applikationsværktøj - SQL-implementering på Hadoop-platformen, som kombinerer standard SQL-stil forespørgsel om strukturerede data med Hadoop-datarammen. Hadoop er en relativt ny platform, ligesom big data i sig selv, og ikke mange fagfolk er eksperter på det, men SQL på Hadoop forenkler adgangen til Hadoop-rammen og gør det lettere at implementere på nuværende virksomhedssystemer.
Techopedia forklarer SQL på Hadoop
SQL på Hadoop henviser til forskellige implementeringer af SQL til Hadoop-platformen. MapReduce, som er Hadoops clusterjobmapper og resultatarrangør, understøtter SQL som en vigtig brugssag såvel som andre behandlingsmetoder. Derfor er det fornuftigt at oprette kraftfulde værktøjer til at tillade SQL, som er et af de mest anvendte sprog til databaseforespørgsel og -manipulation. Da Hadoop vinder popularitet for virksomhedsdataarkitektur, er SQL nøglen til korrekt vedtagelse af både løst strukturerede data og strukturerede data, der bruges i Hadoop.
SQL på Hadoop nøgledrivere inkluderer:
- Udnyttelse af eksisterende SQL-færdigheder, der findes i de fleste organisationer
- Genanvendelse af ekstrakttransformationsbelastning (ETL), business intelligence (BI) og investeringer i analytisk infrastruktur i Hadoop
Nogle SQL på Hadoop-implementeringer inkluderer:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica på MapR
- ODBC-drivere
- Presto
- Haj
