ETL (ekstrakt, transformering og indlæsning) er en af de vigtigste processer inden for big data-analyse - og samtidig kan det være en af dets største flaskehalse. (For mere om big data, kan du tjekke 5 nyttige Big Data-kurser, du kan tage online.)
Årsagen til, at ETL er så vigtig, er, at de fleste data, en virksomhed indsamler, ikke er klar, i sin rå form, til at analysere en løsning til at fordøje. For at en analyseløsning skal skabe indsigt, skal rådata udvindes fra applikationen, hvor den i øjeblikket ligger, omdannes til et format, som et analytikeprogram kan læse, og derefter indlæses i selve analytikaprogrammet.
Denne proces er analog med madlavning. Dine rå ingredienser er dine rå data. De skal udvindes (købes i en butik), transformeres (koges) og lades derefter (belagt), før de kan analyseres (smages). Sværhedsgraden og udgiften kan skalere uforudsigeligt - det er nemt at fremstille mac n 'ost til dig selv, men meget vanskeligere at oprette en gourmetmenu til 40 personer på en middagsselskab. Naturligvis kan en fejl på ethvert tidspunkt gøre dit måltid ufordøjeligt.