Af Techopedia Staff, 11. maj 2016
Takeaway: Vært Rebecca Jozwiak diskuterer fremskridt inden for databasearkitektur og -lagring med Dez Blanchfield, Robin Bloor og Brian Bulkowski.
Du er ikke logget ind. Log ind eller tilmeld dig for at se videoen.
Rebecca Jozwiak: Mine damer og herrer, hej og velkommen til Hot Technologies i 2016. I dag er vi, "Udsættelse af differentiering: En ny æra af skalerbar infrastruktur ankommer." Jeg træder ind for Eric Kavanagh i dag. Jeg er Rebecca Jozwiak, din ydmyge vært fra bestyrelsesgruppen, mens Eric er ude på Jamaica. Godt for ham.
Så som det har været i årtier, er dette år varmt, selvom teknologien uden tvivl bevæger sig i et tempo, der overgår Moores lov, og hvad gør organisationer for at følge med? De leder efter hvad der er hurtigt, og skala, vil jeg hævde, er sandsynligvis en af de vigtigste ting, når vi tænker på databaser. Og selvfølgelig har vi mulighederne for den sædvanlige relation, nu har vi vores NoSQL, vi har vores kolonnelager, vi har vores grafdatabaser, vores RDF-databaser, men virkelig, hvad virksomhederne leder efter er skala, er parallelitet og er hurtig .
Nu var traditionelle arkitekturer slags baseret på den relationelle model. Men hvis du ser på de fleste webvirksomheder, der er dukket op i de sidste tre, fem, ti år, er det ikke de modeller, de bruger til deres infrastruktur. De bruger en anden, en parallel arkitektur, de skalerer og de er hurtige, og det er slags, hvad mange mennesker henvender sig til i dag.
Vores lineup, vi har Dez Blanchfield, han er en videnskabsmand fra Bloor Group. Vi har doktor Robin Bloor, vores chefanalytiker i Bloor Group, og vi har Brian Bulkowski, CTO og grundlægger af Aerospike. Så fyre med det, jeg vil overføre det til Dez.
Dez Blanchfield: Tak, og tak for at have mig her. Jeg vil prøve at sætte scenen for, hvordan vi slags meget hurtigt nåede dit sted, hvor vi er, og vi vil dykke ned i meget mere af den tekniske detalje, når vi gennemgår dagens emner. Jeg vil bare få kontrol over skærmen her.
Så større, bedre og hurtigere. Når jeg tænker over hvor vi er på, er det billede, der bliver ved med at tænke for mig personligt, netop dette billede, som jeg har fået på mit titeldia, som er udvidelsen af universet. Vi har fået teknologi til at udvikle og vokse i årtier nu, faktisk fra slutningen af halvtredserne, da mainframe blev en rigtig ting. Teknologi er fortsat med at vokse i mange tilfælde på en værre eller større end en lineær kurve, afhængigt af hvilken del af kurven du er på, for så vidt software eller hardware går.
Skalaen er blevet større og større og hurtigere og hurtigere, hvad vi prøver at levere, og mindre og mindre på produktions- og halvlederniveau. Og i midten er der software og applikationer og systemer, der understøtter denne software, og de er tilbøjelige til at blive mindre og mindre i naturen, og vi har set ting som containeret applikationer og mikroserver, det er blevet en ting igen. Vi gjorde det i fortiden, årtier før, men som et resultat af at gå mindre og mindre der, bliver vi større og større i den skala, som vi nu kan køre ting på, såsom applikationer og bestemte databaser, og logikken i disse databaser.
Jeg har denne opfattelse, hvor vi har skaleret meget vandret, i det væsentlige X-aksen; vi er skaleret lodret i Y-aksen. Vi er på det punkt, hvor vi er nødt til at gå et andet sted, og efter min mening er det slags mentalt forestillet som en Z-akse, og det er, at vi er nødt til at gå dybt ind i teknologien og se på, hvordan vi kan gøre ting anderledes end hvad vi har gjort indtil videre, for at få det ekstra stykke fart. Så jeg visualiserer hele denne udvidelse af universet, hvor vi har haft en eksplosion, og der findes nogle teknologier, og denne bedre lineære vækst og efterspørgsel. Vi har måttet finde forskellige måder at få det større, bedre og hurtigere resultat.
Bare for hurtigt at dække slags, hvor vi er i nu i et par hardwaremiljøer. Vi har set de faldende omkostninger ved en gigabyte diskplads medføre et par ret store overgange og teknologi og tilgange til det større, bedre og hurtigere skalaproblem. Dette er to separate grafer, der dækker stort set et årti, et godt årti hver af den faldende pris på en gigabyte harddiskplads.
Det er en klassisk J-kurve eller en hockeystok, som vi ofte refererer til dem, idet du for nogen tid siden kunne bruge bogstaveligt talt hundreder af tusinder af dollars til at købe en gigabyte diskplads, for ikke helt to årtier siden, mens det i dag er blevet dollars og til sidst er jeg sikker på, at det ender, hvad vi kalder løbet til nul, det vil blive cent. Det medførte en interessant ændring i den type ting, som virksomheder kunne gøre. Og jeg omtaler det som en forstyrrelse gennem data eller big data i særdeleshed, og med det, hvad jeg mener, er, at vi så teknologier, som hvordan man kan blive en ting, hvor vi kunne skalere meget horisontalt i opbevaring, og den type beregning, vi kan gælde for denne lagring, og hvordan det åbner en interessant teknologi, fordi det giver os mulighed for at udføre meget stort, overflødigt parallelt lagerlag på det hurtigste niveau, og Hadoop-dele i sig selv, naturligtvis i stand til at kopiere data i en skrivning en gang læst mange gange-format, og skaler bare tingene ud på en næsten lineær klasse.
Og det er alle virksomheder som dette, der kommer til virkelighed ved forstyrrelser ved hjælp af big data. Vi har firmaer som Uber, der er verdens største taxafirma. De ejer faktisk ikke nogen taxaer, og det er en lang liste her. Airbnb er den største udbyder af boliger, har faktisk ingen fast ejendom. En af mine favoritter er Facebook, for eksempel på denne liste, hvor de faktisk ikke opretter indholdet, vi opretter det til dem, men de er faktisk den største medieejer på planeten. Vi har interessante, som de hurtigst voksende banker, har faktisk ingen penge. Dette er peer-to-peer udlånsplatforme og banker, og der er især en i Australien, der vokser berømmelse her kaldet SocietyOne. Og nogle af de store banker, der skal have kontanter, investerer i den særlige peer-to-peer-bank. Og vi går gennem denne liste endda ned til Netflix; de ejer faktisk ingen biografer, og alligevel er de faktisk det største biografhus på kloden.
Så de kom til det sted, de var i mine tanker gennem anvendelse af smarte teknologier på dataniveau, fordi vi kunne udføre større og bredere opbevaring til lavere omkostninger på grund af den faldne pris på en gigabyte harddiskplads, og vi kunne anvende noget intelligent beregne og distribuere en computermodel derover. Disse virksomheder havde evnen til at skabe en konkurrencefordel og forstyrre som følge af de faldende omkostninger til diskplads.
Vi har set en lignende ting ske i udgifterne til hukommelse. For et par årtier siden, hvis du havde seks millioner dollars liggende, kunne du købe en gigabyte RAM, og vi har haft en meget lignende J-kurve eller hockeystok, finder sted i reduktion af omkostningerne eller den faldne pris på VÆDDER. Og det har medført nogle interessante ting, og efter min mening er en af de største forstyrrelser i dette rum mængden af hukommelse, der kan indbygges i enheder, som mobile enheder, som telefoner og tablets, og endda bærbare computere. Computere i disse dage, mængden af hukommelse, der går i en gennemsnitlig bærbar computer, er i nogle tilfælde ret latterligt. I nogle tilfælde har min nuværende bærbare computer mere hukommelse end nogle af de servere, de plejede at bruge for ikke så længe siden.
Dette har medført en betydelig ændring i sig selv, på en lignende måde som en RAM i mine sind, det gjorde det muligt for os at skalere og skalere hurtigt. Og nu har vi fået fremkomsten af en teknologi, som vi kalder flash, og dette er en teknologi, der oprindeligt stammer fra noget, der er sat på hardware i form af en EEPROM, en lille chip, der var designet til at være tilgængelig, og skriv til, og så bare når strømmen slukkede, ville det holde det, du skrev til den chip, som vedvarende opbevaring. Det var langsomt, det var klodset, og i disse dage tror jeg, det var omkring 1980–1981, det blev slags. I 1984 gjorde Toshiba, som jeg mener opfandt teknologien, den til en kommerciel ting, som vi kunne bruge.
Men inden længe regnede folk med, at de faktisk kunne tage en kombination af de komponenter, der blev brugt til at skabe dette koncept om en EEPROM, en skrivebeskyttet hukommelse, når den først blev slettet og skrevet til den, og de kunne faktisk skrive til den regelmæssigt og brug det lidt mere som diskplads og lidt mere som RAM. Over tid udviklede det sig. Nu har denne flash-lagringsteknologi været en fusion mellem traditionel disklagring, hvad enten det er en spindisk disk eller i nogle tilfælde en hybrid disk med hukommelse og RAM. Og det vigtigste er systemet mellem, fordi du kan læse og skrive til det, og derefter slukke for strømmen, og det vil bevare, hvad du har skrevet til det. Så en diskplads, åbenlyst skriver du til den, slukker du for strømmen, og den spindende spindel og det kraftigt modificerede, fordi de ønsker en bedre beskrivelse, holder nuller og dem, du har skrevet til det.
I hukommelsesområdet med tilfældig adgang skriver du noget til hukommelsen i RAM, du slukker computeren, og alt bliver udslettet, fordi der ikke er flere elektroner til at holde det opladet og holde de oplysninger, du skrev til den. Plus det er i midten, og det er ekstremt hurtigt, hurtigere end disk, en smule langsommere end RAM. Men du kan skrive til det og læse fra det, og når du slukker for strømmen, vil det fortsætte. Dette har medført nogle fantastiske teknologier, og især har vi udviklet mobile enheder og laptops, der er virkelig, virkelig hurtige og i stand til at gøre mange ting, og nu flyttes det ind i infrastrukturområdet omkring opbevaring og beregning, og det har medført betydelige ændringer i, hvad vi kan levere i skala. Dette er slags hvor jeg tror, at Z-aksen i mit sind kommer nu.
Det er næsten bare i tide på mange måder, fordi vi nu har set en forstyrrelse gennem det, jeg betegner som efterspørgsel, og det er, at forbrugerne har, uanset hvad der sker i infrastrukturen og teknologirummet, og evnen til at køre hurtigere og hurtigere beregning og ydeevne på infrastrukturniveau kræver forbrugerne denne forstyrrelse i form af det, der henvises til nu, berømthedsoplevelsen. Alle ønsker, at hvert system, hver app, hvert websted skal vide, hvem de er, og hvad de kan lide, og for at kunne give dem en personlig en-til-en-oplevelse. Det er ikke godt nok længere bare at gå til et websted, hvor jeg køber biografbilletter. Jeg vil have, at det skal vide, hvad jeg har købt før, hvorfor jeg købte det, og potentielt hvad folk ligesom mig købte og anbefaler ting.
Under alle omstændigheder ser vi, hvad jeg refererer til, er en sideordning af det sociale, og det er, at jeg vil have berømthedsoplevelsen, men jeg vil også socialisere den idé, jeg vil dele den med alle mine venner og fortælle dem, hvad jeg Jeg laver det, og jeg vil også vide, hvad mine venner laver. Og dette er et resultat af et eksplosivt behov for yderligere computere og opbevaring og hurtig omdrejning af ting. Vi har set Fitbit-generationen, hvad jeg kalder altid-on-tracking. Alt, hvad jeg gør, bliver sporet, logget og fanget et eller andet sted. Vi har set alt i realtid: bank, bud, anbefalingsmotorer, at være i stand til at klare de ting i realtid, jeg personligt laver som forbruger.
Og så ser vi en meget stor indflydelse, ligesom sikkerhedsrisikoen omkring cybersikkerhed. Det plejede at være, at vi havde individuelle hackere, så havde vi kriminelle bander henvendt sig til det, nu har vi hele nationer, der går i krig over internettet, hvilket er en rigtig ting og faktisk sker. Vær opmærksom på det, sæt dig op og kig på det, for der er en reel indflydelse på det, og nogle af vores før-show-skænderier var omkring at diskutere risikoen for at få din egen computer, eller i det mindste dit netværk, trængt igennem.
Vi har set dette begreb om udvindelse af enheder. Enhedsekstraktion er, når vi er nødt til at finde ting af interesse i meget store datasæt og især omkring svindel og ulovlig aktivitet og hacker-type aktiviteter. Men oftere end ikke, vil vi se, at udvindelse af enheder bliver et fokuspunkt for gode ting, og ting, der er af værdi for os, i modsætning til at lede efter ting, der angriber os.
Vi har også set en eksplosion, hvad der kaldes geospatiale data. Dette er data, der faktisk ved, hvor de stammer fra, eller hvor andre data som dem er fra. Du kan forestille dig, at du står på gaden, og du vil finde den nærmeste parkeringsstation eller den nærmeste restaurant, applikationer, der kan anvende geospatial computing og data, computing til data, der ved, hvor det er i rummet, er meget vigtigt, fordi skal du være i stand til at vide, hvor andre objekter og enheder er, og gøre det hurtigt.
Vi har set permanent tilsluttet mobil. Selv når vi sover om natten, tikker vores mobiltelefoner stadig væk, opdaterer vores e-mails, kontrollerer vores kalendere, ser på, hvad vejret er, og finder ud af, om hvad vi vil have til morgenmad vil være tilgængelige. Der sker en masse støj der, og det har skabt en enorm indflydelse på, hvad vi skal gøre i bagenden, og hvor hurtigt vi gør det.
Samlet set er den store skala og virkningen af det, der omtales som tingenes internet, eller oftere end ikke, maskine-til-maskine-forbindelse, hvor enheder taler til enheder, og det går helt op til motorer, der er fastgjort til side af flyene der fortæller selve flyet, eller flystyringssystemet, at en belastning på motor nummer fire oplever for meget slid og varme, og at den skal udskiftes, når vi lander, og så kommunikerer den til en anden maskine, og så skal den placere en ordre, og magisk vises en ingeniør under flyvning i lufthavnen og er parat til at udskifte den under brændstofpåfyldningen.
Og den skala, der er så stor og så stor, at vi har været nødt til at gå ind på, hvad jeg refererer til det, via adgang til en slags klare det. Fordi en ny verden og velkommen til den nye verden, en ny verden med alt, hvad vi bruger, der er forbundet; engang var det satellitter og netværksenheder, nu er det mobile enheder og vores bærbare computere og tablets og telefoner, og selv min helt nye Audi har et skilt indbygget i det, og det rapporterer konstant om sit eget helbred, men opdaterer også sig selv, og ved, hvor det er, og hvilke kort der er gældende, og siger endda, hvornår jeg skal gå en anden rute, hvis der er trafik på vejen foran.
Alt, hvad vi bygger nu, alt, hvad vi taler til dig nu, bliver designet til at oprette forbindelse og forbinde til andre ting, ikke kun fra mig til system, men fra system til system og for at kunne klare det, vi er nødt til at anvende meget forskellige tanker i infrastrukturlaget, både på hardwaren og softwaren, og især de databaselag, som systemerne har brug for at understøtte, og på mange måder er databasen blevet motoren, og apps er virkelig bare små bots, der gør ting.
Jeg kommer hurtigt sammen med dette lidt humoristiske syn på, hvor vi skal hen med disse ting, og hvad jeg refererer til som "IoT med et tryk på en knap." Der er oprettet en ny gadget kaldet the Amazon Dash-knap, og dette er en lille tommelfinger-gadget. Faktisk er det på mange måder det samme som mit USB-tommeldrev. Når du køber denne ting, handler det omkring $ 4, 99 US online fra Amazon, den bliver sendt til dig, du konfigurerer den med din mobiltelefon, og du bogstaveligt talt sætter den fast på et af dine enheder, f.eks. Et køleskab eller en vaskemaskine eller hvad som helst. I dit eksempel på vaskemaskine, hvis du til sidst er tør for vaskepulver, kan du trykke på den knap, og den ringer hjem og bestiller automatisk mere til dig, og magisk mere bliver sendt til dig via vores gode venner på Amazon.
For mig skræmmer dette mig, fordi det vil se en eksplosion af en række ting, der er forbundet på netværket og forsøge at skabe forbindelse og skabe efterspørgsel. Hvis du kan forestille dig, er en eller to af disse ting måske ikke så skræmmende, men sidste gang jeg kiggede, var der over 110 af disse ting mærket, så næsten hvert brand på planeten vil prøve at få deres eget lille skub- knap IoT, at du går hjem og trykker på en knap, og det siger: "Bestil en pizza." Du trykker på en anden knap, og den bestiller en forudbygget frokost til dine børn til skolen i morgen.
Det driver en så massiv efterspørgsel efter transformation i bagenden, på applikationsniveau, især på databaseniveau, at jeg tror, at vi kun lige har set toppen af isbjerget af den type præstationstransformation, vi har brug for at se . Og med det overleverer jeg det til doktor Robin Bloor og får hans indsigt i, hvor vi er, også.
Rebecca Jozwiak: Okay Robin, jeg har givet dig bolden.
Robin Bloor: Er det ikke godt? Okay, her går vi, det er mig. Jeg så Dezs præsentation, før jeg kom til denne, så jeg ville sige ting, der er gratis snarere end bare at gentage nogle af de ting, som Dez sagde. Jeg troede, at jeg ville tale om databaseudvikling i form af, hvad der faktisk skete med arkitekturen osv. Af databaser fra et historisk perspektiv.
Det grundlæggende problem, som enhver databaseudbyder har, er at opretholde en fleksibel arkitektur, der skalerer og holder trit med hardwareudviklingen. Jeg vil tænke dette, men når du faktisk ser tilbage og ser, hvordan databaserne plejede at blive bygget, og den måde, de bygges på nu, er de faktisk markant forskellige fra det, jeg ville kalde det arkitektoniske designniveau . Det er værd at bare gennemgå hvorfor det er, eller i det mindste jeg tror, det er. Hardwarefaktorerne, og Dez har givet os en særlig god gennemgang af de nedre lag med hensyn til hukommelse og disk. Hvad vi har nu, og dette er fremtiden, Intel er næste, CP, der vil have en FPGA på det. Hvad folk vil gøre med det, har jeg ikke en anelse om. AMD fusionerer CPU'er og GPU'er, og hvad er der en forskel, der vil gøre? Dette er den slags ændringer, der rent faktisk vil gøre forskel i databasen, og jeg formoder, at blandt andre Aerospike, fordi Aerospike er drevet af ydeevne, det allerede sandsynligvis allerede er ved at kigge på det og finde ud af, hvor det tror, det faktisk vil gå med den måde, produktet fungerer på.
Vi har et system på en chip, der endnu ikke er startet. SSD'er, vi kender til, men pointen at gøre er, at de faktisk øges i hastighed, groft Moores lovs sats, en faktor på 10 hvert sjette år. Men Intel er ved at frigive 3D-krydsningspunkt, der hævder at være i stand til at gå mere end hundrede gange hurtigere end SSD'er, faktisk en slags dråber i blandingen, så det vil ændre hastigheden, som produkter som Aerospike faktisk kan gå.
Så har vi de parallelle hardwarearkitekturer, med andre ord den måde, vi har konstrueret hardware i den forstand - oprindelig var det bare en CPU, der sad over hukommelsen, som sad over en disk, men det er blevet langt mere kompliceret end det. Ideen med et system på en chip er, at du faktisk kan have parallelismechip til chip til chip og få alt til at gå med en ekstraordinær hastighed, og vi har ingen idé om nøjagtigt, hvilke af disse produkter der rent faktisk vil dominere.
Det er bare et blik på fremtiden, men på hardware-niveauet accelererer ydeevnen, og omkostningerne fortsætter med at falde, lidt efter linjen, som Dez beskrev. Dine CPU'er bliver ikke nødvendigvis billigere, de bliver bare hurtigere og så videre.
Fra forretningsmæssigt perspektiv, i nogle situationer, og dette er markedssituationer, er det at være først, hvor forretningsværdien er. Hvis du især - hvis du er helt overbevist om, at en bestemt bestand vil falde i pris, får den første person, der får salgsordren den bedste pris. Det er virkelig så enkelt. Derfor er der et teknologiløb, der går videre til automatisk handel i bankerne for faktisk at prøve at vinde disse situationer. Hvad skete derpå? Hvad sker der, efter at bankerne har gjort deres ting med alt dette? Du begynder pludselig at se andre områder blive inficeret med den samme slags behov for hastighed.
Hvad der virkelig skete, er at mennesker blev fjernet fra ligningen, og det skete med internetreklame meget hurtigt. Men det var, det er ikke den specifikke transaktion, udførelsen af metoder, dette er en hel forretningsproces, det er det faktum, at en webside lige er blevet smidt ud, og der skal træffes en beslutning, der kan være en ret kompliceret beslutning, med hensyn til hvilken annonce, der faktisk skal sættes på denne webside, hvor man trækker fra hvem brugeren af browseren er, hvad der ville være den mest passende annonce til at lægge den på, og så videre og så videre. Det er blevet en meget kompleks ting, og jeg vil nævne det igen.
Men pointen er, at ydeevnen og skalerbarheden i forretningsprocessen ikke er det samme problem som ydeevne og skalerbarhed af en forespørgselsfunktion, og dette er noget, som jeg er klar over, på grund af en nylig orienteringsrum, vi gjorde med Aerospike, som de er også opmærksom på. En anden ting, når du rent faktisk arbejder med disse hastigheder, betyder aktivereegenskaber en transaktion, enhver begivenhedsbehandling. De betyder virkelig noget. Så meget af det, som nogle databaser gør, som mister et brev eller to fra aktivet, fungerer muligvis rimeligt godt i sammenhængen - dette vil fungere godt i den kontekst, vi taler om. Det er ikke rigtig acceptabelt at være ærlig.
Fra et teknologiperspektiv ser du faktisk på - jeg ved, at der er to slags gearing, for at skabe den slags arkitekturer, der faktisk kræves for at give den slags hastigheder, der kan gøre, som Aerospike, kan udføre en million transaktioner pr. sekund. Du skal faktisk være meget præcis med hensyn til softwareudviklingen. Du kan ikke bare hacke væk. Du skal være bekymret for kodelængdelængder. Du skal bruge fremragende brug i hukommelsen, og du optimerer faktisk hele transaktioner. Du har brug for intelligent parallelisme, og du har også brug for fejlsikker parallelitet. Du er nødt til at skalere op i stedet for at udskala, for så snart du involverer netværket i noget, bliver det den mest sandsynlige pointer, som du vil ramme latenstid, og det vil begynde at gøre transaktionerne for langsomme.
Du er nødt til at komme så meget som muligt på et givet kendt af et netværk, før du faktisk skalerer ud, og du virkelig ikke ønsker at skalere ud hurtigt, du ønsker virkelig ikke mange processer. Du vil have et netværk, der ikke bruges af nogen anden. Og du vil have et utroligt hurtigt netværk.
Accelereret SSD-opbevaring er noget - faktisk tror jeg, at det meste af dette gælder hvad Aerospike gør. En af de interessante ting er, er det en NoSQL-database. Det plejede at blive troet - jeg ved det ikke, for et antal år siden - det plejede at tro, at den relationelle database var den eneste database, og den dominerede alt, og det var kun denne underlige lille nichesituation, hvor du ikke havde brug for at gå i relation. Det er lidt vendt på hovedet nu. Det er de hurtige databaser, der findes på disse SQL-databaser, og en af grundene til det, den vigtigste grund til det, er, at de undgår at sammenføje data, de gemmer data stort set på en objektiv måde. Når du er færdig med et objekt, gemmer du det bare og trækker hele objektet tilbage, det samler ikke tingene for faktisk at behandle dem. Dette er hvad hastighed handler om. Disse typer teknikker, der genererer hastighed inden for databasesammenhæng.
Dette er sporet af tårer, dette er, hvad der skete med databasen. Historien eller fortællingen om de relationelle databaser var slutningen af en database, der faktisk ikke var sandt. Selv da de begyndte at komme til dominans, var det stadig nødvendigt. Objektdatabaser udførte de tidligere transaktioner i disse dage, fordi relationelle databaser faktisk ikke kunne udføre dem, og så viste det sig, at de relationelle databaser, der bruger rækkebutikker, de heller ikke kunne foretage hurtige forespørgsler, du har brug for kolonnebutikker. Og så opdagede vi, at hvis du rent faktisk ønskede at stille grafiske forespørgsler om data, ville hverken en kolonnelager eller en relationel database være noget godt, og du faktisk havde brug for at få bygget en specifikt grafbevidst database til dig. Så kom RDF-databaser ind, og så snart du faktisk begyndte at overveje betydningen af semantik, og vi fik NoSQL-databaserne i, meget, meget specifikt for hastighed. At kalde dem NoSQL er næsten som om du branding af alle disse databaser, som om de var de samme, faktisk er de radikalt forskellige i hvad der ligger derunder. Den eneste grund til, at de bærer navnet NoSQL, er, at de ikke giver en forbandelse om SQL, fordi det er for dyrt. Transaktionsforsinkelser, som de har brug for.
IoT - som jeg troede, jeg ville afslutte på det samme punkt som Dez afsluttede det med - det er ikke ovre, al denne situation med hensyn til hastighed og forsinkelseskrav, den er ikke ovre, før den fede dame begynder at undgå disse data, og de er ikke rigtig startet endnu. En masse af disse data vil have de forsinkelser, som jeg har været opmærksom på, så jeg tror, det er alt, hvad jeg har at sige. Lad os give det videre til Aerospike og Brian Bulkowski.
Brian Bulkowski: Hej, mange tak for at være med i Bloor Group og mig selv for denne præsentation i dag. Når jeg tænker over, hvad Dez og Robin bare talte om, vil jeg gerne fortælle dig lidt om stien, som Aerospike har taget i leveringen af ny databaseteknologi og NoSQL-databaseteknologi til en række brancher. Det har været en fantastisk sti. Vi startede Aerospike i 2008 for at se en masse af de trends, som Dez og Robin har nævnt. Specifikt om, at hukommelsesdatabaser er i stand til at drage fordel af flash såvel som den slags udskillede skysystemer og den slags skala, der kræves for at udføre personalisering, adfærdsanalyse og den slags VIP-oplevelser, der blev diskuteret.
Da vi nærmet os problemet med en database, der var en front-end operationel database, der var i stand til at give understøttelserne til applikationer, der kunne skrives for at løse disse, startede vi med problemet om, hvordan kunne vi i det væsentlige bygge en distribueret hash-tabel, hukommelse -distribueret hash-tabel, der var forbløffende hurtig og i stand til ting som millioner af transaktioner pr. sekund, men til en rimelig pris. Da vi var færdige med vores prototype, indså vi, at vi så skulle finde ud af, hvem der muligvis har brug for denne slags hastighed. Som Silicon Valley-selskab fandt vi hurtigt ud af, at det virkelig var reklamebranchen, der var i stand til at forbruge denne form for information og var interesseret i den, og derfor vil jeg gerne bruge et øjeblik på at tale om realtid-budgivning og hvordan dette markedet fungerer.
Robin nævnte, hvordan finansiel handel fungerer, hvilket er den første transaktion, der ofte er den vindende transaktion, og der er hovedsageligt et tidspunkt til marked for forsinkelse og en værdi til forsinkelse. Reklamebranchen er lidt anderledes, på en interessant måde, fordi målet med reklame er et bestemt - hvad der kaldes et indtryk, evnen til at levere en annonce - er en auktion, og denne auktion løber mellem ti millisekunder til 50 millisekunder. Spillets navn, og der er ofte hundreder af virksomheder, der nu byder i realtid på hver enkelt annonce, der er placeret på internettet, er at få den mest mængde data og bringe de bedste algoritmer, der skal bære inden for disse ti til 50 millisekunder over største mængde data.
Denne ændring og skift skete i reklamebranchen, i hvert af de små millisekunder, har en tidsbegrænset komplikation med de bedste algoritmer over den største mængde data, og for at gøre det samler du masser af små stykker af data. Seneste IP-adresseoplysninger, nyere oplysninger om en bestemt enhedskategori, nyere oplysninger om webstedsadfærd, nylige søgeudtryk, alt sammen ville gå ind i den hemmelige sauce fra et bestemt virksomheds algoritmer for at bestemme en pris og et bud.
Dette har været et fascinerende marked at være en del af. Vi udførte først vores første distribution på Aerospike i 2010 med nogle af de første virksomheder, der arbejdede seriøst inden for realtidens budøkonomi, og derefter har vi opnået, grundlæggende at være den forreste butik af adfærdsdata, for de fleste virksomheder i det plads. Det, vi har fundet siden da, og er en særlig arkitektur, som jeg vil detaljeret gennemføre i løbet af denne præsentation, er, at det hele skete i 2010, 2011, 2013 og fortsætter med at udvikle sig. Annoncering er et meget dynamisk marked.
Men den slags VIP-oplevelse, kan du tænke på at placere den rigtige annonce, ikke placere en annonce til at sige børns produkter, fordi jeg tilfældigvis ikke har nogen børn, så jeg vil ikke have en effektiv annonce, hvis det placeret på det, men hvis det handler om hurtige biler, er det den slags annonce, der skal placeres til Brian. Det er virkelig den slags VIP-oplevelse i tilbud, uanset om du vil rabat eller ej, hvis du er på et detailwebsted, selv når du finder svig. Er dette det normale mønster for en bestemt person eller et bestemt kreditkort? Al denne form for teknologi til realtidsanalyse, adfærdsmæssig forudsigelse, forudsigelsesanalyse siver nu ud af reklamebranchen, der har gjort det for sjov og fortjeneste nu i ganske mange år og virkelig kommer i detailhandlen og bank- og svindel-afsløring osv. gennem en bestemt arkitektur. Så Aerospike har været privilegeret at være en del af et antal af disse sager.
Arkitekturen, som vi ser, fungerer og er praktisk til at gøre dette, er en sådan, i stedet for at oprette et sæt forespørgsler fra en applikationsserver, i stedet for at flytte mere af din beregning til selve appserveren og derefter bruge en database som væsentligst et lager motor til den slags genstande, som Robin talte om. I dette tilfælde forveksler disse arkitekturer først og fremmest ikke dette med din faktiske analyse her. Du ser til højre for dette lysbillede, at der stadig er en analyse her til at generere indsigt. Dette er job, der ofte arbejder over petabytes, snesevis af petabytes af data, endda exabyte i tilfælde af nogle af vores store kunder ved hjælp af en række teknologier. Du skal have et big data-team, et analyseteam, et kvantitativt team derinde, der regner ud hvad, siger geografiske koordinater, der betyder noget, hvilke modeller der fungerer med hensyn til at finde disse relationer og skabe VIP-oplevelsen. Det er et helt problem for sig selv og ikke et, som Aerospike direkte har deltaget i, og der er en masse flot teknologi, når du har at gøre med den slags system.
Det, vi har været begejstret for og arbejdet med branchen om, er, når du først har fået denne indsigt, hvordan engagerer du dig i form af maskine-til-maskine eller hurtig maskine-til-menneske-transaktion, hvor du tager denne indsigt og laver dem ægte for enhver person, øjeblik for øjeblik? Arkitekturen, som vi har set ved hjælp af det, er en, hvor der er en applikationsserver, der er skrevet, og den gør al den matematik og kigger gennem de modeller, du har oprettet, og ser på nyere opførsel og gør det over i det væsentlige et nøgleparadigme eller i det mindste meget system med forespørgselslys.
Når du beskæftiger os med den slags datatyper, vi taler om, den slags strømme, vi taler om, med millioner af skriv per sekund, millioner af læser i sekundet, millioner og hundreder og tusinder af beslutninger pr. For det andet, at bygge komplekse indekser, multidimensionelle indekser, fungerer simpelthen ikke særlig godt, det er ikke skalerbart. Måden at opnå denne form for skala er at engagere sig i en masse parallelisme. Vi taler lidt om, hvordan vi gør det senere. Men en del af det er en statsløs appserver skrevet på dit eget sprog.
Hvad vi ofte ser, er et bestemt projekt, der antager en ny applikationsramme baseret på de mennesker, der arbejder der, den teknologi, de bruger, og det problem, de nærmer sig. Vi har set folk bruge Python, mange mennesker bruger Java, vi ser stadig C-programmerere, fordi meget af dette stadig er høj ydeevne, måske endda bruger ting som de gamle MATLAB-biblioteker. Og de er nødt til at røre ved tusinder af tusinder af datapunkter pr. Sekund for at tage en effektiv beslutning.
Et spørgsmål, som jeg nogle gange har stillet, er: "Nå, Brian, hvis du er i stand til millioner af transaktioner pr. Sekund, hvem har brug for det?" Hvis du f.eks. Ser på nordamerikansk betalingsbehandling, og Aerospike er involveret i løsninger, der laver svindelopdagelse inden for dette system, og understøtter applikationsforfattere, der laver nogle meget innovative ting inden for svigpåvisning, er der kun et par tusinde betalingstransaktioner pr. Og alligevel, da det første firma kom til os og sagde, at de kiggede på at bruge NoSQL, og ville se, hvordan vores løsning ville se ud, som understøttede deres applikation, sagde de, at de ønskede at røre 5.000 stykke data i et 750 millisekund vindue. Nå, nu har du pludselig et par hundrede forretningstransaktioner og et par tusind stykke data, du skal overveje i hver beregning, og nu er du ude i området med behov for millioner af transaktioner pr. Sekund.
Sagen om - at lægge reklame til side for et øjeblik, er svig, er fascinerende, fordi hvor der er penge, der er svig, og realtidsforebyggelse af svig, i modsætning til at prøve at sortere analytisk efter, at et svig er sket, er virkelig en spørgsmål om at bringe så mange data som muligt online, og du kan tænke på det som en afspejling af denne VIP-oplevelse. Opfører denne person sig på en måde, som de normalt ikke opfører sig? Og dermed stiger chancerne for, at det er et uredeligt system, og ikke faktisk denne person. Har denne person normalt adgang via en bestemt enhed eller sæt enheder med et vist sæt skærmopløsninger? Udstiller de normalt et bestemt adfærdsmæssigt shoppingmønster? Måske kan vi nipe svig i knoppen i løbet af selve transaktionen. Det skal minde dig meget om den slags ting, der sker inden for en transaktion i reklamesystemet.
De slags systemer, vi løser, er dem, hvor hver enkelt betalingsprocessor har et stort datateam, de har en masse historiske data, de opretter nye modeller, de deler ikke med os på Aerospike alle modellerne, fordi de er virkelig en hemmelig sauce. Hvis du er en abonnent på Gartner, og du hørte Gartner tale om algoritmeøkonomien, er dette en algoritme og et selskab, der kæmper mod hinanden for at nedlægge svindel og for at få antallet af succesrige transaktioner, fordi du også ikke ' t vil blokere transaktioner. Det er den slags projekter, vi ser efter i Aerospike på disse skala-niveauer.
En anden sag, som vi har arbejdet på med finansielle serviceselskaber, er det, der kaldes Intraday System of Record. I dette tilfælde er det, der sker, typen af rigere oplevelser, selv i et detailhandelssystem, hvor jeg vil være i stand til at se på min særlige position, og jeg vil gøre det ekstremt præcist. Jeg vil ikke have en fangst foran mit DB2-system. I stedet for ønsker jeg at se på de nøjagtige data, og mellem mobil, men også ting som en risikoberegning, skal risikoberegninger nu udføres på minut-for-minut-basis, du vil være i stand til at omberegne alles risiko såvel som den globale risiko, systemisk risiko i hele virksomheden inden for få minutter.
Og igen er det det samme problem. Hver enkelt konto, der er en bestemt, tænk på det som en nøgleværdeopslag til et bestemt objekt, så kan dette gøres parallelt, og vigtigst af alt, dette paradigme giver dig mulighed for at skrive din kode og dine algoritmer på et højt niveau sprog, hvilket er lettere at debugge og hurtigere tid til at markedsføre. I denne algoritmeøkonomi skal jeg være i stand til at få mine algoritmer online nu. Dette er et meget andet problem for modellering og forretningsforhold, hvilket er, hvad relationelle systemer er gode til. Når du har en tabel med dele, og disse dele er knyttet til ordrer, og disse ordrer er knyttet til mennesker, har du en forretningsproces, der kan modelleres strengt og sandsynligvis ikke ændres i din virksomheds levetid. Imidlertid skal en ny algoritme for at finde et nyt svindelmønster skrives nøjagtigt og hurtigt og komme online, idet forretningsbeslutninger inden for et par dage i det mindste, hvis ikke hurtigere, tages. En NoSQL-løsning til denne form for registreringssystem er virkelig et fantastisk system for disse fyre, fordi det giver dem mulighed for at indtage data meget hurtigt såvel som at opbygge nye algoritmer, så ikke bare en ny kundeoplevelse i adressering af mobil, men virkelig bygger ud en lang række nye applikationer.
Hvad vi ser på lang sigt hos Aerospike er det faktum, at hver databasetype, hvert fysisk layout af data på disken har sine egne komponenter, og på Aerospike er vi virkelig fokuseret på denne nøgleværdi eller det rolleorienterede system, som Robin sagde, med høj transaktionskonsistens, og tillader virkelig mennesker at lide kolonnebutikker og højvolumen-datasøer og såvel hardcore-transaktionssystemer, der også har haft rapporteringsbegrænsninger for dem. Vi ser dem alle have brug for at fodre ind i en række forskellige forespørgselsmotorer. Vi ser nogle af de JSON-baserede forespørgselsmotorer. Vi ser ting som elastisk søgning, vi ser Spark, der alle har brug for forskellige sorter på forskellige tidspunkter af ting som kolonnebutikker, samt rækkebutikker, hvor Aerospike udmærker sig.
Vi ser virkelig, at disse forskellige typer og branchen er ved at komme til et punkt, hvor det at vælge det bedste racet af hver enkelt af disse vil være en nødvendighed. Desværre på grund af virkeligheden med langtidsanalyse og batchjob vers-analyse og operationelle begrænsninger, kommer vi sandsynligvis ikke til det punkt, at vi har en enkelt, en størrelse, der passer til alle, men vi vil komme til det punkt at være i stand til at vælge klart mellem nogle af de vigtigste datalayouts.
Lad os tale et øjeblik om innovationen af flash. Jeg får stadig spørgsmålet, selvom som tidligere blev kommenteret, har flash været med os nu i lang tid. Da vi startede Aerospike i 2009 var det, da jeg tror, 2009 måske, ja, 2009 var da Intel kom ud med X25, som virkelig var det første massemarked SATA bemandet flashdrev, og der var en række flash-systemer før det, men det var virkelig den, der brød ind i en masse teknologis bevidsthed. Fusion-io bragte virkelig flash til det bredere virksomhedsmarked efter det.
Hvad der sker nu er fremkomsten af et system kaldet NVMe. NVMe er en standard, der ligner SATA eller SAS eller endda SCSI, der gør det muligt for forskellige kortudbydere at interoperere med drivere i operativsystemet på et højt effektivitetsniveau. Så det skaber et større ydeevne, først og fremmest fordi NVMe er baseret på PCIE som dens underliggende transport, som er meget hurtigere end SATA, SAS eller noget andet, men også det giver chauffører bedst muligt.
F.eks. Inden for Linux er der denne fyr Jens, og Jens er NVMe-driverguiden, Jens expo, og han gør et bedre job end noget individuelt tn Intel eller Fusion-io kunne have gjort med deres individuelle driver, med alle deres ressourcer. Når du har styrken i selve operativsystemet til at kunne bygge den bedste driver, ser vi nogle virkelig fantastiske niveauer af ydeevne. Alt dette sikkerhedskopierer ideen om, at flash virkelig kan give meget af den lave latenstid for RAM.
Nu er Aerospike stadig en stor RAM-database på grund af sin klyngemodel, men vi finder ud af, at når du først er i gang med et netværkshopp, som du har brug for skalerbar lagerplads, bruger du allerede mindst fem til 50 mikrosekunder, ekstra 70 mikrosekunder NAND er normalt ikke en hindring, og du kan lige så godt bruge flash, i betragtning af at NAND-flash, i betragtning af at netværket allerede er involveret i det. Mange mennesker undrer sig over, hvordan det lyder godt, hvis du køber din egen hardware. Hvordan har det med de offentlige skyer? Jeg tror, du finder lige nu, uanset hvilken offentlig sky du bruger, disse offentlige skyer har meget stærke flash-tilbud. Det adskiller sig lidt fra skyudbyder til skyudbyder. Amazon har sine I2-forekomster, der har været ude for jeg tror, at et år, to år nu, det er virkelig flash af høj kvalitet, der udtænkes, og Aerospike har implementeringsmønsteret ovenpå.
Jeg vil gerne opfordre Google Compute, Google Compute Engine, Google Cloud specifikt, fordi de ifølge vores erfaring hidtil har nogle af de højeste ydelsesenheder og nogle af de mest fleksible med hensyn til implementeringsmønstre. Men du kan også se nye implementeringsmønstre som Pivotal, som er en slags offentlig / privat, så du kan gøre rigtige Pivotal-apps begge steder, der understøtter flash og understøtter forskellige lagerenheder såvel som Docker-mønstre. Så virkelig, dette er et punkt i historien, hvor flash ikke kun er tilgængelig for dig at købe og placere i dine datacentre, men virkelig er sunket gennem alle infrastrukturudbydere, fordi det virkelig er den bedste måde at få høje IOPS-systemer på en meget rimelig forsinkelse.
Bare et øjeblik om Aerospike - Aerospike er en klyngedistribueret database, som gør den meget tilgængelig til sky-stil-implementeringer såvel som datacentre. Vi finder ud af, at fleksibiliteten ved at være i stand til at tilføje flere data og mere ydeevne er absolut nødvendig i disse netto nye applikationer, fordi du starter et projekt, du ved ikke, om du har brug for 50.000 transaktioner pr. Sekund, hundrede tusind, en millioner, to millioner, så du vil give dig selv noget rum for at være i stand til at tilføje servere. Og alligevel vil du skalere op, så hver server er i stand til at være hurtig på egen hånd. Du ønsker ikke rigtig at ende med fem hundrede eller tusind servere, der er databaseservere, der er langsomme. Skala ud er ikke det eneste spil i byen, dets skala ud og skalering op, som Dez sagde tidligere, der er en ny Z-akse.
Forhåbentlig giver det dig nogle nye ideer om, hvordan hastighed og skala adresserer nye markeder, og måske er der projekter, som du arbejder med, hvor du kan overveje at virkelig bygge ud mere rige applikationer og bruge en applikationsramme med en mere nøgle værdi eller NoSQL-database under den. Hos Aerospike har jeg bestemt set en masse af vores kunder, og mange af vores open source-brugere lykkes med det mønster, og jeg ser frem til, at branchen i højere grad vedtager det.
Rebecca Jozwiak: Tak så meget Brian, og jeg er sikker på, at Dez og Robin har nogle gode spørgsmål til dig. Robin?
Dez Blanchfield: Jeg er glad for at hoppe ind. Robin, har du et spørgsmål? Ellers har jeg en hurtig, jeg kan starte.
Robin Bloor: Beklager, jeg var stille. Jeg dykkede ind, men ingen hørte mig. Spørgsmålet fandt mig straks op, fordi dette er et meget sofistikeret sæt teknologifunktioner. Hvad angår de eksisterende kunder, du har, hvad er den type eskalering eller transaktionsrate, som du oplever vedrørende nogle af disse annonceapplikationer? Fortsætter transaktionsrenten? Og i bekræftende fald, hvilken type sats?
Brian Bulkowski: Interessant spørgsmål, Robin. Hver branche har sin egen kurve i hver virksomhed. Lad os tage nordamerikansk reklame, for eksempel siger, at nordamerikansk reklame formentlig kørte nærmere 200.000 annoncer pr. Sekund, i form af standard intraday, ikke min tid, og det er nu eskaleret sandsynligvis til ca. tre til fem millioner annoncer pr. Sekund. Men så skete der en interessant ting. Annoncebranchen begyndte at tackle nogle svindelproblemer, og de dele af branchen, der er i stand til at blokere for svig, så transaktionsrater falde lidt, omkring en faktor to, inden for nogle af vores mere sofistikerede kunder, der var i stand til at bestemme svig. Selvfølgelig måtte de foretage nogle databaseopslag for at blokere for svig, så det ender med at blive slags det samme til sidst.
En interessant brugssag er inden for telekommunikation, det nævnte jeg ikke rigtig, telekom så transaktioner stige på grund af fakturering baseret på hver eneste pakke, der passerer over mobiltelefonnettet. I gamle dage ringede vi detaljerede poster, og en gang et minut, et opkald, hvad du ved, en lille ping ville gå gennem netværket, og har denne fyr stadig et minut tilbage? Nu er vi nødt til at opbygge og endda rute baseret på enhver pakke på internettet. Det er en - ked af det inden for et mobilnetværk, som pludselig nu er millioner af pakker i sekundet og noget, der vokser igen og igen. Så en sag er, at hver applikation kører en dejlig lille slags 2X pr. År. Inden for nogle kunder ser vi: ”Men vent, jeg har en ny applikation. Jeg vil tilføje noget svindel til min risiko. Jeg vil tilføje nogle dybere kundeoplevelser til min svig og min risiko. ”Hver enkelt af dem skaber ny belastning på den underliggende database.
Robin Bloor: Ja, jeg mener, at det var, hvad jeg antydede i den korte præsentation, som jeg gav, at disse - vi plejede at tro, at en transaktion er, nogen gør noget, og måske er der en kaskade af begivenheder, og det hele bliver optaget, og nu har mange transaktioner en enorm mængde opslag, og du gav nogle eksempler i præsentationen. Og derfor udfører du faktisk ikke længere en transaktion, du udfører faktisk en slags applikation, der kan have mange, mange elementer til det.
Det andet spørgsmål, før jeg overleverer til Dez - fordi vi tydeligvis mærker teaming om dette - det andet spørgsmål, som jeg gerne vil have, at du skal svare, hvis du har et rimeligt svar på det, er både Dez, og jeg forventer, at Internettet Ting eller Internettet med alt, som det undertiden kaldes, for at skabe en temmelig dramatisk mængde af transaktionstrafik. Kan du tale med det? Er det din oplevelse, har du fået kunder, der kommer til dig med den særlige form for problem, og hvad er din syn på dette i øjeblikket?
Brian Bulkowski: Ja, jeg tror, der er lidt forvirring, og det er mildt sagt om tingenes internet. De kunder, som jeg ser indtil videre, bringer blot internettet til de ting, de har. Tænk på disse Amazon-knapper - det hele er Amazon - disse knapper, du kan ikke genbruge dem og få dem til at gå til Walmart online. Det er ikke som en browser, at du kan mikse og matche alt. På den anden side sker maskin-til-maskine, og når du tilslutter din Tesla-bil for at oplade den, sender Tesla en enorm tilbagestrøm af information, hver eneste sensor ind i bilen, men den flyder ind i Teslas computer til analyse og forbedret kvalitet. Det, jeg ser, er, at al den maskine-til-maskine og alle sensorer i et individuelt firma skaber nye krav.
Nu for det meste i dag, der flyder ind i disse analysesystemer og tager sagen om Tesla; Teslas første brug af dette, efter min forståelse, var at forbedre batteriets levetid under ”Hvilke driftstemperaturer er de, hvad er belastningen? Lad os se på det, lad os designe et bedre batteri. ”Men så begynder de at tænke, og det er alt sammen godt, det er slags et dybt analyseproblem, der er fascinerende, det næste spørgsmål er, “ Hvordan forbedrer jeg oplevelsen fra øjeblikket til øjeblik ?”
Lad os nu tage sagen som Nest, hvor du prøver at forudsige analyser for at ændre et husets temperatur øjeblik for øjeblik. Det er den slags tilfælde, hvor vi begynder at se i Aerospike, hvor der er denne enorme datasø, og der er denne enorme analytiske processer, men hvad skal jeg gøre nu? Jeg bliver nødt til at beholde, tænke på det som kontanterne, en del af den sidste uge, den sidste måned, måske endda bare den sidste dags værd af information, sandsynligvis på en bagenden, fordi vi har at gøre med simpel sensor enheder, og jeg vil lave et sæt analyser på det øjeblik for øjeblik for at ændre oplevelser. Den slags redenlignende oplevelser, en, som jeg ser Aerospike bruge sager til.
Robin Bloor: Okay, den ting, som jeg forventede med Internet of Things, var, at du ville begynde at få tærskeludløsere, og at de ville begynde at oprette kaskader af begivenheder. Har du set noget lignende, eller er det ikke noget, du har set endnu?
Brian Bulkowski: Dez og jeg var - jeg spurgte bare Dez's mening om det, da vi før-show chatte. Hvad jeg endnu ikke har set, er den slags kaskade af et selskabs data, der kaskader ind i et andet firma, at mit Samsung køleskab taler med min LG vaskemaskine, fordi det bare regnede ud, at jeg spildte en hel flok chokolade over hele gulvet, så den slags selskab til virksomhedsenhed efter enhed, det tror jeg stadig venter på med hensyn til Internet of Things. Jeg tror, der er nogle problemer inden for forretning og sikkerhed, der stort set er ikke-tekniske, der skal besvares for at se det.
Robin Bloor: Okay, december?
Dez Blanchfield: Jeg har nogle meget stærke synspunkter på det bestemt sidste punkt faktisk, som jeg bare kort vil bringe ind i samtalen. Jeg tror, at virksomheder og teknologi ofte tror, at de faktisk kører, hvor efterspørgslen kommer fra, men når vi ser på, hvad der skete, da iPhone blev en ting, og i mine tanker var det slags den første mobile enhed, hvis du vil benåde ordspillet, men en enhed, der kunne bæres rundt, der faktisk kan køre masser af små apps i lommen, og det medførte en betydelig transformation af hvad vi tænkte på at være en computer. Mange mennesker tænker på iPhones eller smartphones eller Android-telefoner som telefoner, men det er de ikke, de er faktisk bare en lille computer, der kører apps, og en af de apps, den kører, ringer op, og de er ikke opkald, som vi tænker på længere, de er ikke et analogt punkt-til-punkt-opkald, som Brian fremhævede, de er små pakker, der bliver dirigeret rundt.
Men oftere end ikke, hvad vi har set, er denne opstand af smartphones, der faktisk ikke rigtig bliver brugt til at ringe til, at sandsynligheden 98% af, hvad jeg laver på min smartphone, ikke er opkald. Det er alt andet end opkald, det er apps. Jeg tror, denne cascading-effekt - og jeg er meget interesseret i at bringe dette hurtigt til et spørgsmål - men den cascading-effekt er faktisk skabt af forbrugere, og faktisk har jeg denne ene foring, som jeg smider ganske ofte ud for at få en masse CXO'er at sidde op i rummet og være opmærksom, hvis jeg tror, de falder i søvn med den præsentation, jeg holder på, hvilket ikke sker for ofte, forhåbentlig.
Jeg har sagt det i den forstyrrelse, som du ser i din virksomhed, faktisk ikke udelukkende drives af teknologi, det er oftere end ikke at blive drevet af dine kunder. Og de sidder slags og tænker faktisk, hvad mener han der? Så når jeg tænker på brugen af teknologi, mener jeg, at vi så USENET, vi så alle disse slags sjove ting ske på internettet, men ikke mange forudsagde sociale og virkningen af det. Alle, der ville fortælle alle, hvad de havde til morgenmad, og den støj, der skabte, og den backend-teknologi, vi havde, og så prøver vi selvfølgelig at reklamere for at fylde den op med ting.
Jeg tror, vi vil se en forbløffende effekt til et punkt, hvor enheder taler til enheder, forbrugerne er lige ved at indhente hvad det faktisk betyder, og hvad det kan gøre. Du rejste et interessant punkt rundt, hvorfor Amazon-knappen ikke vil tale med Walmart. Jeg vil stille dette spørgsmål, hvad sker der, når Walmart får deres egen knap, og hvad så med, hvis de 20 øverste Amazons og Walmarts og andre større distributions- og detailnetværk alle får deres egne knapper? Hvor tager det os? Specifikt vil mit spørgsmål med Brian være: ”Hvor skal vi hen med dette helt nye performance-paradigme? Du er i den blødende kant af det, og du arbejder med virksomheder, der gør det på både det fysiske infrastrukturniveau og det overførende dataniveau. Hvor tager dette os, når denne næste store bølge kommer? Hvilken slags indsigt kan du dele omkring det med hvad der sker i bagenden fra din oplevelse? ”
Brian Bulkowski: Selvfølgelig, hvordan jeg tænker på en masse af disse ting er at fokusere på brugeroplevelserne og nøjagtigt hvad du sagde, det er brugerne, der driver, selvom vi som teknologer og forretningsfolk måske møder en smart idé, som vi tror, brugerne kan lide, og jeg vil slags gå tilbage til Nest-eksemplet. Da min søster installerede Nest i sit hus, sagde hun: ”Mit hus er mere støjsvag, jeg kan høre ting. Det er ikke engang bare at jeg betaler mindre for strøm, ”er hun, men du kunne nu ikke rive det rede ud af hænderne, fordi hun kan lide at være i et mere støjsvagt hus i modsætning til et, hvor opvarmningen blæser på maksimalt og derefter slukke igen.
Spørgsmålet ender med at være, hvad er brugeroplevelserne, som vi kan styrke? Det ender med at blive den livskvalitetsoplevelse, at hvis vi har pengene og vi er i den første verden, ville vi betale meget for. Jeg giver dig et eksempel fra mit eget hus, min kæreste kan lide kold mælk. Hun kan godt lide kold mælk, og så ofte er vi nødt til at finde ud af, hvor i køleskabet vil være koldt nok, og ikke have resten af tingene til at blive overophedet. Dette er godt - og jeg sagde til min kæreste, “Vil du betale $ 10 om måneden for at have kold mælk og ikke for at have frosne pålæg?” Hun var som “Absolut.” Og at få $ 10 om måneden ud af enhver forbruger er hård.
Jeg tror, at vi i disse oplevelser virkelig er nødt til at holde øje med, hvad der er den forbrugersluttende oplevelse, der virkelig kunne drives. Jeg tror, det var en del af hemmeligheden bag iPhone. Jeg tror, det er en del af hemmeligheden bag, at Tesla bygger en bedre bil med alle data, afskaffer ideen om en produktcyklus og en årlig frigivelse og foretager løbende forbedringer på alle dele. Vi bliver nødt til at komme med nogle smarte ideer til, hvordan man faktisk bruger alle disse data på en måde, der er overbevisende øjeblik for øjeblikke til folks liv.
Dez Blanchfield: Ja, det er stor indsigt. Ved at gå videre fra den anden ende af spektret, der ekko nøjagtigt med den slags ting, vi ser nu, med hvad forbrugerne beder om, og vi alle har noget i huset, der er koldt af dette og varmt af det. Den anden ende af spektret er så, og vi har set dette i form af den traditionelle "big data-verden", hvor dataopgaver bliver sjældnere end hønse tænder, og dem, der er på markedet, der tilbydes mere end CIO'erne tjener i nogle tilfælde er det de typer virksomheder, du arbejder med, og de typer af udvikling, du har set, er det tilfældet, at typerne af udvikleren og typen af dataarkitekt og netværksserviettene, bliver de sværere og sværere at finde ? Har vi brug for organisationer, der skal begynde at tænke nu på at komme foran kurven for den type færdighed, de har brug for i bagenden for den type udviklere, og dataarkitekter? Hvad ser du på dette niveau for så vidt angår de færdighedsressourcer, som de vil forstå, hvordan de kan bruge denne teknologi til god brug nu ser ud?
Brian Bulkowski: Ja, jeg tror, det er en af udfordringerne for de organisationer, jeg har talt med. Uanset om det er a - de værste problemer, jeg har hørt om, er faktisk slags større virksomheder, for hvis du siger: "Jeg kommer fra denne store bank, jeg er fra Chase og jeg var en dataarkitekt, " så er du Vi har verdens din østers, og din løn går op, så der er dette kerneproblem ved at få et job et af disse steder, fordi der ikke er nok mennesker, og derefter være i stand til bare at flytte fra job til job. Jeg hører intet andet end den slags problemer, og det er faktisk en af grundene til, at jeg har fokuseret Aerospike omkring at bruge værktøj, der passer til det særlige projektteam.
I stedet for at prøve at gå ind i et projektteam og sige: ”Hej, du skal bruge vores forespørgsel sprog.” Se, hvis disse fyre, de kører bussen i disse dage, fyre og gals, og hvis de bruger et bestemt forespørgselssprog og værktøjsmæssigt vil de holde sig til det, og jeg kan ikke tale dem til noget andet. Mit mål er at være i stand til at placere den slags Aerospike-magt som en database bag det værktøj, de bruger, og det er en del af denne idé, de lysbilleder, du ser om fremtiden til Poliglot-databasen. Jeg er nødt til at støtte mønstre for anvendelse og analyse mellem disse fyre, fordi det virkelig er svært at prøve at finde mennesker, der har den matematiske baggrund såvel som de statistiske evner til at navigere i denne verden.
Dez Blanchfield: En anden interessant ting, som folk måske ikke er opmærksomme på, jeg mener Aerospike er en meget stærk spiller i open source-verdenen, jeg er ivrig efter at få en meget hurtig indsigt i slags hvad det betyder så langt som virksomheden fungerer, og hvad den gør for dig. Du nævnte, at du arbejdede direkte med folk, der laver ting helt ned til kerneniveauet inde, så Linux-kernen. Der er nogle store spillere, der er i dette rum, og der er nogle berømte mærker, som vi ikke vil nævne, men en organisation som Aerospike, i din mere moderne nyere historie, open source-oplevelsen, hvordan passer det ind i det store billede og hvilke konkurrencefordele har du set, der giver dig?
Brian Bulkowski: Selvfølgelig, da vi skiftede til open source i 2014, gjorde vi det, fordi vi indså, at en kerneinfrastruktur, ligesom en database skal være tilgængelig kilde, den skal stole på og en naturlig modbalance mellem den gamle verden af lukkede kilde, og når du først har investeret i en bestemt database, har disse fyre dig pris på teknologicyklus efter teknologicyklus, og der skal være en balance. Vi skal være i stand til at få frem versioner, der gør nye ting, og måske er det i en virksomhedsversion, vi er nødt til at have en dobbeltlicensmodel, der har en open source-version til folk, der sparker i dækkene, der laver nonprofit-arbejde, samt en virksomhedsversion, der er en indehaverlicens og tillader ubegrænset arbejde.
Og selvfølgelig har vi også de højeste niveauer af hastighed og skala, idet vi er en virksomhedsversion. Vi tror på model for duel-licens, og det har været godt for vores forretning. Vi ønsker, at folk skal komme i gang med Aerospike, vi vil have små projekter til at sparke dækkene, det er super let at bare gå til Amazon, starte et bekræftelsesscript og have en Aerospike-klynge, der kører inden for fem minutter. På den anden side ønsker vi at give mere til virksomhedskunderne.
Dez Blanchfield: Vi er lige ved at komme tæt på toppen af timen, så jeg kommer til at vende tilbage til Rebecca om et øjeblik, men hvis der kun var en linjefart, som du ville smide derude, slags råd du ville give til folk der ønsker at komme ind i rummet på den teknologi, du har bragt til markedet, og hvordan de vil vedtage det, hvad ville du sige, at det første skridt for dem er at sortere i det mindste at dyppe deres tå og begynde at se på, hvordan de får en konkurrencefordel fra din platform?
Brian Bulkowski: Selvfølgelig, en del af beskeden her er, at der er niveauer af hastighed og dygtighed, der nu er let. Du behøver ikke en tusindnodet Cassandra-klynge for at opnå millioner af transaktioner pr. Sekund. Du kan gøre det selv i de første faser af dit projekt. Så tingene er meget lettere, end de plejede at være. Så er det andet råd, at du bliver nødt til at komme med, ligesom du siger, matematiske forretningsprocesser, kundemedarbejdsmodeller, der bruger alle disse data, så den gode nyhed er, at dataene er tilgængelige, dårlige nyheder er, at du faktisk er nødt til at finde nogle mønstre og nogle tvingende brugssager.
Dez Blanchfield: Ja, gode råd, så jeg vil give tilbage til Rebecca nu. Tak så meget for det, det var en dejlig lille chat om teknologien, jeg sætter pris på det.
Rebecca Jozwiak: Tak, Dez. Jeg har et par gode spørgsmål fra publikum. Lad mig kaste dette lysbillede op. Jeg ved, at du talte om systemet med poster og mainframe-ting, men hvor ofte ser du absolut offloading, eller er replikationen en afslutning på dagen, slags hvad du ser mere af?
Brian Bulkowski: Det, vi ser i Aerospike, bruger en NoSQL-database foran det sidste dags forsoningssystem. Du har brug for intraday, det rigtige svar. Du kan ikke have det forkerte svar, og det var, hvad Robin sagde om aktiv, er undervurderet, men forretningsprocesserne omkring de juridiske krav til forsoning kan blive ret komplicerede, og der er årtier med teknologi og årtier med lov og lovpraksis omkring forsoning. Så hvad vi ser på Aerospike er, at du laver dine algoritmer i en varmere database med flere transaktioner pr. Sekund. Men af juridiske grunde har du absolut brug for et forsoningssystem, der har været gennem disse juridiske processer. Vi ser begge dele, og vi ser, at dette i det væsentlige er to-lags it-praksis, som de udsættes af mennesker som Anderson Consulting og Gartner til en vis grad. Vi ser meget af det.
Rebecca Jozwiak: Okay, god. En anden viste interesse for netop dette lysbillede, han sagde, at det var virkelig interessant og spekulerede på, om du bare kunne gå ind i en lidt mere sammenligning af flash versus i hukommelsen.
Brian Bulkowski: Selvfølgelig, lad mig tage en hurtig sidestang, igen, jeg ved, at vi er tæt på slutningen af tiden. Nå flash er hukommelse - det er chips - Jeg har en tendens til at tænke på RAM. Så RAM har særlige egenskaber, kræver en masse magt, det er meget godt til tilfældige skrivninger såvel som tilfældige læsninger. Hvor NAND er i stand til hurtig tilfældig læsning og lavere magt, men det er meget dårligt ved tilfældige skrivninger. Der er nogle subtile forskelle i, hvordan disse to chips fungerer på litografiniveau, der skaber en række tekniske forskelle.
I det tilfælde, hvor du laver analyse, og du skal springe over en masse data, eller i Aerospikes tilfælde, hvor du fik indekser, er indekser stadig meget gode at bruge i RAM på grund af parallelitet og tilfældig adgang. Et højere niveau af tilfældig adgang er påkrævet. I Aerospike finder vi dog, at vi bruger disse indekser til at finde et bestemt objekt eller en masse data, det er det rette sted at nå ud til et NAND, fordi det bliver en slags større butik under indekserne. Dette er en transaktion til en lagerenhed, men stadig efter at have udført en masse potentialer og filtre i dit indekseringssystem.
Rebecca Jozwiak: Okay, god. Og så ved jeg, at vi allerede har talt meget om IoT, og en deltagende kommentar sagde, at IoT i vid udstrækning er gavnligt, men er virksomheder, regeringsenheder og udviklere, der vokser sikkert og sikrer data i samme takt, tror du?
Brian Bulkowski: Måske vil Dez, vil du springe ind?
Dez Blanchfield: Ja, jeg er glad for at hoppe ind i den. Jeg tror, svaret er nej. Faktisk er en af mine foretrukne kastelinjer om dette emne meget, meget kort, at jeg tror, at eksplosionen fra maskine til maskine og generelle tingenes internet, kommunikation og sikkerhed, risikoen omkring det, vi er på det punkt, hvor regeringer kan ikke følge med på ændringsfrekvensen. Og faktisk ved vi, at mange organisationer ikke kan følge med i ændringshastigheden. Faktisk, hvis jeg omskriver det, er ændringshastigheden i dag så stor, at organisationerne er nødt til at sprint bare for at holde trit, men de er nødt til at sprint i flere løb. Jeg tror ikke, at loven, og jeg tror ikke, at regeringen generelt, hverken statligt eller føderalt niveau, er i stand til at holde trit med ændringshastigheden.
Nu er min generelle råd til mennesker en slags handling nu og beder om tilgivelse senere. Der har været mange eksempler på det i fortiden. De vil indhente det, men jeg tror, det er virkelig op til forretningsudbydere og teknologileverandører at slags innovere i dette rum og sikre, at vi er bekendt med sikkerhedsrisici eller privatlivets risiko, og at vi er nødt til at håndtere dem. Især banker, som du nævnte, når du tænker over, hvad en bankorganisation traditionelt har gjort med ting som anti-hvidvaskning af penge og kender din klient, AML / KYC-udfordringen, plejede det at være hvert tredje til femte år vi ville prøve og imødekommer overholdelse.
Nu tror jeg, at det skal indbygges i hver enkelt transaktion. Du har altid været i stand til at gøre det på budniveau med reklame og aktie- og obligations- og aktiehandel, jeg tror, vi er på det punkt, hvor den ydelse, du skaber med Aerospike-platform, giver os mulighed for nu at tænke over, hvordan vi bringer privatliv, hvordan bringer vi sikkerhed ind i den øjeblikkelige beslutningstøj i realtid? Og så er svaret nej, jeg tror ikke, at regeringer følger med. Jeg tror, virksomheder skal følge med, og jeg tror, vi er nødt til at handle nu og bede om tilgivelse senere.
Brian Bulkowski: Lad mig også tilføje et par point. De fyre, jeg beskæftiger mig med, teknologiselskaberne, jeg handler med, er meget opmærksomme på at sikre, at de er på den rigtige side af loven, og en god del af diskussionen er, er dette PII, kan jeg bruge dette, hvordan er Bruger jeg denne særlige del af data? Hvad var dens forsyn, og er dette en beskyttet beslutning eller oplevelse? Hvordan gør jeg alt det? Så det er den gode nyhed. Nogle gange undrer jeg mig over vores diskussion som et samfund, hvor vi er på vej hen, og hvis endda vores samfundsdiskussion er på det passende niveau med hensyn til at bruge de nye muligheder fra IoT helt op til maskinlæring, hvilket er den eneste måde at sortere gennem de mængder data, vi har. Men den gode nyhed er, at de fyre, jeg talte med, virkelig er på den rigtige side af at prøve at gøre det rigtigt ved de juridiske beslutninger, vi har truffet.
Rebecca Jozwiak: Det er nogle virkelig gode svar fra jer begge, og jeg er helt enig. Jeg tror ikke, at sikkerhed bevæger sig i så hurtigere tempo som teknologiudvikling, især når det kommer til tingenes internet, men jeg er nødt til at tænke på, at folk gør deres bedste, og forhåbentlig vil vi komme dertil. Det er altid lidt svært at forblive ti trin foran cybertyve og cyberkriminelle, men vi kommer dertil.
Nå folkens, vi er gået otte minutter forbi toppen af timen. Jeg vil gerne takke vores gæster Brian Bulkowski fra Aerospike og Dez Blanchfield og Robin Bloor. Mange tak. Du kan altid finde vores arkiver på insideanalysis.com, SlideShare, YouTube, vi har mange gode webcasts der kommer folk, det har været en travl måned. Det bliver en travl måned næste måned, så hold dig tunet, og vi håber at se dig næste gang. Tak folkens, farvel.