Af Techopedia Staff, 25. august 2016
Takeaway: Vært Rebecca Jozwiak diskuterer fænomenet indlejrede analyser og borgerdata-forskere med Dr. Robin Bloor, Dez Blanchfield og David Sweenor.
Du skal tilmelde dig denne begivenhed for at se videoen. Registrer dig for at se videoen.
Rebecca Jozwiak: Mine damer og herrer, hej og velkommen til Hot Technologies. ”Embed Everywhere: Enabling the Citizen Data Scientist” er vores emne i dag. Jeg udfylder til din sædvanlige vært, dette er Rebecca Jozwiak, der udfylder til Eric Kavanagh. Ja, dette år er varmt. Især har udtrykket "datavidenskabsmand" fået en masse opmærksomhed, selvom vi plejede at kalde dem kedelige navne som "statistiker" eller "analytiksexpert", stort set at tackle den samme type aktiviteter, men det har fået et sexet nyt navn, og det er indsamle en masse opmærksomhed. De er meget ønskværdige at have på arbejdspladsen, gavnlige for organisationen, og alle vil have en. Men de er: 1) dyre, 2) svære at finde. Du ved, det har været over nyhederne om mangelen på datavidenskabsmand, ja, men alligevel tilbyder de enorm værdi for organisationen, og folk kæmper slags for at finde ud af, hvordan man får denne værdi uden at skulle droppe krone, så tale.
Men den gode nyhed er, at vi ser værktøjer og software komme ud, som kompenserer for den mangel. Vi har automatisering, maskinlæring, indlejret analyse, og det er det, vi skal lære om i dag, og det er slags givet anledning til dette nye udtryk, "borgerdataforskeren, " og hvad betyder det? Nej, det er ikke din uddannede dataforsker, det kan være din forretningsbruger, din BI-ekspert, nogen fra IT, nogen der har baggrunden, men måske ikke nødvendigvis ekspertisen. Men hvad det gør, disse værktøjer og softwaren, er, at det giver flere mennesker adgang til disse smarte løsninger, selvom de muligvis ikke kender den dybe kodning. Men det hjælper bare med at forbedre ydeevnen generelt, når du giver alle lidt mere adgang til den analytiske tanke. Du behøver ikke at have træningen nødvendigvis for at have den type nysgerrighed, der kan føre til god indsigt for din virksomhed.
Når vi diskuterer, at med os i dag er vores egen Robin Bloor, chefanalytiker i Bloor Group, en af de undvigende datavidenskabsmænd, Dez Blanchfield, der kalder ind, og så har vi David Sweenor fra Dell Statistica vil give os en præsentation i dag. Og med det overfører jeg det til Robin Bloor.
Robin Boor: Okay, tak for den introduktion. Jeg tænkte lidt på dette i en historisk kontekst. Hvad vi faktisk ser på her er et af Leonardo da Vincis design til en slags svævefly, som en mand kunne lægge på ryggen. Jeg aner ikke, om det rent faktisk ville fungere. Jeg ville ikke komme ind på det, må jeg sige. Imidlertid, da Vinci, når jeg tænker på da Vinci, tænker jeg på ham som en af de mest nysgerrige og analytiske mennesker, der nogensinde har eksisteret. Og det er helt klart, hvis man bare ser på den svævefly, at den er designet på basis af en fuglvinge, og han på en eller anden måde har undersøgt fuglernes flyvninger for at bygge den.
Hvis vi tager det historiske perspektiv - jeg faktisk så dette op - er analyse måske den ældste anvendelse af matematik. Der er folketællinger, der dateres mindst i babylonisk tid. Vi ved om dette, fordi der dybest set er nogle kileformede tabletter, der har sådanne data om dem. Det vides ikke, om der var noget, der gik tilbage tidligere. Men det åbenlyse er, at du har en civilisation med en stor befolkning af mennesker, det kræver faktisk planlægning, og det er værd at vide, hvad du planlægger, og hvad kravene til disse mennesker faktisk er.
Og det er slags, hvor det begyndte, og det er også, hvor computeren begyndte, fordi de tidlige computere, de tidlige mekaniske computere faktisk var, tror jeg, den første var folketællingen oprettet af Hollerith, som blev IBM, tror jeg. Alt dette er gået fremad. Der har været en form for mellemvær mellem måske 1970'erne og i dag, hvor der er et stort antal andre applikationer og analyser, kan du sige, tog plads på bagsiden. Ja, der foregik analyser - det foregik i store organisationer, især banker og forsikringsselskaber, og faktisk General Electric og telco og lignende ting - men det blev generelt ikke brugt i hele virksomheden, og nu begynder det at blive brugt generelt i hele forretning. Og det har virkelig ændret spillet. Den første ting, jeg troede, jeg ville henlede opmærksomheden på, er datapyramiden, som jeg især kan lide. Dette er, jeg mener, at jeg trak en af disse for 20 år siden - mindst 20 år siden - for at prøve at forstå, virkelig, på det tidspunkt, forsøgte jeg at forstå BI og nogle af de tidlige data mining, der blev udført. Hvad jeg har defineret her er idéen om data, og eksemplerne er signaler, målinger, optagelser, begivenheder, transaktioner, beregninger, aggregeringer, individuelle informationspunkter. Du kan tænke på dem som molekyler af information, men det er individuelle punkter. Det bliver information, så snart det får kontekst. Koblede data, strukturerede data, databaser, visualisering af data, plottere, schemere og ontologier - de kvalificerer alle efter min mening som information, fordi det, du har gjort, samler en masse variation sammen og skabte noget meget mere end et datapunkt, noget der faktisk har en form, en matematisk form.
Over det har vi viden. Ved at undersøge information kan vi lære, at der er forskellige mønstre, og vi kan udnytte disse mønstre ved at formulere regler, politikker, retningslinjer, procedurer, og så tager det form af viden. Og stort set alle computerprogrammer, uanset hvad de laver, er viden af den art, fordi de arbejder imod data og anvender regler på dem. Vi har disse tre lag, og der er en stigende forfining, der foregår mellem lagene. Og på venstre side af dette diagram får du vist nye data, der indtastes, så mange af disse ting er statiske. Dataene akkumuleres, informationen samles og viden potentielt vokser. Øverst har vi ”forståelse”, og jeg vil fastholde, selv om det er et filosofisk argument, at forståelse kun bor i mennesker. Hvis jeg tager fejl i det, bliver vi alle erstattet af computere på et tidspunkt. Men snarere end at have debatten, går jeg videre til det næste lysbillede.
Da jeg kiggede på dette, den interessante ting, dette er noget, der var nyligt, det interessante var at prøve at finde ud af, hvad analytics faktisk var. Og til sidst ved at tegne forskellige diagrammer og ende med et, der så sådan ud, kom jeg til konklusionen, faktisk, analyseudvikling er virkelig bare softwareudvikling med en frygtelig mængde matematiske formler. Analytisk efterforskning er lidt anderledes end softwareudvikling i den forstand, at du rent faktisk ville tage mange, mange forskellige modeller og undersøge dem for at generere ny viden om data. Men når du først har genereret det, implementeres det enten i det, jeg synes om som passiv beslutningsstøtte, som er information, der bare er fodret op til en bruger; interaktiv beslutningsstøtte, som er ting som OLAP, hvor brugeren får et struktureret datasæt, som de kan undersøge og udlede ting for sig selv ved hjælp af de forskellige tilgængelige værktøjer. En masse visualisering er sådan. Og så har vi automatisering, hvis du bare kan vende en vis analytisk indsigt, som du har samlet til et sæt regler, der kan implementeres, behøver du ikke nødvendigvis et menneske for at blive involveret. Det var den slags måde, jeg så på det, da jeg gjorde alt det. Og forskellige ting begyndte på mig. Når vi først har et aktivitetsområde, skal vi sige, når et datadomæne faktisk er udvindt, grundigt udvindet, grundigt udforsket gennem enhver mulig retning, til sidst bliver det bare krystalliseret BI. Den viden, der er opfundet, begynder at blive viden, der informerer forskellige brugere på forskellige måder og øger deres evne, forhåbentlig, til faktisk at udføre det arbejde, de udfører.
En af de ting, jeg har bemærket, og jeg har kigget på forudsigelig analyse i omkring fem år, men forudsigelig analyse er ved at blive BI, i den forstand, at det bare bliver til nyttig information, der kan fodres til mennesker, og som jeg allerede har påpeget, der er automatiseret BI-rapportering, BI-eksplorativ, BI, meget forskellige graderinger af det og forudsigelig analyse går faktisk i alle tre retninger. Og den analytiske proces, som jeg påpegede, er ikke så forskellig fra softwareudvikling, bare udført af forskellige mennesker med lidt forskellige færdigheder. Jeg formoder, at jeg skulle understrege, at det kræver mange år at tilegne sig de færdigheder, der kræves for at få en rigtig god datavidenskabsmand. De er ikke let erhvervet, og ikke et stort antal mennesker kan gøre det, men det er fordi det involverer forståelse af matematik på et meget sofistikeret niveau for at vide, hvad der er gyldigt, og hvad der ikke er gyldigt. Analytics-udvikling, opdagelse af ny viden, analytisk implantation, det handler om at gøre viden operationel. Det er den slags baggrund, som jeg ser for hele analysen. Det er et enormt område, og der er mange, mange dimensioner til det, men jeg tror, at generalisering gælder alt.
Så er der forretningsforstyrrelser, som jeg nævnte, at der er en række organisationer, farmaceutiske virksomheder er en anden, der har i deres DNA, de har analyser. Men der er mange organisationer, der virkelig ikke har det i deres DNA, og nu har de evnen, nu er softwaren og hardwaren langt billigere end den plejede at være, nu har de evnen til at udnytte den. Jeg vil sige en række ting. Den første ting er, at analytics er, i mange tilfælde det er F & U. Du bruger muligvis bare analyser på et specifikt område i organisationen, og det kan virke jordisk, at du på en eller anden måde analyserer kundeordrene endnu fra forskellige perspektiver og sammenføjer det med andre data. Men analyser skaber faktisk muligheden for at se på organisationen som helhed og stort set at analysere en bestemt aktivitet, der foregår i organisationen og hele kæder af aktiviteter. Men når du faktisk flytter ind i dette område, vil jeg fastholde, at det er forskning og udvikling. Og der er et spørgsmål, som jeg er blevet stillet et par gange, som er, "Hvor meget skal et firma bruge på analytics?" Og jeg synes, den bedste måde at tænke på at give et svar på, er at tænke på analytik som F & U, og spørg bare, "Nå, hvor meget vil du bruge på F & U inden for effektiviteten af virksomheden?"
Og de virksomheder, der ikke er med analytics, der er en masse ting, som de ikke ved. Først og fremmest ved de ikke, hvordan man gør det. Normalt, hvis de faktisk går på en eller anden måde, vedtager analyser inden for organisationen - de har virkelig stort set ingen anden mulighed end at gå til et konsulentfirma, der kan hjælpe dem med at gøre det, fordi det ville være umuligt eller virkelig meget vanskeligt for de fleste virksomheder til faktisk at ansætte en dataforsker, finde en, betale for en og faktisk stole på dem til at gøre, hvad du vil have dem til at gøre. Meget svært. De fleste virksomheder ved ikke, hvordan man ansætter eller uddanner personale til faktisk at udføre dette arbejde, og årsagen hertil er simpelthen, at det ikke er i deres DNA endnu, så det er ikke en del af deres naturlige forretningsprocesser. Dette feeds ind i det næste punkt. De ved ikke, hvordan man gør det til en forretningsproces. Den bedste måde at gøre det på, forresten, er at kopiere, hvad farmaceutiske virksomheder og forsikringsselskaber bare ser, og nogle virksomheder i sundhedsvæsenet, bare se på den måde, de bruger analytics og kopiere. Fordi det er en forretningsproces. Ved ikke, hvordan man skal politihandle det eller revidere det. Det virkelig, især nu hvor en forfærdelig masse softwarevirksomheder har skabt produkter, der automatiserer en masse frygtelige analyser. Pointen med revision er vigtig, når du har en konsulentvirksomhed eller nogen på stedet, der kan stole på for at forstå, hvad resultaterne af enhver analytisk beregning er, det er en slags valg, du skal tage, men hvis du lægger virkelig magtfulde analytiske værktøjer i hænderne på mennesker, der ikke forstår analytik korrekt, vil de sandsynligvis hoppe til konklusioner, der måske ikke er korrekte. Og som sagt, virksomheder ved ikke, hvordan de skal budgettere for det.
Dette er smag af analytics, jeg vil bare køre gennem dem. Statistisk analyse og statistisk modellering adskiller sig væsentligt fra forudsigelig analyse, hvoraf de fleste forresten er kurve-passende. Maskinindlæring er forskellig fra disse ting, stieanalyse og tidsserier, der dybest set udføres på statusstrømme er forskellige igen. Grafanalyse er anderledes igen, og tekstanalyse og semantisk analyse er forskellige igen. Dette er bare at påpege, at dette er en meget multi-genre ting. Det er det ikke, du begynder ikke at lave analytics, du begynder at se på problemer, du har, og kigge efter de forskellige værktøjer og forskellige smag af analytics, der passer til disse. Og til sidst nettoet. På grund af hardware- og softwareudvikling er analytics efter min mening i sin spædbarn. Der er meget, meget mere endnu, der kommer, og vi vil se det udfolde sig i de kommende år. Jeg tror, jeg kan give bolden videre til Dez nu.
Dez Blanchfield: Ja, tal om en hård handling at følge, Robin. Jeg vil besøge dette emne kort fra en af mine yndlingsvinkler, som er menneskets vinkel. Der sker så mange ændringer, der finder sted i vores hverdag. En af de største forstyrrelser i vores daglige liv, i øjeblikket efter min mening, er bare hverdagen. At komme op på arbejde og prøve at udføre det job, du er hyret til at gøre, og den stigende forventning om, at du vil gå fra en hverdag til en superhelt og mængden af information, der flyder rundt i organisationer og udsender meget, meget hurtigt, det er en betydelig udfordring, og mere og mere er vi nødt til at give bedre og bedre værktøjer til folk til at prøve at tackle med strømmen af viden og information, og så jeg tænkte, at jeg ville prøve at komme til dette fra en lidt sjov vinkel . Men det slår mig altid, hvordan vi har denne høje sind eller flash-mobs osv., Der er slags, der driver os mod det, vi taler om som analyser, men det, vi virkelig taler om, er at gøre information tilgængelig for folk, og så de kan interagere med det og gøre det på en sådan måde, at det er naturligt, og det føles normalt.
Og faktisk minder det mig om en YouTube-video af et lille barn, lille baby, der sidder på gulvet og sidder der og leger med en iPad, og den klapper rundt og klemmer og klemmer og flytter billederne ud og leger med skærmen, dataene der. Og så forælderen fjerner iPad'en og lægger et magasin, et trykt magasin på barnets skød. Og dette barns sandsynligvis ikke mere end to år gammel. Barnet begynder at prøve at stryge med magasinet og klemme og klemme, og magasinet reagerer ikke. Barnet løfter fingeren op og ser på det og tænker, ”Hmm, jeg tror ikke, at min finger fungerer, ” og det stikker sig i armen og tænker, ”Ah nej, min finger arbejder, jeg kan føle min arm og det ser godt ud, ”og det vrider fingeren, og fingeren vrider sig og reagerer. Ja. Så forsøger den at interagere med magasinet igen, og lav og se, at det ikke klemmes og klemmes og ruller. Så tager de magasinet væk og sætter iPad'en tilbage i skødet, og pludselig fungerer tingene. Og her er en baby, der er kommet med og er blevet trænet til at bruge et analytisk værktøj eller et live streaming-værktøj til underholdning, og det kan ikke finde ud af, hvordan et magasin skal arbejde, og hvordan man kan vende sider.
Og det er et interessant koncept i sig selv. Men når jeg tænker på viden, der bevæger sig rundt i organisationer, og den måde, data flyder på, og den måde, folk opfører sig, tænker jeg ofte på dette begreb om, hvad folk har lært at være en flash mob, som er en begivenhed, hvor, og hvilke sociale medier gør dette endnu lettere at gøre, en idé som sådan, der går til dette sted på dette tidspunkt og dato og handling, eller video og lær disse danser, eller bære denne farvede hat og pege nord klokken et. Og du skubber dette ud gennem dit netværk, og uvægerligt en hel masse mennesker, hundreder af dem, dukker op på samme sted på samme tid, gør de samme ting, og der er denne wow-faktor, denne som "Hellig ko, det var virkelig imponerende! ”Men faktisk er det en rigtig enkel idé og et simpelt koncept, der bare skubbes ud gennem vores netværk, og vi får dette resultat, som er en visuelt forbløffende og hørbar imponerende ting. Og når du tænker på en organisation, den måde, vi ønsker, at folk skal opføre sig på, og hvordan vi ønsker, at de skal håndtere informationssystemer og kunder, er det ofte så enkelt, det er en idé eller et koncept eller en kulturel eller adfærdsmæssig egenskab, vi prøver at videregive gennem og styrke med værktøjer og information.
Og understøtter alt dette er dette mantra, som jeg har haft i over to og et halvt årti, og det vil sige, at hvis dit personale ikke kan finde det, de har brug for for at gøre deres job, hvad enten det er værktøjer eller oplysninger, altid vil de opfinde hjulet igen. Og så dette er en stadigt stigende udfordring nu, hvor vi har masser af viden og masser af information og ting, der bevæger sig meget hurtigt, at vi ønsker at stoppe folk på at opfinde hjulet igen. Og når vi tænker på vores arbejdsmiljø, vender tilbage til folkets vinkel, som er en af mine favoritter, blev jeg forbløffet, da vi blev overrasket over, at aflukke ikke var et befordrende miljø for gode resultater, eller vi foretede ting som dette forfærdelige billeder her, og det har ikke ændret sig meget, bare sænket væggene ned og kaldte dem åbne arbejdsområder. Men i midten med den gule sløjfe omkring dem er der to personer, der udveksler viden. Og alligevel, hvis du ser på resten af rummet, sidder de alle der pligtopfyldte der og lægger information på en skærm. Og oftere end ikke, egentlig ikke at udveksle viden og data, og der er forskellige årsager til det. Men samspillet midt på gulvet til venstre der i den gule cirkel, der er to mennesker, der chatter væk der, bytter viden og sandsynligvis prøver at finde noget, forsøger at sige, ”Ved du, hvor denne rapport er, hvor jeg kan jeg finde disse data, hvilket værktøj bruger jeg til at gøre denne ting? ”Og det har sandsynligvis ikke fungeret, så de har intet, og vandrede over gulvet, brød reglen om aflukke kontorlokaler og gjorde det personligt.
Og vi har haft lignende miljøer rundt omkring på kontoret, som vi spøgtigt pirker sjovt med, men virkeligheden er, at de er ret magtfulde og effektive. Og en af mine favoritter er den mobile eller faste analytiske platform, der kaldes vandkøleren, hvor folk rejser sig derop og snakker-chatter der rundt og bytter viden, og sammenligner ideer og udfører analyser, mens de står ved vandkøleren og bytter ideer. De er meget magtfulde koncepter, når du tænker på dem. Og hvis du kan oversætte dem til dine systemer og værktøjer, får du et fantastisk resultat. Og vi har tidenes favorit, som i det væsentlige er kontorets mest kraftfulde datadistribueringsnav, ellers kendt som receptionen. Og hvis du ikke kan finde noget, hvor skal du hen? Nå, du går foran på kontoret, og du går til receptionen og siger, "Ved du, hvor x, y, z er?" Og jeg tør nogen fortælle mig, at de ikke har gjort det mindst en gang i en ny job eller på et tidspunkt, hvor de bare ikke kan finde noget. Og du bliver nødt til at spørge dig selv, hvorfor er det tilfældet? Det skal være et sted på intranettet eller et eller andet værktøj. Det skal være let at finde.
Og så når det kommer til data og analyse og de værktøjer, vi har leveret vores personale til at udføre deres job og den måde, mennesker interagerer med job, har jeg den opfattelse, at inden den nylige fremkomst af analyseværktøjer og big data-platforme, eller "databehandling" som det også kaldes i old school, rapportering og videndeling var langt fra dynamisk eller samarbejdsvillig eller åben, og når du tænker på den type systemer, vi forventer, at folk udfører deres job med, havde vi klassisk, hvad folk kalder arv nu, men virkeligheden er, at det kun er arv, der er ved, og at det stadig er her i dag, og derfor er det ikke rigtig arv. Men traditionelle HR-systemer og ERP-systemer - human resource management, enterprise resource planning, enterprise data management og systemer, som vi bruger til at styre informationen til at drive en virksomhed. Det er altid dæmpet. Og fra den øverste ende, enkle platforme som afdelingens intranet, der prøver at kommunikere, hvor tingene er, og hvordan man får dem, og hvordan man interagerer med viden omkring stedet. Vi popper det op på vores intranet. Det er kun så godt som de mennesker, der gør tid og kræfter på at lægge det derop, ellers bliver det bare tilbage i dit hoved. Eller så har du data, der sidder hele vejen nederst i fødekæden, i virksomheds-SAN'erne og alt derimellem, så det er lagerområdet er fyldt med filer og data, men hvem ved, hvor de kan finde dem.
Oftere end ikke har vi bygget disse lukkede dataplatformer eller lukkede systemer, og derfor har folk vendt tilbage til lignende regneark og PowerPoints for at videregive information rundt omkring i stedet. Men der var en interessant ting, der fandt sted for nylig, i mit sind, og det var, at mobile enheder og internettet generelt fungerer i en sådan ide, at tingene faktisk kunne være bedre. Og overvejende i forbrugerområdet. Og det er en interessant ting, at hverdagen vi begyndte at have ting som internetbank. Vi behøvede ikke fysisk at gå til en bank for at interagere med dem, vi kunne gøre det telefonisk. Oprindeligt var det uklart, men så kom internettet rundt, og vi havde et websted. Ved du, og hvor mange gange har du faktisk været i din bank for nylig? Jeg kan faktisk ikke, jeg havde en samtale om dette her om dagen, og jeg kan faktisk ikke huske sidste gang, jeg gik til min bank, som jeg var ret chokeret over, jeg tænkte, at jeg må være i stand til at huske det, men det var så længe siden kan jeg faktisk ikke huske, hvornår jeg gik der. Og så har vi nu disse gadgets i vores hånd i form af mobiltelefoner, telefoner, tablets og laptops, vi har netværk og adgang til værktøjer og systemer, og forbrugerområdet har vi lært at ting kan være bedre, men fordi af den hurtige ændring i forbrugerområdet, der har været mere sløv og glatisk ændring i virksomheden og miljøer, har vi ikke altid taget denne ændring til det daglige arbejdsliv.
Og jeg elsker at stikke sjovt ved det faktum, at du ikke kan leve stream data til hardkopi. I dette billede her er der en person, der sidder og ser på nogle analyser, der er blevet udført, og der er en smuk graf, der er produceret af en person, der sandsynligvis får en masse penge som statistiker eller aktuar, og de sidder der og prøver at gøre analyse på en hardkopi og pirke på den. Men her er det skræmmende for mig: Disse mennesker i dette mødelokale, for eksempel, og jeg vil bruge dette som et eksempel, de interagerer med data, der nu er historiske. Og det er lige så gammelt, fra det tidspunkt, da denne ting blev produceret og derefter udskrevet, så måske er det en uge-gammel rapport. Nu tager de beslutninger om ikke så meget dårlige data men gamle data, som altid kan være dårlige data. De tager en beslutning i dag baseret på noget, der er historisk, som er et rigtig dårligt sted at være. Det lykkedes os at erstatte denne hardkopi med lignende tabletter og telefoner, fordi vi arbejdede meget hurtigt i forbrugerrum, og nu har vi arbejdet på det i virksomhedsrummet, at realtid er indsigt er realtidsværdi.
Og vi bliver bedre og bedre til det. Og det bringer mig til det punkt, som Robin hævdede tidligere, det var begrebet borgerdata-videnskabsmand og drivkraften for dette koncept. For mig er en borgerdataforsker bare almindelige mennesker med de rigtige værktøjer og oplysninger om en iPad. De behøver ikke at gøre matematik, de behøver ikke at kende algoritmerne, de behøver ikke at vide, hvordan de anvender algoritmer og regeldata, de skal bare vide, hvordan man bruger grænsefladen. Og det bringer mig tilbage til min introduktion og konceptet med det lille barn, der sidder der med en iPad kontra et magasin, kontra en iPad. Børnen kan meget hurtigt, intuitivt lære, hvordan man bruger interface til en iPad til at dykke ned i information og interagere med den, omend måske et spil eller streamingmedie eller en video. Men det kunne ikke få det samme svar eller interaktion fra en magasinbjælke og bare blinkende side efter side, hvilket ikke er meget engagerende, især hvis du er et lille barn, der er vokset op med iPads. Uundgåeligt kan mennesker se og lære meget hurtigt, hvordan man kører værktøjer og ting, som hvis vi bare leverer dem, og hvis vi giver dem en grænseflade som mobile enheder og især tablets og smartphones med store nok skærme, og især hvis du kan interagere dem i berøringen, med fingerbevægelser, pludselig får du dette begreb om en borgerdataforsker.
En person, der kan anvende datavidenskab med de rigtige værktøjer, men uden at skulle vide, hvordan man gør det. Og i mit sind var meget af dette, som sagt, drevet af forbrugernes indflydelse, der flyttede og omdannede til efterspørgsel og virksomhed. Et par rigtig hurtige eksempler. Vi, mange af os, ville begynde at gøre ting med vores blogs og websteder, såsom at sætte i små annoncer eller se på sporing og bevægelse, vi brugte værktøjer som Google Analytics, og vi blev vågnet op til det faktum, at i vores blogs og små websteder, vi kunne lægge små kodestykker derinde, og Google ville give os realtidsindblik i, hvem der besøger hjemmesiden, hvornår og hvor og hvordan. Og i realtid kunne vi faktisk se folk ramme webstedet, gå gennem siderne og derefter forsvinde. Og det var ganske forbløffende. Jeg elsker stadig at gøre det, når jeg prøver at forklare analyser i realtid til folk, dummer jeg det ned for bare at vise dem et websted, hvor Google Analytics er tilsluttet, og faktisk se live-interaktionen med folk, der rammer websteder og spørger dem, ”Forestil dig om du havde den slags indsigt i din virksomhed i realtid. ”
Tag et detaileksempel, og måske et lægemiddel, jeg tror, du kalder det et apotek i Amerika, et apotek, hvor du går ind og køber alt fra hovedpine-tabletter til solcreme og hatte. At prøve at køre denne organisation uden information i realtid er et skræmmende koncept, nu ved vi, hvad vi ved. For eksempel kan du måle fodtrafik, du kan placere enheder rundt i butikken med et smiley-ansigt på den ene side af skærmen, fordi du er glad, og en ulykkelig rød helt til højre og nogle forskellige nuancer i midten. Og der er en platform kaldet "Glad eller ikke" i disse dage, hvor du går ind i en butik, og du kan slå et lykkeligt ansigt eller et trist ansigt, afhængigt af din feedback fra kundes synspunkt. Og det kan være interaktivt med realtid. Du kan få direkte efterspørgseldrevet prisfastsættelse. Hvis det er masser af mennesker derinde, kan du køre priserne lidt op, og du kan gøre lagerbeholdning og fortælle folk, for eksempel - flyselskaber for eksempel vil fortælle folk, hvor mange pladser der er tilgængelige nu på hjemmesiden, når du når du booker en flyrejse, ringer du ikke bare tilfældigt ind og håber du kan dukke op og få en flyvning. Live HR-data, du kan fortælle, hvornår folk holder på og slukker. Indkøb, hvis du er i indkøb, og du har livedata, kan du gøre ting som at vente en times tid og afdække sig mod prisen på den amerikanske dollar for at købe din næste lager med lager og få en lastbilbelastning med ting til at dukke op.
Når jeg viser Google Analytics til folk, og jeg videresender den slags anekdote, dette eureka-øjeblik, dette “a-ha!” Øjeblik, går denne lyspære i deres sind som ”Hmm, jeg kan se masser af steder, hvor jeg kunne gøre det . Hvis jeg kun havde værktøjerne, og hvis jeg kun havde adgang til den viden. ”Og vi ser dette nu på sociale medier. Enhver, der er en erfaren bruger af sociale medier end bare at vise billeder af deres morgenmad, har en tendens til at se på, hvor mange likes de får, og hvor meget trafik de får, og hvor mange venner de får, og det gør de med kan godt lide, siger, Twitter som et analytisk værktøj. Du kan gå til Twitter.com for at bruge værktøjet, men du skriver ind i Google Twitter Analytics dot com, eller klikker på øverste højre knap og trækker ned menuen og gør det, du får disse smukke, levende grafer, der fortæller dig, hvor mange tweets, du laver selv, og hvor mange interaktioner med dem. Og realtidsanalyse bare på dine personlige sociale medier. Forestil dig, hvis vi kunne lide Google Analytics og Facebook og LinkedIn og Twitter, eBay-statistikker kommer til dig, men i dit arbejdsmiljø.
Nu har vi den levende slags web og mobil lige ved hånden, det bliver et magtkoncept. Og så det trækker mig til min konklusion, og det er, at jeg altid har fundet ud af, at organisationer, der udnytter værktøjer og teknologi tidligt, får en så betydelig fordel i forhold til deres konkurrenter, at konkurrenter faktisk aldrig kan indhente. Og det ser vi nu med konflikten mellem borgerdataforsker. Hvis vi kan tage folk med de færdigheder, den viden, vi har ansat dem til, og vi kan give dem de rigtige værktøjer, især evnen til at se data i realtid og opdage data og vide, hvor det er ved, uden at skulle gå rundt i aflukkerne og stille spørgsmål højt, når du bliver nødt til at gå og stå ved vandkøleren for at lave nogle sammenlignende analyser med mennesker eller gå og spørge receptionen hvor indekset er. Hvis de kan gøre det lige ved hånden, og de kan tage det til deres møder med dem og sidde i et bestyrelsesrum, der flirer gennem skærme i realtid snarere end hardkopi, pludselig har vi bemyndiget vores medarbejdere, der ikke har brug for at være reelle datavidenskabsmænd, men for faktisk at bruge datavidenskab og skabe fantastiske resultater for organisationer. Og jeg tror, at dette vippepunkt, vi faktisk er gået nu, hvor forbrugeren bliver drevet ind i virksomheden, udfordringen er, hvordan leverer vi denne virksomhed, og det er det tema, jeg gætter på dagens diskussion. Og med det vil jeg pakke mit stykke op og overlevere for at høre, hvordan vi kan løse det. David, over til dig.
David Sweenor: Okay, tak så mange fyre, og tak Robin. Du ved, Robin, jeg er enig i din oprindelige vurdering. Analytisk proces, det er egentlig ikke anderledes end softwareudvikling. Jeg tror, udfordringen inden for en organisation bare er virkelig, ved du, måske er ting ikke så defineret, måske der er en sonderende komponent til det, og en kreativ komponent til det. Og Dez, du ved, jeg er enig med dig, der er en masse genopfinde hjulet, og du ved, der er ikke en organisation, som jeg går ind i i dag, du spørger, ja, hvorfor gør du det på denne måde? Hvorfor kører virksomheden på denne måde? Og det er let at stille spørgsmålstegn ved, og det er svært at ændre mange gange, når du er inden for en organisation. Jeg elsker analogien, forbruget af ting. Og så ikke længere, når jeg tager til lufthavnen og vil skifte plads - jeg gør det på min mobiltelefon. Jeg behøver ikke at gå op til agenten på standen og se, at agenten skriver noget ind på en monokrom skærm i 15 minutter for at ændre min sædetildeling. Jeg foretrækker bare at gøre det på min telefon, og det er en interessant udvikling.
I dag skal vi tale lidt om kollektiv intelligens. For dem, der ikke er klar over, er Statistica en førende analytisk platform, som den har eksisteret i over 30 år. Hvis du ser på nogen af publikationerne derude i analytikabranchen, kommer det altid ud på toppen som en af de mest intuitive og brugervenlige avancerede analysesoftwarepakker. Så vi har brugt de sidste par år på at arbejde på et koncept kaldet kollektiv intelligens, og vi tager det til næste niveau. Jeg ønskede at starte denne samtale med: hvordan gøres arbejdet gjort i din organisation?
Og der er to billeder her. Den til venstre er et billede fra 1960'erne, og jeg startede ikke min karriere i 1960'erne, men billedet til højre er - det er en halvlederfabrik, hvor jeg begyndte at arbejde. Og jeg arbejdede i den sorte bygning, sort tag på øverste venstre hjørne. Men de lavede halvleder ting. Dette er et nyligt billede fra Google Billeder. Men når du går tilbage til 1960'ernes billede til venstre, er det meget interessant. Du har disse mennesker siddende i en linje, og de laver, du ved, integrerede kredsløb og halvledere. Men der er en standardisering, der er en standard måde at gøre tingene på, og der var en veldefineret proces. Du ved, måske da disse mennesker alle sidder i et åbent miljø, var der måske noget samarbejde. Jeg tror, at vi har mistet en smule af det inden for videnarbejdsstyrken.
Da jeg sad i den bygning øverst til venstre, hvis jeg ville samarbejde med nogen, var den ikke åben. Der var disse kontorer, måske var nogle af holdet fjerntliggende, eller måske var jeg nødt til at vandre over dette campus; det var en 25-minutters gang, og jeg var nødt til at tale med nogen i bygningen længst til højre. Jeg tror, vi har mistet noget undervejs. Og så, du ved, jeg tænkte den samme tanker om, hvorfor gør folk - hvor mange mennesker fortsætter med at opfinde hjulet inden for din organisation? Jeg tror, du ved, at organisationer som helhed gjorde et godt stykke arbejde i 1990'erne og 2000'erne med CRM og datalagring og i en grad BI. Af en eller anden grund er analysen forsinket lidt. Der var betydelige investeringer i datalagring og standardisering og normalisering af dine data, og alt dette og CRM, men analysen er forsinket af en eller anden grund. Og jeg spekulerer på, hvorfor. Der er måske en kreativ - måske er din proces ikke veldefineret, måske ved du ikke, hvilken beslutning eller håndtag du prøver at vende, du ved, i din virksomhed for at ændre ting. Når vi går ind i organisationer i dag, er der mange mennesker, der gør ting meget manuelt i regneark.
Og du ved, jeg kiggede på en stat her til morgen, jeg tror, den sagde 80, 90 procent af regnearkene har fejl, og nogle af disse kan være meget betydningsfulde. Som den i Whale, hvor JPMorgan Chase mistede milliarder og milliarder af dollars på grund af regnearkfejl. Så jeg har den forudsætning, jeg tror, der skal være en bedre måde at få tingene til. Og som vi nævnte, vi har disse dataforskere. Disse fyre er dyre, og de er svære at finde. Og nogle gange er de lidt af en underlig and. Men jeg tror, hvis du skulle opsummere, hvad en datavidenskabsmand er, er det sandsynligvis en person, der forstår dataene. Jeg tror, det er nogen, der forstår matematikken, nogen der forstår problemet. Og virkelig en der kan kommunikere resultaterne. Og hvis du er dataforsker, er du meget heldig lige nu i disse dage, fordi din løn sandsynligvis er fordoblet i de sidste par år.
Men sandheden skal siges, mange organisationer, de har ikke disse datavidenskabsmænd, men din organisation har smarte mennesker. Du har en organisation, du har en masse smarte mennesker, og de bruger regneark. Du ved, statistik og matematik er ikke deres primære job, men de bruger data til at drive virksomheden fremad. Virkelig, den udfordring, vi adresserer, er, hvordan tager du, hvis du er heldig at have en datavidenskabsmand eller en statistiker eller to, hvordan kan du tage dem, og hvordan kan du forbedre samarbejdet mellem disse mennesker og andre personer i din organisation? Hvis vi ser på, hvordan vores organisation er struktureret, vil jeg starte, og jeg vil gå fra højre til venstre. Og jeg ved, at dette er baglæns, men vi har denne linje af forretningsbrugere.
Dette er hovedparten af din videnarbejderpopulation, og for disse mennesker skal du integrere analyser i din forretningsbranche. Måske ser de analytisk output på et callcenter-skærmbillede eller noget, og det fortæller dem det næste bedste tilbud at give til en kunde. Måske er det en forbruger eller leverandør på en webportal, og det giver dem øjeblikkeligt kredit, eller lignende ting. Men ideen er, at de spiser analytics. Hvis vi går til midten, er det disse videnarbejdere. Dette er de mennesker, der laver ting med regnearkene i dag, men regneark er fejlagtige og på et tidspunkt løber tør for gas. Disse borgerdata-forskere, som vi kalder dem, ved du, hvad vi forsøger at gøre for dem er virkelig at øge niveauet for automatisering.
Og med analytics hører du, at 80 til 90 procent af arbejdet er i databepræparatet, og det er ikke den faktiske matematik, men det er datapræparatet. Vi prøver at automatisere det, uanset om du gør det, og vi har guider og skabeloner og genanvendelige ting, og du behøver ikke rigtig have kendskab til den underliggende infrastruktur i dit miljø. Og så, hvis vi ser længst til venstre, har vi disse dataforskere. Og som jeg nævnte, de er mangelvare. Og hvad vi prøver at gøre for at gøre dem mere produktive, er at give dem mulighed for at skabe ting, som disse borgerdata-forskere kan gøre. Tænk på det som en Lego-blok, så disse dataforskere kan skabe et genanvendeligt aktiv, som en borgerdataforsker kan bruge. Byg det én gang, så vi ikke behøver at genopfinde hjulet igen.
Og så kan disse fyre også være bekymrede for, om vi kan gøre ting i databasen, og udnytte de eksisterende teknologiinvesteringer, som din virksomhed har foretaget. Du ved, det giver ikke mening i denne dag og alder at blande data frem og tilbage over hele verden. Så hvis vi ser på Statistica, som jeg nævnte, er det en platform, der har eksisteret i ganske lang tid. Og det er et meget innovativt produkt. Datasamling, der har ikke været en datakilde, som vi ikke har adgang til. Vi har alle de dataopdagelses- og visualiserings ting, du kan forvente; vi kan gøre det i realtid. Og det har sandsynligvis - jeg tror, at der er over 16.000 analytiske funktioner i software-værktøjet, så det er mere matematik, end jeg nogensinde kunne bruge eller forstå, men det er der, hvis du har brug for det.
Vi har muligheden for at kombinere både forretningsregler og analytiske arbejdsgange for virkelig at tage en forretningsbeslutning. Du går ud over bare, her er en algoritme, her er en arbejdsgang, men du har forretningsregler, som du altid skal tackle. Vi er meget sikre i regeringsførelse. Vi bruges i mange farmaceutiske klienter, idet FDA stoler på os. Du ved, bare bevis på budding, at vi har kontrol og revisionsevne til at blive accepteret af dem. Og så til sidst, ved du, vi er åbne og fleksible og udvidelige, så du er nødt til at oprette en platform, der er, at du vil have dine datavidenskabsmænd til at være produktive, du vil have dine borgerdataforskere til at være produktive, du vil være i stand til at distribuere disse analytiske output til arbejderne i din organisation.
Hvis vi ser på det, her er et eksempel på nogle af visualiseringerne. Men at være i stand til at distribuere din analytiske output til brugere i forretningsområdet, så det første eksempel til venstre er det et netværksanalysediagram. Og måske er du en bedrageretterforsker, og du ved ikke, hvordan disse forbindelser oprettes, og dette kan være mennesker, dette kan være enheder, dette kan være kontrakter, hvad som helst. Men du kan manipulere dette med din mus og interagere med den for virkelig at forstå - hvis du er en svig-efterforsker, for at forstå en prioriteret liste over, hvem du skal undersøge, ret, fordi du ikke kan tale med alle, så du har at prioritere.
Hvis vi ser på billedet til højre der, for et forudsigeligt vedligeholdelsespanel, er dette et virkelig interessant problem. Måske er du ejer af en lufthavn, og du har disse kropscannere derinde. Disse kropsskannere, hvis du rejser til en lufthavn, er der nogle komponenter derinde, der har en ni måneders holdbarhed. Og disse ting er virkelig, virkelig dyre. Hvis jeg har flere indgangspunkter, flere scannere i min lufthavn, nummer et vil jeg sikre mig, at jeg er bemandet passende ved hver af portene, og for de dele, der er i scannerne, vil jeg ikke bestille dem også tidligt, og jeg vil gerne have dem, før det går i stykker. Vi har evne, måske hvis du ejer en lufthavn, til at være i stand til at forudsige, hvornår disse ting vil gå i stykker og forudsige personale.
Hvis vi ser på nederst til højre, er det, hvis du er i et produktionsmiljø, dette er bare en grafisk repræsentation af produktionsstrømmen. Og det er lidt svært at se, men der er røde og grønne trafiklys på disse forskellige processektorer, og så hvis jeg er ingeniør, er der meget sofistikeret matematik derinde, men jeg kan bore ned i den bestemte processektor og se på parametrene og indtast det, måske der forårsager, at det er ude af kontrol. Hvis vi ser på vores borgerdata-videnskabsmand, er vores mål virkelig at gøre det let for borgerdataforskeren. Vi har guider og skabeloner, og en ting, som jeg synes er virkelig interessant, er, at vi har denne automatiske knudepunkt for dataundersøgelse. Og hvad det virkelig gør, det har indbygget smarts.
Jeg nævnte datapræparat - det tager en betydelig mængde tid, det er både i datasamling og forberedelse. Men lad os antage, at jeg har mine data, jeg kan køre dem gennem denne dataundersøgelsesknudepunkt, og det kontrollerer for uoverensstemmelse og sparsness og outliers, og alle disse ting, det udfylder manglende værdier, og det gør en masse matematik, jeg don forstår det ikke, så jeg enten kan acceptere standardindstillingerne, eller hvis jeg er lidt mere klog, kan jeg ændre dem. Men pointen er, at vi ønsker at automatisere denne proces. Denne ting gør omkring 15 forskellige kontroller og resultater på et renset datasæt. Det, vi laver, er at gøre dette lettere for folk at skabe disse arbejdsgange.
Det er her vi taler om samarbejde mellem datavidenskabsmænd og borgerdata-forskere. Hvis vi ser på disse billeder til højre, ser vi denne arbejdsgang til datapræparat. Og måske er dette meget sofistikeret, måske er dette din virksomheds hemmelige sauce, jeg ved ikke, men vi ved, at nogen inden for din organisation kan få adgang til en eller flere af disse datasiloer, som vi har. Vi har brug for en måde at nummer et, gribe dem og sy dem sammen, og nummer to, måske er der en særlig behandling, som vi vil gøre, at det er uden for vores datasundhedskontrol, og det er din virksomheds hemmelige sauce. Jeg kan oprette denne arbejdsgang i vores organisation, og den kollapser som en knude. Du ser pilen pege nedad, det er bare en knude, og vi kan have hundrede af disse ting i en organisation. Tanken er, at vi har mennesker, der ved noget om et bestemt rum, de kan skabe en arbejdsgang, og en anden kan genbruge det. Vi prøver at minimere genindføjelsen af hjulet.
Og vi kan gøre det samme med analytiske modelleringsarbejdsgange. I dette tilfælde til højre, denne arbejdsgang, måske er der 15 forskellige algoritmer, og jeg vil vælge den bedste til opgaven. Og jeg er ikke nødt til at forstå som borgerdata-videnskabsmand, hvad der foregår i det spiderweb-rod deroppe, men det kollapser bare i en knude, og måske siger den knude simpelthen, "beregne kreditrisikoscore." "Beregn chancen af en kirurgisk infektion, ”hvad har du. ”Beregn sandsynligheden for, at noget er en uredelig transaktion.” Som borgerdataforsker kan jeg bruge denne meget sofistikerede matematik, som en anden har bygget, måske en af disse data, som videnskabsmænd har bygget inden for min organisation.
Fra et datavidenskabeligt perspektiv, ved du, jeg har talt med datavidenskabsmænd, der elsker at skrive kode, og jeg har talt med dataforskere, der hader at skrive kode. Og det er fint, så vi har en meget visuel, grafisk brugergrænseflade. Vi kan få fat i vores data, vi kan foretage vores automatiske dataundersøgelse af data, og måske vil jeg skrive kode. Jeg kan godt lide Python, jeg kan godt lide R, men tanken er, at disse dataforskere er i mangelvare, og de kan godt lide koden på et bestemt sprog. Vi har ikke særlig en præference for, hvilket sprog du vil kode på, så hvis du vil gøre R, skal du gøre R; Hvis du vil gøre Python, skal du gøre Python. Det er godt. Hvis du vil sprænge din analyse til Azure, skal du sprænge din analyse til skyen. Og så er målet her virkelig at tilbyde fleksibilitet og muligheder for at gøre dine dataforskere så produktive, som de kan være.
Nu data forskere, de er temmelig smarte mennesker, men måske er de ikke specialist i alt, og måske er der nogle huller i, hvad de kan gøre. Og hvis du ser ud i branchen, er der en masse forskellige analytiske markedspladser der findes derude. Dette er et eksempel på, måske har jeg brug for at gøre billedgenkendelse, og jeg har ikke den færdighed, måske går jeg ud til Algorithmia og får en billedgenkendelsesalgoritme. Måske går jeg ud til Apervita og får en meget speciel sundhedsalgoritme. Måske vil jeg bruge noget i Azure-maskinlæringsbiblioteket. Måske vil jeg bruge noget i den oprindelige Statistica-platform.
Igen er ideen her, at vi ønsker at udnytte det globale analysefællesskab. Fordi du ikke har alle de færdigheder inden for dine fire vægge, så hvordan kan vi oprette software - og det er hvad vi laver - der giver dine datavidenskabsmænd mulighed for at bruge algoritmer fra en række markedspladser. Vi har gjort det med R og Python i lang tid, men dette udvider det til disse app-markedspladser, der findes derude. Og det samme, som du ser her på toppen af dette, vi bruger H2O på Spark, så der er en masse analytiske algoritmer der. Du behøver ikke at fokusere på at oprette disse fra bunden, lad os genbruge disse, der lever i open source-samfundet, og vi ønsker, at disse mennesker skal være så produktive som muligt.
Det næste trin, efter at vi har vores borgerdata-videnskabsmænd og vores datavidenskabsmænd, er virkelig hvordan promoverer du og distribuerer du denne bedste praksis? Vi har teknologi inden for vores software, der giver dig mulighed for at distribuere analyser overalt. Og dette er mere en modeladministrationsvisning, men jeg er ikke længere bundet af de fire vægge eller en bestemt installation i Tulsa eller Taiwan eller Californien, eller hvad har du. Dette er en global platform, og vi har mange, mange kunder, som den er implementeret i dens brug af flere websteder.
Og så virkelig, de vigtigste ting er, hvis du laver noget i Taiwan, og du vil gentage det i Brasilien, det er fantastisk. Gå ind der, tag de genanvendelige skabeloner, tag den arbejdsgang, du ønsker. Dette forsøger at skabe disse standarder og den fælles måde at gøre ting på, så vi gør ikke ting helt anderledes overalt. Og den anden nøglekomponent i dette er virkelig, at vi vil tage regnestykket, hvor dataene bor. Du behøver ikke at blande data mellem, du ved, Californien og Tulsa og Taiwan og Brasilien. Vi har teknologi, der giver os mulighed for at tage matematikken til dataene, og vi vil have en anden Hot Technology-webcast om det emne.
Men vi kalder denne arkitektur, og her er en sneak peek, Native Distribueret Analytics-arkitektur. Den centrale idé bag dette er, at vi har en platform, Statistica, og jeg kan eksportere en analytisk arbejdsgang som et atom. Og jeg kunne gøre en model eller en hel arbejdsgang, så det betyder ikke noget. Men jeg kan oprette dette og eksportere det på et sprog, der passer til målplatformen. På venstre side af dette gør mange mennesker dette, men de scorer i kildesystemet. Det er fint, vi kan score, og vi kan udføre modelopbygning i databasen, så det er interessant.
Og så på højre side har vi Boomi. Dette er en ledsagende teknologi, vi arbejder med alle disse. Men vi kan også tage disse arbejdsgange og i det væsentlige transportere det overalt i verden. Alt, der har en IP-adresse. Og jeg behøver ikke have en Statistica installeret på den offentlige eller private sky. Alt, hvad der kan køre en JVM, vi kan køre disse analytiske workflows, data prep arbejdsgange eller bare modeller på en af disse målplatforme. Uanset om det er i min offentlige eller private sky, uanset om det er i min traktor, min bil, mit hjem, min lyspære, mit internet med ting, har vi teknologi, der giver dig mulighed for at transportere disse arbejdsgange overalt i verden.
Lad os gennemgå. Du ved, vi har en række forretningsbrugere, så disse folk, vi har teknologi giver dem mulighed for at forbruge output i et format, de er komfortable med. Vi har forskere i borgerdata, og hvad vi prøver at gøre er at forbedre samarbejdet, gøre dem til en del af et team, ikke? Og så ønsker vi, at folk skal stoppe med at opfinde hjulet igen. Og vi har disse datavidenskabsmænd, der kan være en dygtighedskløft der, men de kan kode på et sprog, de vil have, de kan gå til de analytiske markedspladser og bruge algoritmer der. Og så med dette, hvordan kunne du ikke tro, at alt er fantastisk med dette? Dette er perfekt, det er hvad vi laver. Vi bygger genanvendelige arbejdsgange, vi giver folk instruktioner, vi giver dem Lego-blokke, så de kan bygge disse mægtige slotte og hvad de end vil. For at opsummere det, har vi en platform, der gør det muligt for forretningsbrugere, borgerdata-forskere, programmerer-datavidenskabsmænd, vi har - vi kan adressere enhver form for IoT-kantanalysebrug, og vi aktiverer denne opfattelse af kollektiv intelligens. Med det tror jeg, at vi sandsynligvis vil åbne det for spørgsmål.
Robin Bloor: Okay okay. Jeg tror, det første - for at være ærlig, jeg mener, jeg er blevet orienteret af Dell Statistica før, og for at være ærlig er jeg faktisk ganske overrasket over de ting, som jeg ikke vidste, at du bragte op i præsentationen . Og jeg må sige, at den ene ting, det er noget, der har været en bugbear for mig inden for vedtagelsen af analytics, er, at du ved, at få værktøjerne, er det ikke, ved du? Der er en masse frygtelige værktøjer derude, der er open source værktøjer osv. Og så videre, og der er forskellige, hvad jeg vil kalde, semi-platforme. Men jeg tror, at den forskel, du har, jeg var især imponeret over noget af arbejdsgangen.
Men forskellen er, at du ser ud til at give ende til ende. Det er som om analytics er en sofistikeret forretningsproces, der begynder med erhvervelse af data, og derefter gennemgår det en hel række trin, afhængigt af hvor flager de er, og så kan de forgrene sig i en hel række forskellige matematiske angreb på data. Og så dukker resultater op på en eller anden måde, og det er nødvendigt at være handlinger. Der er en enorm mængde analyser, jeg har fundet, hvor der blev udført meget godt arbejde, men der er ingen, der sætter det i gang. Og det ser ud til, at du har meget, hvad der kræves. Jeg ved ikke, hvor omfattende det er, men det er langt mere omfattende, end jeg havde forventet. Jeg er utrolig imponeret over det.
Jeg vil gerne have dig til at kommentere regneark. Du har allerede sagt noget, men en af de ting, som jeg har bemærket, og jeg har bemærket i årenes løb, men det er bare blevet mere og mere tydeligt, at der er en frygtelig masse regneark, som er skyggesystemer, og virkelig tror jeg regnearket, jeg mener, det var et vidunderligt værktøj, da det blev introduceret, og det har været vidunderligt lige siden på mange forskellige måder, men det er et generaliseret værktøj, det er ikke rigtig velegnet til formålet. Det er bestemt ikke særlig godt i BI-sammenhæng, og jeg synes, det er forfærdeligt i analysesammenhæng. Og jeg spekulerede på, om du havde nogle kommentarer at lave om, lad os sige, eksempler, hvor, du ved, Statistica har skyllet ud, overdreven brug af regneark eller enhver kommentar, du gerne vil komme med om det?
David Sweenor: Ja, jeg tror, du ved, at du kan gå op efter berømte regnearksfejl. Google eller uanset hvilken søgemaskine du bruger kommer tilbage med en række resultater. Jeg tror ikke, vi ved, at vi nogensinde vil erstatte regneark. Det er ikke vores intention, men mange organisationer, som jeg går til, der er et par af disse regneark-guider eller ninjas eller hvad du end vil kalde dem, men de har disse meget sofistikerede regneark, og du skal tænke, hvad der sker, når disse folk vinder lotto, og de kommer ikke tilbage? Og det, vi prøver at gøre, er, at vi ved, at regneark vil eksistere, så vi kan indtage dem, men jeg tror, hvad vi prøver at gøre, er at udvikle en visuel repræsentation af din arbejdsgang, så den kan forstås og deles med andre mennesker . Regneark er temmelig hårde, temmelig svære at dele. Og så snart du videregiver dit regneark til mig, har jeg ændret det, og nu er vi ude af synkronisering, og vi får forskellige svar. Hvad vi prøver at gøre er at lægge nogle beskyttelsesrammer omkring dette og gøre tingene lidt mere effektive. Og regneark er virkelig forfærdelige ved at kombinere flere datasæt sammen, ved du? De falder dernede. Men vi kommer ikke til at erstatte dem, vi indtager dem, og vi har mennesker, der begynder at skifte, fordi hvis vi har en knude, der siger ”beregne risiko”, er det, den person, der bruger regnearket, prøver at gøre. Så de er væk.
Robin Bloor: Ja, jeg vil sige, at du ved, fra et af de perspektiver, at jeg ser på ting, vil jeg sige, at regneark er gode til at skabe information. De er endda fremragende til at skabe viden om øer, men de er virkelig dårlige til at dele viden. De har ingen mekanisme til at gøre det overhovedet, og hvis du videregiver et regneark til nogen, er det ikke som om du kan læse det, som om det er en artikel, der forklarede nøjagtigt, hvad de laver. Den er bare ikke der. Jeg tror, du ved, det, der imponerede mig mest ved præsentationen og om Statisticas muligheder, det ser ud til at være utroligt agnostisk. Men det har denne tråd, der løber gennem arbejdsgangen. Har jeg ret i at antage, at du kunne se på en ende-til-ende-arbejdsgang på tværs af, ved du, fra dataindsamling hele vejen igennem til indlejring af resultater i især BI-applikationer eller endda køre applikationer?
David Sweenor: Ja, absolut. Og det har den ende til ende-evne, og nogle organisationer bruger det fuldstændigt, og jeg er ikke under nogen illusion, at noget selskab i disse dage køber alt fra en leverandør. Vi har en blanding. Nogle mennesker bruger Statistica til alt sammen, og nogle mennesker bruger det til modellering af arbejdsgange, nogle mennesker bruger det til data-prep arbejdsgange. Nogle mennesker bruger det til at distribuere hundreder af tekniske rapporter til ingeniører. Og så har vi alt imellem. Og det er virkelig ende til ende, og det er, du ved, en agnostisk platform, i og med at hvis der er algoritmer, som du vil bruge i R eller Python, Azure, Apervita, uanset hvad du ved, skal du bruge dem. Det er fantastisk, vær produktiv, brug det, du ved, brug det, du er godt tilpas med, og vi har mekanismer til at sikre, at de er kontrollerede og auditive og alt det slags.
Robin Bloor: Jeg kan især lide det aspekt af det. Jeg mener, jeg ved ikke, om du kan tale ud over, hvad du har sagt til rigdommen ved hvad der er derude. Jeg mener, jeg har kigget på dette, men jeg har ikke set det på en omfattende måde, og der er bestemt en enorm mængde Python-biblioteker i vores biblioteker, men er der noget, du kan tilføje til det billede? Fordi jeg synes, det er en meget interessant ting, ved du, tanken om, at du ville have komponenter, der var troværdige, fordi du kendte forskellige mennesker, der havde oprettet dem og forskellige mennesker, der brugte dem, som du kunne downloade. Ved du, kan du berige det, du allerede har sagt om det?
David Sweenor: Ja, jeg tror, nogle af de app-markedspladser, du ved, algoritmemarkederne der er derude. F.eks. Ved du, Dr. John Cromwell ved University of Iowa, han har udviklet en model, der vil forudsige, der bruges i realtid, mens vi opereres, vil give dig en score, hvis du vil få en kirurgisk infektion. Og hvis denne score er høj nok, vil de tage en indgriben lige i operationsstuen. Det er meget interessant. Så måske er der et andet hospital, der ikke er så stort. Nå, Apervita er et marked for sundhedsapps for analyse. Du kan enten finde en i en masse af disse app-markedspladser, du kan finde en og bruge dem igen, og transaktionen er mellem dig og den, der ejer det, men du kan enten finde en eller du kan sige, “Her hvad jeg har brug for. ”Jeg tror, det er at udnytte det globale samfund, fordi alle er specialist i disse dage, og man kan ikke vide alt. Jeg tror, R og Python er en ting, men denne idé om, ”Jeg vil udføre denne funktion, sætte en spec derude på et af disse app-markedspladser og få nogen til at udvikle den til dig.” Og de kan tjene penge på det, tror jeg det er meget interessant og meget anderledes end rent open source-modellen.
Robin Bloor: Okay. Uanset hvad, vil jeg give bolden videre til Dez. Vil du dykke ind, Dez?
Dez Blanchfield: Absolut, og jeg vil gerne blive på regnearkets ting bare et øjeblik, fordi jeg tror, det har fanget den rigtige kerne af en masse af det, vi taler om her. Og du kom med en kommentar, Robin, med hensyn til overgangen fra slags gamle regneark i deres fysiske form til elektronisk form. Vi havde en interessant ting, der fandt sted, hvor, du ved, når regneark oprindeligt var en ting, de bare var papirark med rækker og kolonner, og du manuelt skulle skrive tingene ned, så kom du igennem og beregne dem, enten ved at gøre det fra toppen af dit hoved eller med en anden enhed. Men vi har stadig muligheden for at få fejl glider ind med håndskriftsfejl eller dysleksi, og nu har vi erstattet det med skrivefejl. Risikoen er, at med regneark er risikoprofilen hurtigere og større, men jeg tror, at værktøjerne som Statistica vender risikopyramiden.
Jeg tegner ofte dette billede på en tavle af et menneske pindefigur øverst, som en person, og derefter en samling af dem nede i bunden, lad os sige, forestil os ti af dem i bunden af det tavle, og jeg tegner en pyramide, hvor pyramidens punkt ved den enkelte person og foden af pyramiden er samlingen af mennesker. Og jeg bruger dette til at visualisere tanken om, at hvis en person øverst gør et regneark, laver en fejl og deler den med ti personer, og nu har vi fået ti eksemplarer af fejlen. Vær meget forsigtig med dine makroer og vær meget forsigtig med din Visual Basic, hvis du vil flytte til det. For når vi bygger elektroniske værktøjer som regneark, er det meget magtfuldt, men det er også kraftfuldt på en god og en dårlig måde.
Jeg tror, værktøjer som Statistica skaber evnen til at invertere den risikoprofil, og det er, at du nu kan komme til det punkt, hvor du har masser af værktøjer, der er tilgængelige for den enkelte person, og når de går fra masser af værktøjer øverst på pyramiden og derefter ned til bunden, hvor punktet med den pyramide, der nu vendes, er det faktiske værktøj, hvis vi har et team af mennesker, der bygger disse værktøjer og disse algoritmer. Og dataforskeren behøver ikke at være specialist i regressionsanalyse af deres data. De kan muligvis bruge værktøjet, men du har måske fem eller seks statistikere og en aktuar og en datavidenskabsmand og nogle matematikere, der arbejder på det værktøj, det modul, den algoritme, det plug-in og så i regnearkparlance, så forestil dig, at hvert publiceret regneark, som du kunne bruge, faktisk blev skrevet af specialister, der testede makroerne, testet Visual Basic, sørget for, at algoritmerne fungerede, så når du fik dem, kunne du bare pop data ind i det, men du kunne faktisk ikke bryde det og derfor har det været bedre at kontrollere.
Jeg tror, at en masse af analyseværktøjerne gør det. Jeg gætter på at komme til det punkt, er, ser du det ude i marken nu, ser du overgangen fra regneark, der potentielt kunne skubbe fejl og fejl og risiko, til det punkt, hvor de værktøjer, du bygger med din platforme nu, hvor dataopdagelsen er nøjagtig i realtid, og de mennesker, der bygger modulerne og algoritmerne fjerner eller reducerer denne risikoprofil? Ser kundeservice det i ægte forstand, eller tror du, det bare sker, og de er ikke klar over det?
David Sweenor: Du ved, jeg tror, der er et par måder at svare på dette på. Men hvad vi ser er, du ved, i enhver organisation, og jeg nævnte, at analytics, som jeg synes, måske er hænget ud fra et virksomhedsinvesteringsperspektiv, slags hvad vi gjorde med datalagring og CRM. Men hvad vi ser, så det tager meget at ændre en organisation for at komme over den organisatoriske inerti. Men det, vi ser, er folk, der tager deres regneark, tager deres arbejdsgange, og jeg nævnte sikkerheden og styringen, "Nå, måske har jeg et regneark, " "Nå, jeg kan låse dette, og jeg kan version kontrollere det." vi ser en masse organisationer, måske begynder de bare der. Og hvis det er ændret, er der en arbejdsgang og jeg ender med at gå, nummer et dog, hvem har ændret det? Hvorfor de ændrede det. Da de ændrede det. Og jeg kan også oprette en arbejdsgang, så jeg ikke vil sætte dette nye regneark i produktion, medmindre det er valideret og verificeret af en, to, tre, uanset hvor mange parter du vil definere i din arbejdsgang. Jeg tror, folk begynder at tage, og organisationer begynder at tage babyskridt der, men jeg vil sandsynligvis foreslå, at vi har en lang vej at gå.
Dez Blanchfield: Faktisk og jeg tror, når du bygger både sikkerhedskontrollerne og styringen derinde, så kan arbejdsbyrden automatisk kortlægge det ind og alting helt op til den øverste risikobetjent, som nu er en ting. Du kan begynde at kontrollere, hvordan der fås adgang til disse værktøjer og systemer, og hvem der gør hvad med dem, så det er meget magtfuldt. Jeg tror, at de andre ting, der kommer ind i dette, er, at de typer værktøjer, du leverer, for mig, låner til menneskelig adfærd mere end til de traditionelle regneark, som vi taler om, i at hvis jeg har et rum fuldt af mennesker med det samme betjeningspanel og adgang til de samme data, som de faktisk kan få en anden visning og som et resultat få lidt anderledes indsigt fra de samme oplysninger, der passer til deres behov, så de kan samarbejde. Vi har derefter et mere menneskeligt syn og interaktion med forretningen og beslutningsprocessen i modsætning til at alle går til det samme møde med den samme PowerPoint og de samme regneark, der er udskrevet, alle de samme faste data.
Ser du en overgang i adfærd og kultur i organisationer, der slags optager dine værktøjer nu, hvor de ser det foregår, hvor det ikke er som fem mennesker i rummet, der ser på det samme regneark og prøver bare at verbalisere det og notere det, men nu interagerer de faktisk med dashboards og værktøjer i realtid, med visualisering og analyse lige ved hånden og får en helt anden strøm på samtalen og interaktionen, ikke kun i møder, men bare generelt samarbejde omkring organisationen? Fordi de kan gøre det i realtid, fordi de kan stille spørgsmålene og få et rigtigt svar. Er det en tendens, du ser i øjeblikket, eller er der ikke helt sket endnu?
David Sweenor: Nej, jeg tror, det er bestemt startet ned ad den sti, og jeg synes, at det meget interessante er, ved du, hvis vi f.eks. Tager eksemplet på en fabrik. Måske en, der ejer en bestemt proces sektor inden for den fabrik, de ønsker at se og interagere med disse data på en bestemt måde. Og måske mig, med udsigt over alle processer, måske denne i bunden, måske vil jeg se på det på tværs af alt. Jeg tror, hvad vi ser er nummer et, folk begynder at bruge et fælles sæt visualiseringer eller standardvisualiseringer i deres organisationer, men det er også skræddersyet til den rolle, de er i. Hvis jeg er en processingeniør, måske det er et meget andet syn end nogen, der ser på det fra et forsyningskæderperspektiv, og jeg synes, det er fantastisk, fordi det skal skræddersys, og det skal ses på gennem det objektiv, du har brug for for at få dit job gjort.
Dez Blanchfield: Jeg gætter på, at beslutningsprocessen falder, tidsmæssigt og hurtigt, for faktisk at tage smarte og præcise beslutninger stiger også hurtigt, ikke sandt? For hvis du har analyser i realtid, dashboards i realtid, og hvis du har statistica-værktøjerne lige ved hånden, behøver du ikke at løbe hen over gulvet for at spørge nogen om noget, har du det i papirkopi. Du kan slags samarbejde, interagere og faktisk tage beslutninger på farten og få det resultat straks. Hvilket jeg tror, nogle af virksomhederne virkelig ikke har forstået endnu, men når de gør det, vil det være dette eureka øjeblik, hvor, ja, vi kan stadig blive i vores aflukke og arbejde derhjemme, men vi kan interagere og samarbejde og disse beslutninger vi får, når vi samarbejder, bliver øjeblikkeligt til resultater. Se, jeg synes det var fantastisk at høre, hvad du har at sige indtil videre, og jeg ser virkelig frem til at se, hvor det går hen. Og jeg ved, at vi har mange spørgsmål i spørgsmål og svar, så jeg vil løbe tilbage til Rebecca for at løbe gennem nogle af dem, så vi kan komme til dem så hurtigt som du kan. Mange tak.
Rebecca Jozwiak: Tak Dez, og ja Dave, vi har ganske mange spørgsmål fra publikum. Og tak også Dez og Robin for deres indsigt. Jeg ved, at denne bestemte deltager var nødt til at droppe lige øverst på timen, men hun spørger lidt, kan du se, at informationssystemafdelingerne sætter mere prioritet på sofistikerede datakontroller snarere end at være komfortable med at levere værktøjer til videnarbejderne? Jeg mener, er det - gå videre.
David Sweenor: Ja, jeg tror, det afhænger af organisationen. Jeg tror, at en bank, et forsikringsselskab, måske har de forskellige prioriteter og måder at gøre ting på mod en marketingorganisation. Jeg skulle antage, at det bare afhænger af den branche og funktion, du ser på. Forskellige brancher har forskellige fokus og vægt.
Rebecca Jozwiak: Okay, det giver mening. Og så ville en anden deltager vide, hvad er motoren bag Statistica? Er det C ++ eller dine egne ting?
David Sweenor: Nå, jeg ved ikke, om jeg kan få det specifikke med det, da dette har eksisteret i 30 år, og det blev udviklet før min tid, men der er et kernebibliotek med analytiske algoritmer, der er Statistica-algoritmer, der kører. Og du så her, at vi også kan køre R, vi kan køre Python, vi kan sprænge til Azure, vi kan køre på Spark på H2O, så jeg antager, at jeg bliver nødt til at besvare det spørgsmål med hensyn til, det er en række motorer. Og afhængigt af hvilken algoritme du vælger, hvis det er en Statistica-en, kører den sådan, hvis du vælger en på H2O og Spark, bruger den det, og det er derfor en række af dem.
Rebecca Jozwiak: Okay godt. En anden deltagende slags spurgte specifikt peger på dette lysbillede, ville gerne vide, slags, hvordan ved borgerdatavidenskaben hvilke genanvendelige skabeloner, der skal bruges? Og jeg antager, at jeg slags stiller et bredere spørgsmål ud af det. Det, hvad ser du, når forretningsbrugere eller forretningsanalytikere kommer ind, og de vil bruge disse værktøjer, hvor let er det for dem at hente og køre?
David Sweenor: Jeg antager, at jeg ville svare det, og hvis du kan bruge, hvis du er bekendt med Windows, er dette en Windows-baseret platform, så jeg har afskåret toppen af disse skærmbilleder, men det har Windows-båndet. Men hvordan ved de, hvilken arbejdsgang de skal bruge? Det ligner Windows Stifinder, så der er en trestruktur, og du kan konfigurere den og indstille den, dog skal din organisation konfigurere den. Men det kunne være, du ville bare have disse mapper, og du vil placere disse genanvendelige skabeloner i disse mapper. Og jeg tror, at der sandsynligvis er en nomenklatur, som din virksomhed kunne vedtage, og sige her er "beregne risikoprofilen", her er "få data fra disse kilder", og du navngiver dem, hvad du vil. Det er bare en gratis mappe, du trækker bare noterne lige ud på dit lærred. Så temmelig let.
Rebecca Jozwiak: Okay godt. Måske en demo næste gang. Så bringer en anden deltager slags op, og det var, hvad du og Robin og Dez talte om så vidt angår unøjagtighederne, især på et regneark, men affaldet / affaldet ud, og han ser det som værende endnu mere kritisk, når det kommer til analyse. Sådan at nævne, at du ved, misbrug af data virkelig kan føre til nogle uheldige beslutninger. Og han spekulerer på, hvad dine synspunkter er på udviklingen af flere fejlsikre algoritmer, jeg gætter på, at han bruger ordet, "overdådig" brug af analyser. Du ved, nogen kommer ind, de bliver virkelig ophidset, de vil udføre disse avancerede analyser, de vil køre disse avancerede algoritmer, men måske er de ikke helt sikre. Så hvad gør du for en slags beskyttelse mod det?
David Sweenor: Ja, så jeg antager, at jeg vil svare på det så godt jeg kan, men jeg tror, alt kommer til mennesker, proces og teknologi. Vi har teknologi, der hjælper med at aktivere mennesker og hjælper med at aktivere den proces, du vil sætte ind i din organisation. I eksemplet med at sende en kupon til nogen er det måske ikke så kritisk, og hvis det er digitalt er det virkelig ingen omkostninger, måske er der et niveau af sikkerhedskontroller, og måske er vi ligeglad. Hvis jeg forudsiger infektioner på kirurgisk sted, vil jeg måske være lidt mere forsigtig med det. Eller hvis jeg forudsiger lægemiddelkvalitet og sikkerhed og lignende ting, måske måske jeg vil være lidt mere forsigtig med det. Du har ret, affald ind / affald, så hvad vi forsøger at gøre er at levere en platform, der giver dig mulighed for at skræddersy det til den proces, din organisation vil vedtage.
Rebecca Jozwiak: Okay godt. Jeg har nogle flere spørgsmål, men jeg ved, at vi er gået en smule forbi timen, og jeg vil bare fortælle vores præsentanter, det var fantastisk. Og vi vil gerne takke Dave Sweenor fra Dell Statistica. Selvfølgelig, Dr. Robin Bloor og Dez Blanchfield, tak for at være analytikere i dag. Vi vil have en anden webcast næste måned med Dell Statistica. Jeg ved, at Dave er antydet om emnet. Det vil handle om analyse ved kanten, et andet fascinerende emne, og jeg ved, at nogle meget tvingende brugssager vil blive drøftet på denne webcast. Hvis du kunne lide det, du så i dag, så kom tilbage til mere næste måned. Og med det, folk, byder jeg dig farvel. Tusind tak. Hej hej.