Af Techopedia Staff, 19. april 2017
Takeaway: Værten Eric Kavanagh diskuterer prognoser med Dr. Robin Bloor, Rick Sherman og IDERAs Bullett Manale.
Du skal tilmelde dig denne begivenhed for at se videoen. Registrer dig for at se videoen.
Eric Kavanagh: Mine damer og herrer, hej endnu en gang og velkommen tilbage til Hot Technologies webcast-serie! Mit navn er Eric Kavanagh, jeg vil være din vært for dagens webseminar, kaldet ”Sparer tid, penge og problemer med optimale prognoser.” ”Kursus jeg savnede den første del af titlen der, ” De bedste planlagte planer. ”Vi altid tale om det på dette show. Så Hot Technologies er selvfølgelig vores forum til at forstå, hvad nogle af de seje produkter er derude i verden i dag, verden af virksomhedsteknologi, hvad folk gør med dem, hvordan de fungerer, alt det slags sjove ting.
Og emnet i dag handler, som jeg antyder, om prognoser. Virkelig prøver du at forstå, hvad der vil ske i din organisation. Hvordan skal du holde dine brugere glade, uanset hvad de laver? Hvis de laver analyse, hvis de laver rigtigt arbejde, står de over for rigtige kunder med transaktionssystemer, uanset hvad tilfældet måtte være, vil du forstå, hvordan dine systemer kører, og hvad der foregår, og det er hvad vi ' Jeg vil tale om i dag. Det er lidt sjovt, fordi prognoser ikke er noget, jeg kan lide at gøre, fordi jeg er overtroisk, som om jeg tror, hvis jeg forudsiger for meget, vil der ske dårlige ting, men det er bare mig. Følg ikke min leder.
Så her er vores præsentanter i dag, dine virkelig i øverste venstre hjørne, Rick Sherman ringer ind fra Boston, vores ven Bullett Manale fra IDERA og vores helt egen Dr. Robin Bloor. Og med det overleverer jeg det til Robin og minder folk bare: Stil spørgsmål, vær ikke genert, vi elsker gode spørgsmål, vi udsender dem til vores præsentanter og andre i dag. Og med det, Robin, tag det væk.
Robin Bloor: OK, da jeg er i pol-position, som de siger, tænkte jeg, at jeg ville fortælle en SQL-historie i dag, fordi det er baggrunden for, hvad diskussionen, der vil foregå, og den uundgåeligt ikke vil komme i konflikt med fordi Rick ikke fokuserer på dette, og ikke vil slå sammen med hvad Rick har at sige. Så SQL-historien, der er nogle interessante ting ved SQL, fordi den er så dominerende. Se, det er en skrivefejl, SQL er et deklarativt sprog. Ideen var, at du kunne oprette et sprog, hvor du ville anmode om, hvad du ville have. Og databasen ville finde ud af, hvordan man får den. Og det har faktisk fungeret temmelig godt, men der er en række ting, der er slags værd at sige om det, konsekvenserne af at basere hele IT-branchen på et deklarativt sprog. Brugeren kender ikke eller bekymrer sig om den fysiske organisering af dataene, og det er den gode ting ved det deklarative sprog - det adskiller dig fra alt dette, og endda bekymre dig om det - bare spørg om hvad du vil, og databasen vil gå og få det.
Men brugeren har ingen idé om, hvordan den måde, de strukturerer SQL-forespørgslen på, vil påvirke effektiviteten af forespørgslen, og det er lidt af en ulempe. Jeg har set forespørgsler, der er hundreder og hundreder af linjer lange, og det er kun en SQL-anmodning, du ved, begynder med "vælg" og fortsætter bare med underforespørgsler og så videre og så videre. Og det viser sig faktisk, at hvis du ønsker en bestemt indsamling af data ud af en database, kan du bede om det på mange forskellige måder med SQL, og få det samme svar, hvis du slags har en vis fortrolighed med dataene. Så en SQL-forespørgsel er ikke nødvendigvis den bedste måde at bede om data, og databaser reagerer helt forskelligt i henhold til den SQL, du lægger i dem.
Og så påvirker SQL faktisk ydelsen, så folk, der bruger SQL, det er sandt for dem, det er også sandt for SQL-programmører, der bruger SQL, og de er endda mindre tilbøjelige til at tænke på den virkning, de vil have, fordi det meste af deres fokus er faktisk på manipulation af data og ikke på indhentning, indhentning af data. Og det samme gælder også BI-værktøjer. Jeg har set den SQL, der, hvis du vil, skubber ud af BI-værktøjer i forskellige databaser, og det må siges, at meget af det er, ja, jeg ville ikke ' t skrive SQL-forespørgsler sådan. Det er nogen, der har oprettet, hvis du vil, en lille motor, at uanset hvilke parametre der er, vil det smide nogle SQL ud, og igen, at SQL ikke nødvendigvis vil være effektiv SQL.
Derefter troede jeg, at jeg ville nævne impedansmatchet, de data, som programmører bruger, er forskellige end dataene, som de sorteres. Så vores DMS gemmer data i tabeller, organiseret den objektorienterede kode er for det meste kodere, programmerer objektorienteret form i dag, og de bestiller data i objektsstrukturer, så den ikke kortlægger den ene til den anden. Så der er en nødvendighed at oversætte fra, hvad programmøren mener, at dataene er til, hvad databasen mener, hvad dataene er. Det ser ud til, at vi må have gjort noget forkert for, at det var tilfældet. SQL har DDL til datadefinition, det har DML - datamanipulationssprog - vælg, projekt og deltag, for at få disse data. Nu er der meget lidt matematik og meget lidt tidsbaseret ting, så det er det ufuldkomne sprog, selvom det må siges, at det er blevet udvidet og fortsat udvides.
Og så får du SQL-barriereproblemet, som altid er lysere end diagrammet, i det, men mange mennesker stillede spørgsmål af analytiske grunde, når de først har fået svaret på spørgsmålene, vil du stille et andet spørgsmål. Så det bliver en dialog ting, ja, SQL var ikke bygget til dialoger, det blev bygget til at spørge, hvad du vil have alle på én gang. Og det er slags værd at vide det, fordi der er nogle produkter derude, der faktisk forlader SQL for at muliggøre samtale mellem brugeren og dataene.
Med hensyn til databasepræstation - og denne form for spredning til alt - ja, der er CPU, der er hukommelse, der er disk, der er netværksomkostninger og der er låsningsproblemet for mere end en person, der ønsker at have en eksklusiv brug af dataene på en given tidspunkt. Men der er også dårlige SQL-opkald, der er meget, der kan gøres, hvis du faktisk optimerer SQL, hvad angår ydeevne. Så, databasepræstationsfaktorer: dårligt design, dårlig programdesign, samtidig manglende arbejdsbelastning, belastningsbalancering, forespørgselsstruktur, kapacitetsplanlægning. Det er datavækst. Og med få ord er SQL praktisk, men den optimerer ikke selv.
Når det er sagt, tror jeg, vi kan videregive til Rick.
Eric Kavanagh: Okay, Rick, lad mig give dig nøglerne til WebEx-bilen. Tage det væk.
Rick Sherman: Okay, fantastisk. Nå tak Robin, da vi begyndte i begyndelsen af præsentationen, er min grafik stadig temmelig kedelig, men vi går med det. Så jeg er enig i alt, hvad Robin talte om på SQL-siden. Men det, jeg vil koncentrere mig lidt om nu, er efterspørgslen efter data, som vi vil gennemgå meget hurtigt, udbuddet som i værktøjer, der bruges i det rum, eller behovet for værktøjer i det rum.
For det første er der nogle i hver artikel, du læser, har at gøre med big data, masser af data, ustrukturerede data, der kommer fra skyen, big data overalt, som du kan forestille dig. Men væksten i databasemarkedet har konstant været med SQL, relationel database sandsynligvis fra 2015, er stadig 95 procent af databasemarkedet. De øverste tre relationelle sælgere har cirka 88 procent af markedsandelen i dette rum. Så vi taler stadig, som Robin talte, om SQL. Og faktisk, selv hvis vi ser på Hadoop-platformen, er Hive og Spark SQL - som min søn, der er en datavidenskabsmand, bruger hele tiden nu - bestemt den dominerende måde for folk at komme til data på.
På databasesiden er der nu to brede kategorier af brug af databaser. Den ene er til operationelle databasestyringssystemer, så forretningsforholdsplanlægning, kundeforhold bemanding, Salesforce ERP'er, Oracle, EPICs, N4s osv., I verden. Og der er en bred mængde og ekspanderende mængde data, der findes i datavarehuse og andre business intelligence-baserede systemer. Årsag alt sammen, uanset hvor og hvordan det indfanges, gemmes eller behandles, bliver det til sidst analyseret, og der er derfor en enorm efterspørgsel og stigning i brugen af databaser, især relationelle databaser ude på markedet.
Nu har vi kravet, vi har enorme mængder data, der kommer. Og jeg taler egentlig ikke bare om big data, men jeg taler om brugen af data på tværs af alle slags virksomheder. Men ledsaget af det fra en forsyningsside, for mennesker, der kan administrere disse ressourcer, har vi først ud, vi har en slags mangel på DBA. Vi har ifølge Bureau of Labor Statistics, fra 2014-2020 vil DBA-job kun vokse med 11 procent - nu er det folk, der har DBA-jobtitler, men vi vil tale om det i et sekund - kontra 40- plus procentvis årlig datavækstplads. Og vi har en masse DBA'er; i gennemsnit er den samme undersøgelse, der talte om gennemsnitsalderen, temmelig høj sammenlignet med andre it-erhverv. Og så har vi en masse mennesker, der forlader banen, ikke nødvendigvis går på pension, men skifter til andre aspekter, går i ledelse eller hvad som helst.
Nu er en del af grunden til, at de forlader, fordi DBA-jobbet bliver stadig sværere og hårdere. For det første har vi DBA'er, der selv administrerer mange forskellige databaser, fysiske databaser, der er placeret overalt, såvel som forskellige typer databaser. Nu kan det være relationelt, eller de kan også være en anden database, databasetyper også. Men selvom det er relationelt, kunne de have en af en, to, tre, fire forskellige leverandører, som de faktisk prøver at styre. DBA'er involveres typisk efter design af databasen eller applikationen. Robin talte om, hvordan databaser eller applikationer bliver designet, hvordan SQL bliver designet. Nå, når vi taler om datamodellering, ER-modellering, udvidet ER-modellering, dimensioneringsmodellering, avanceret dimensionel modellering, uanset hvad, typisk applikationsprogrammører og applikationsudviklere design med deres slutmål for øje - de designer ikke for effektiviteten af selve databasestrukturen. Så vi har meget dårligt design.
Nu taler jeg ikke om de kommercielle virksomheder, der leverer applikationer; de har normalt ER-modeller eller udvidede ER-modeller. Det, jeg taler om, er, at der er meget flere forretningsprocesser og applikationer, der bygges af applikationsudviklere i enhver virksomhed - det er dem, der ikke nødvendigvis er designet til effektivitet eller effektivitet i implementeringen. Og DBA'erne selv er overanstrengede, og de har undertiden ansvar 24/7, de får stadig flere databaser. Jeg tror, det har gjort lidt med, at folk ikke helt forstår, hvad de gør, eller hvordan de gør det. Deres egen lille gruppe og folk tænker bare, ”Nå, alle disse værktøjer er bare så lette at bruge, vi kan bare fortsætte med at kaste flere og flere databaser på deres arbejdsbyrde, ” hvilket ikke er tilfældet.
Hvilket fører os til DBA på deltid og utilsigtet. Vi har IT-teams, der er små, og de har ikke nødvendigvis råd til en dedikeret DBA. Det gælder nu små til mellemstore virksomheder, hvor udvidelsen af database- og databaseapplikationer har eksploderet i det sidste årti og fortsætter med at udvide. Men det er også tilfældet med store virksomheder, der typisk har udført datalagring, analyse af business intelligence i lang, lang tid. For længe siden brugte vi dedikerede DBA'er til disse projekter; vi får aldrig en dedikeret DBA længere. Vi er ansvarlige for at designe databasen, hvilket er fint, hvis det er nogen, der har erfaring. Men generelt er DBA'erne applikationsudviklere, de tager ofte denne rolle som en deltidsdel af deres job, de har ikke formel uddannelse i det og igen, de designer det til deres slutmål, de er ikke designe den til effektivitet.
Og der er meget forskel mellem design og udvikling versus implementering og styring. Så vi har det "penny kloge, pund tåbeligt" med en lille sparegris der, der springer over for at få de færdigheder og ressourcer, der er nødvendige i projekterne. Når jeg tænker på, at alle kommer fra "Nørdenes hævn", er mit lille billede der. Nu, hvad folk har brug for, så har vi en udvidet brug af databaser og data i SQL. Vi har begrænset antal DBA'er - folk, der er dygtige og eksperter til disse tuning og design og styring og implementering situationer. Og vi har flere og flere deltids- eller utilsigtede DBA'er, mennesker, der ikke har haft den formelle træning.
Så hvad er nogle af de andre ting, der også kommer ind i spørgsmålet om, at disse databaser ikke bliver indstillet så godt eller styret så godt? For det første antager mange mennesker, at databasesystemet selv har tilstrækkelige værktøjer til at styre sig selv. Nu bliver værktøjerne lettere og lettere at gøre - design og udvikling - men det er anderledes end at lave et godt design og god styring, kapacitetsplanlægning, overvågning osv. Til implementering. Så for det første antager folk, at de har alle de værktøjer, de har brug for. For det andet, hvis du er en DBA på deltid eller ved et uheld, ved du ikke, hvad du ikke ved.
Jeg har nok glemt noget af udtrykket der, så de mange gange ikke forstår, hvad de endda har brug for at se på i designet, eller når de administrerer eller betjener databaserne. Hvis det ikke er dit erhverv, vil du ikke forstå, hvad du skal gøre. Det tredje er, at SQL er et go-to-værktøj, så Robin talte om SQL, og hvor dårligt SQL sommetider konstrueres eller ofte konstrueres. Og også en af mine kæledyrspæle i BI-datalagring, datamigrering, datateknikplads er, at folk i stedet for at bruge værktøjer har en tendens til at skrive SQL-kode, lagrede procedurer, selvom de bruger et dyre dataintegrationsværktøj eller et dyrt BI-værktøj, de bruger ofte det virkelig bare for at køre lagrede procedurer. Så vigtigheden af at forstå databasedesign og konstruktion af SQL bliver endnu mere og mere vigtig.
Og endelig er der denne silo-tilgang, hvor vi har individuelle mennesker, der ser på individuelle databaser. De ser ikke på, hvordan applikationerne fungerer og interagerer med hinanden. Og de ser også ofte på databaserne i forhold til de applikationer, de bruger dem til. Så den arbejdsbyrde, du får i databasen, er kritisk i designet, kritisk for at indstille den, kritisk i forsøget på at finde ud af, hvordan man planlægger kapacitet osv. Så når man ser på skoven fra træerne, er folk i ukrudt, ser på de individuelle tabeller og databaser og ikke ser på den samlede interaktion mellem disse applikationer i arbejdsbyrden.
Endelig skal folk se på de vigtigste områder, de har brug for at se på. Når de planlægger at administrere databaser, er de nødt til først at tænke over, udvikle nogle applikationscentriske ydelsesmetrikker, så de er nødt til at se på ikke kun, hvordan denne tabel er struktureret, hvordan den er særlig modelleret, men hvordan bruges den? Så hvis du har en virksomhedsapplikation, der skyldes administration af forsyningskæder, hvis du tager ordrer fra nettet, hvis du laver BI - uanset hvad du laver - skal du se, hvem der bruger det, hvordan de er bruger det, hvad datamængderne er, hvornår det vil ske. Hvad du virkelig prøver at se efter er ventetiderne, for uanset hvad, alle applikationer bedømmes efter hvor lang tid det tager at få gjort noget, hvad enten det er en person eller blot udveksling af data mellem applikationer eller processorer. Og hvad er flaskehalse? Så ofte, når du forsøger at fejlsøge problemer, prøver du selvfølgelig virkelig at se på, hvad der er de rigtige flaskehalse - ikke nødvendigvis hvordan man indstiller alt, men hvordan slipper man af og flytter ydelsen op på ventetiderne og gennemstrømning - uanset hvad du har brug for at se på.
Og du skal virkelig adskille datafangst, transaktioner, transformationsaspekter i databasen sammen med analysen. Hver af dem har forskellige designmønstre, hver af dem har forskellige brugsmønstre, og hver af dem skal indstilles forskelligt. Så du er nødt til at tænke over, hvordan disse data bruges, hvornår de bruges, hvad de bruges til, og finde ud af, hvad effektivitetsmålingerne er, og hvad er de vigtigste ting, du vil analysere i forbindelse med denne brug. Når du nu ser på overvågning af ydeevnen, vil du se på selve databasefunktionerne; du vil se på både datastrukturer, så indekserne, opdelingen og andre fysiske aspekter af databasen, endda strukturen i databasen - hvad enten det er ER-model eller dimensionel model, uanset om den er struktureret - alle disse ting har indflydelse på ydelsen især i de forskellige kontekster af datafangstanalyse og de transformationer, der sker.
Og som Robin nævnte på SQL-siden, at se på SQL, der køres af disse forskellige applikationer på tværs af disse databaser, og at indstille den er kritisk. Og ser på de overordnede applikationsarbejdsbelastninger og det infrastrukturmiljø, som disse databaser og applikationer kører på. Så at netværkene, serverne, skyen - uanset hvad de kører på - også ser på virkningen af disse applikationer og disse databaser i denne sammenhæng, har alle disse samspil mellem at være i stand til at indstille databasen.
Og til sidst, når du ser på værktøjer, vil du være i stand til at se på de tre forskellige slags analyser relateret til det. Du vil se på beskrivende analyse: hvad der sker og hvor, relateret til databasen og applikationsydelsen. Du vil have evnen til at udføre diagnostiske analyser for ikke at finde ud af, hvad der sker, men hvorfor sker det, hvor er flaskehalse, hvor er problemerne, hvad der kører godt, hvad kører ikke godt? Men at være i stand til at analysere og bore ned i problemområderne for at adressere disse, enten til design eller hvad du end skal gøre.
Og endelig er den mest aggressive eller proaktive type analyse faktisk at foretage en eller anden forudsigelsesanalyse, forudsigelig analysemodellering, uanset hvad. Vi ved, at databasen og applikationerne fungerer i denne sammenhæng, hvis vi øgede kapaciteten, hvis vi får flere brugere, hvis vi gør mere gennemstrømning, hvad vi end gør, ved at kunne projicere hvad, hvordan og hvor det vil påvirke databasen, applikationerne, giver os mulighed for at planlægge og finde ud af proaktivt, hvor flaskehalserne er, hvor ventetiderne kan lide, og hvad vi skal gøre for at ordne tingene. Så vi ønsker at have værktøjer, der er i stand til at implementere performance-metrics, overvåge ydeevnen, ligesom i disse tre typer analyser. Og det er min oversigt.
Eric Kavanagh: Okay, lad mig aflevere det til - det er to gode præsentationer, forresten - lad mig aflevere dette til Bullett Manale for at tage det derfra. Og folk, glem ikke at stille gode spørgsmål; vi har allerede noget godt indhold. Tag den væk, Bullett.
Bullett Manale: lyder godt. Tak, Eric. Så meget af hvad Rick sagde og Robin sagde, jeg er selvfølgelig 100% enig. Jeg vil sige, at jeg trak dette lysbillede op, fordi jeg synes, det passer, jeg ved ikke for dem af jer, der er "A-Team" fans tilbage i 80'erne, John Hannibal Smith havde et ordsprog om, at han altid ville siger, ”Jeg elsker det, når en plan samles, ” og jeg tror, at når du snakker om især SQL Server, som det er, hvor vi fokuserer, hvilket er det produkt, vi skal tale om i dag, SQL Diagnostic Manager, det er bestemt en af de ting, du skal have; du skal være i stand til at udnytte de data, du har, og være i stand til at tage beslutninger ud fra disse data, og i nogle tilfælde leder du ikke efter en beslutning; du leder efter noget, der kan fortælle dig, når noget vil gå tom for ressourcer, når du vil løbe tør for ressourcer, når du skal have en flaskehals, den slags ting.
Det handler ikke kun om at overvåge en bestemt metrisk. Så med Diagnostic Manager er en af de ting, det gør meget godt, dig til at hjælpe dig med hensyn til forudsigelse og forståelse specifikt for arbejdsmængderne, og vi vil tale om en masse af det i dag. Værktøjet er beregnet til databehandleren, DBA eller den fungerende DBA, så mange af de ting, som Rick nævnte om, den fungerende DBA er så sandt. I mange tilfælde, hvis du ikke er en DBA, vil der være en masse spørgsmålstegn, som du vil have, når det er tid til at styre et SQL-miljø, ting du ikke kender. Og så leder du efter noget, der kan hjælpe dig, føre dig gennem den proces og også uddanne dig i processen. Og så er det vigtigt, at det værktøj, du bruger til den slags beslutninger, vil give dig en vis indsigt i grundene til, at disse beslutninger træffes, det er ikke bare at fortælle dig, "Hej, gør dette."
Fordi jeg er den fungerende DBA, kan jeg til sidst være den fulde slag af DBA med den faktiske ekspertise og viden til at bakke op om den titel. Når det er sagt, når vi taler om at være en databaseadministrator - viser jeg altid slags dette dias først, fordi DBA har nogle forskellige roller, og afhængigt af den organisation, du er hos, vil du have, disse kommer til at variere fra et sted til et andet - men typisk er du altid på en eller anden måde ansvarlig for din opbevaring, din planlægning af denne opbevaring og forståelse af at foregribe, jeg skal sige, hvor meget plads du går at have brug for, hvad enten det er til dine sikkerhedskopier, eller om det er til databaserne selv. Du bliver nødt til at forstå og vurdere det.
Derudover har du brug for at være i stand til at forstå og optimere tingene efter behov, og når du gennemgår overvågningen af miljøet, er det naturligvis vigtigt, at du foretager ændringer, efterhånden som de er nødvendige, baseret på ting, som ændring i selve miljøet. Så ting som antallet af brugere, ting som populariteten af applikationer, sæsonbestemtheden af en database, skal alt tages i betragtning, når du laver din prognose. Og så, selvfølgelig, ser på andre ting i form af at være i stand til at give rapporterne og de oplysninger, der er nødvendige, da det angår at tage disse beslutninger. I mange tilfælde betyder det at foretage en sammenlignende analyse; det betyder at være i stand til at se specifikt på en bestemt måling og forstå, hvad værdien af denne metrisk har været over tid, så du kan forudse, hvor den vil komme videre.
Så hvad en masse af værktøjet Diagnostic Manager gør, har disse muligheder, og folk bruger det hver dag til at være i stand til at gøre ting som forudsigelse, og jeg har lagt definitionen her på kapacitetsplanlægning. Og det er en temmelig bred og faktisk temmelig vag definition, som bare er processen med at bestemme den produktionskapacitet, som en organisation har brug for til at imødekomme de skiftende krav til sine produkter, og i slutningen af dagen er det virkelig det, det handler om: Det er om at være i stand til at tage oplysninger, du har på en eller anden måde, og tage disse oplysninger og tage beslutninger, der hjælper dig med at komme videre, når du skrider frem gennem dine databases livscyklus. Og så, de typer ting, der er grundene til, at folk har brug for dette, er åbenlyst først og fremmest i de fleste tilfælde at spare penge. Virksomheder, det er tydeligvis deres hovedmål er at tjene penge og spare penge. Men i processen sammen med det betyder det også at være i stand til at sikre dig, at din nedetid, der ikke er nogen nedetid. Og at være i stand til at sikre dig, at du mindsker enhver chance for, at nedetid forekommer, så forhindre det i at ske til at begynde med, med andre ord, ikke vente på, at det skal ske, og derefter reagere på det.
Ud over at være i stand til generelt at øge produktiviteten for dine brugere, at gøre dem mere effektive, så du kan få gjort flere forretninger, er det åbenlyst nøglen her, så dette er de typer ting, som DBA eller nogen involveret i prognoser eller kapacitet planlægning bliver nødt til at være i stand til at vade igennem informationen for at være i stand til at træffe disse beslutninger. Og så vil dette helt klart hjælpe dig med at eliminere affald, ikke kun spild i form af penge, men også med hensyn til tid og med hensyn til generelt generelt ressourcer, der muligvis kan bruges til andre ting. Så at være i stand til at eliminere dette affald, så du ikke har mulighedsomkostninger, der er bundet til selve affaldet.
Så med det sagt, hvad er de typer spørgsmål, vi får, specifikke for den person, der er en DBA? Hvornår skal jeg løbe tør for rummet? Det er stort, ikke kun hvor meget plads jeg bruger nu, men hvornår skal jeg løbe tør, baseret på tendenser og fortidens historie? Samme ting med de faktiske forekomster af SQL, databaserne, hvilke servere kan jeg konsolidere? Jeg vil sætte nogle på VM'erne, hvad giver mening med hensyn til hvilke databaser jeg vil konsolidere og hvilke forekomster af SQL skal de opholde sig i? Alle disse typer spørgsmål skal kunne besvares. For i de fleste tilfælde, hvis du er en DBA eller handler DBA, vil du konsolidere det engang i din karriere. I mange tilfælde vil du gøre det løbende. Så du skal være i stand til at tage disse beslutninger hurtigt, ikke spille gætte-spil, når det kommer til det.
Vi talte om flaskehalse, og hvor de skal forekomme næste gang og kunne forudse det igen, i stedet for at vente på, at de skulle ske. Så det er klart, at alle disse ting, vi taler om, giver mening i den forstand, at du er afhængig af historiske data, i de fleste tilfælde for at være i stand til at generere disse henstillinger, eller i nogle tilfælde være i stand til at formulere beslutninger selv, for at kunne komme med disse svar. Men det minder mig om, at når du hører radioannoncer for nogen, der sælger værdipapirer eller lignende, er det altid "fortidens ydeevne er ikke tegn på fremtidige resultater" og den slags ting. Og det samme gælder her. Du vil have situationer, hvor disse prognoser og disse analyser muligvis ikke er 100 procent rigtige. Men hvis du har at gøre med ting, der er sket i fortiden og det kendte, og at være i stand til at tage og gøre "hvad hvis" med en masse af disse typer spørgsmål, du vil løbe ind i, er meget værdifuldt og det vil komme dig meget længere end at spille gætteriet.
Så disse typer spørgsmål kommer tydeligvis til at komme op, så hvordan vi håndterer mange af disse spørgsmål med Diagnostic Manager, først og fremmest har vi prognosefunktioner, hvor vi også kan gøre dette i databasen, ved bordet som drevet eller lydstyrken. For ikke kun at kunne sige, “Hej, vi er fulde af plads”, men seks måneder fra nu, to år fra nu, fem år fra nu, hvis jeg budgetterer til det, hvor meget drevplads skal jeg skal du budgettere med? Det er spørgsmål, jeg bliver nødt til at stille, og jeg bliver nødt til at være i stand til at bruge en metode til at gøre det snarere end at gætte og sætte min finger op i luften og vente på at se, hvordan vinden blæser, hvilket desværre er mange gange, hvordan mange af disse beslutninger tages.
Derudover var det at være i stand til - ser ud som om min lysbillede blev afskåret der lidt - men at være i stand til at yde hjælp i form af henstillinger. Så det er en ting at være i stand til at vise dig et instrumentbræt fyldt med metrics og være i stand til at sige, "OK, her er alle metrics, og hvor de er ved, " men så for at være i stand til at gøre nogle eller have en vis forståelse af hvad man skal gøre, baseret på det er endnu et spring. Og i nogle tilfælde uddannes folk nok i rollen som DBA til at være i stand til at træffe disse beslutninger. Og så har vi nogle mekanismer i værktøjet, der hjælper med det, som vi viser dig på bare et øjeblik. Men at være i stand til ikke kun at vise, hvad anbefalingen er, men også give en vis indsigt i, hvorfor den anbefaling bliver fremsat, og derefter også på toppen af det, i nogle tilfælde faktisk kunne komme med et script, der automatiserer afhjælpning af dette spørgsmål er også ideel.
At gå videre til den næste her, som vi vil se, det er bare generelt set at forstå ned til det metriske niveau, hvad der er normalt. Jeg kan ikke fortælle dig, hvad der ikke er normalt, hvis jeg ikke ved, hvad normalt er. Og så, når du har en eller anden måde at måle det, der er nøglen, og du er i stand til at tage højde for flere typer områder, for eksempel - eller jeg skal sige tidsrammer - forskellige grupperinger af servere, der er i stand til at gøre dette dynamisk, fra et alarmerende perspektiv, med andre ord, midt på natten, under mit vedligeholdelsesvindue, forventer jeg, at min CPU kører på 80 procent baseret på al den vedligeholdelse, der foregår. Så måske vil jeg øge mine tærskler højere i disse tidsrammer kontra måske midt på dagen, når jeg ikke har så meget aktivitet.
Det er nogle ting, der naturligvis vil være miljømæssigt, men ting, som du kan anvende til det, der styres, for at være i stand til at hjælpe dig med at styre dette miljø mere effektivt og gøre det lettere at gøre det. Det andet område er selvfølgelig i stand til bare samlet at give rapporterne og informationen for at kunne besvare disse typer af "hvad hvis" -spørgsmål. Hvis jeg netop har foretaget en ændring af mit miljø, vil jeg forstå, hvad den påvirkning har været, så jeg kan anvende den samme ændring på andre tilfælde eller andre databaser i mit miljø. Jeg ønsker at være i stand til at have nogle oplysninger eller noget ammunition for at være i stand til at foretage den ændring med en vis ro i sindet og vide, at det vil være en god forandring. Så at være i stand til at gøre den sammenlignende rapportering, være i stand til at rangere mine forekomster af SQL, være i stand til at rangere mine databaser mod hinanden og sige, ”Hvilken er min højeste forbruger af CPU?” Eller hvilken der tager længst i vilkår for ventetid og lignende ting? Så mange af disse oplysninger kommer også til rådighed med værktøjet.
Og så, sidst men ikke mindst, er det bare en samlet evne, at du har brug for et værktøj, der vil være i stand til at håndtere uanset situation, der kommer din vej, og så hvad jeg mener med det er, hvis du har et stort miljø med en I mange tilfælde vil du sandsynligvis løbe ind i situationer, hvor du har brug for at trække målinger, der traditionelt ikke er målinger, som en DBA ønsker at overvåge i nogle tilfælde, afhængigt af den særlige situation. Så at have et værktøj, som du kan, det er udvideligt, for at være i stand til at tilføje yderligere målinger og for at kunne bruge disse metrics i samme form og på den måde, som du ville bruge dem, hvis du bruger en out-of-the-box metrisk, for eksempel. Så at være i stand til at køre rapporter, være i stand til at advare, baseline - alle de ting, vi taler om - er også en vigtig del af at være i stand til at udføre denne prognose og gøre det, så du får de svar, du leder efter være i stand til at tage disse beslutninger ved at komme videre.
Nu, som Diagnostic Manager gør dette, har vi en centraliseret service, en gruppe af tjenester, der kører, indsamler data mod 2000 til 2016-tilfælde. Og det, vi gør, er at vi tager disse data, og vi lægger dem ind i et centralt arkiv, og så skal vi naturligvis gøre meget for at kunne give yderligere indsigt, hvad vi gør med disse data. Udover det - og en af de ting, der ikke er der her - har vi også en service, der kører midt på natten, som er vores forudsigelige analysetjeneste, og der gør nogle numre knasende, og det hjælper med at forstå og hjælpe dig som DBA eller fungerende DBA, for at være i stand til at fremsætte disse typer af anbefalinger, for at være i stand til også at give en vis indsigt med hensyn til baseline.
Så hvad jeg gerne vil gøre, og dette er bare et hurtigt eksempel på arkitekturen, det store takeaway her er, at der ikke er nogen agenter eller tjenester, der faktisk sidder i de tilfælde, du administrerer. Men hvad jeg gerne vil gøre er bare at tage dig ind i applikationen her og give dig en hurtig demo. Og lad mig bare gå ud og få det til. Så lad mig vide, jeg tror Eric, kan du se det OK?
Eric Kavanagh: Jeg har det nu, ja.
Bullett Manale: OK, så jeg tager dig gennem nogle af disse forskellige dele, som jeg talte om. Og lad os i det væsentlige starte med den slags ting, der er mere på linje med her, er noget, du skal gøre, eller her er noget, der er et tidspunkt i fremtiden, og vi vil give dig en vis indsigt i det. Og dette er i stand til virkelig at foregribe - eller jeg burde sige dynamisk forudse - ting, som de sker. I tilfælde af rapporter er en af de ting, vi har i værktøjet, tre forskellige prognoserapporter. Og i tilfælde af f.eks. En databaseprognose, hvad jeg sandsynligvis ville gøre i situationen med at kunne forudse størrelsen på en database over en periode, og jeg vil bare give dig et par eksempler på det . Så jeg tager min revisionsdatabase, som er temmelig I / O-intensiv - der har mange data til det. Vi har, lad os se, vi gør dette her, og lad os bare vælge sundhedsdatabasen her oppe.
Men pointen er, jeg ser ikke bare, hvad pladsen er på dette, jeg er i stand til at sige, ”Se, lad os tage det sidste års data værd” - og jeg kommer til at fibre her lidt, Jeg har ikke rigtigt et års værdi af data, jeg har ca. to måneders værdi af data - men fordi jeg vælger en prøvehastighed på måneder her, vil jeg være i stand til at forudse eller forudsige i dette tilfældet med de næste 36 enheder, fordi vores prøvehastighed er indstillet til måneder - det vil sige en enhed, er en måned - og så ville jeg være i stand til at derefter køre en rapport for dybest set at vise mig, hvor vi ville forudse vores fremtidige vækst, for disse tre databaser. Og vi kan se, at vi har en forskellig grad af forskel eller varians mellem de tre forskellige databaser, især med hensyn til den mængde data, de fortæller historisk.
Vi kan se datapunkterne her repræsentere de historiske data, og derefter vil linjen give os prognosen sammen med de tal, der skal sikkerhedskopieres. Så vi kan gøre det på bordniveau, vi kan gøre det selv på drevniveauet, hvor jeg kan forudse, hvor store mine drev vil blive, inklusive monteringspunkter. Vi ville være i stand til at forudsige den samme type information ud, men igen, afhængigt af eksempelprocenten, vil jeg give mulighed for at bestemme, hvor mange enheder og hvor vi tager det, vi vil forudsige. Bemærk også, at vi har forskellige typer prognosetype. Så du får en masse muligheder og fleksibilitet, når det er tid til at udføre prognoser. Nu er det en ting, vi vil gøre, ved faktisk at give dig en bestemt dato og være i stand til at sige "Hej på denne dato, det er her, vi ville forvente, at væksten af dine data bliver." Derudover kan vi dog give dig andre indsigter, der er relateret til nogle af de analyser, vi udfører i løbet af fritidstimerne og tjenesten, når den kører. Nogle af de ting, det gør, er det at forsøge at foregribe de ting, der sandsynligvis vil ske, baseret på historien om, hvornår ting skete i fortiden.
Så vi kan se her, faktisk giver en prognose os en vis indsigt i sandsynligheden for, at vi får problemer i løbet af aftenen ud fra ting, der igen er sket i fortiden. Så åbenlyst er dette fantastisk, især hvis jeg ikke er en DBA, kan jeg se på disse ting, men hvad der er endnu bedre, hvis jeg ikke er en DBA, er denne analysefan. Så før dette var her i værktøjet, ville vi gennemgå og vise produktet til folk, og de ville være "Det er fantastisk, jeg ser alle disse numre, jeg ser alt, men jeg ved ikke hvad jeg skal gøre" (griner) ”Som et resultat af det.” Og så, hvad vi har her, er en bedre måde for dig at være i stand til at forstå, hvis jeg vil tage skridt til at hjælpe med ydeevne, hvis jeg vil tage skridt til hjælpe med sundheden i mit miljø, være i stand til at have en rangeret måde at give disse henstillinger, samt nyttige tip til information for at lære mere om disse henstillinger og faktisk have endda eksterne links til nogle af disse data, som vil vise mig og tage mig til grundene til, at disse henstillinger fremsættes.
Og i mange tilfælde er det at være i stand til at levere et script, der, som jeg sagde, automatiserer afhjælpningen af disse problemer. Nu er en del af det, vi laver her med denne analyse - og jeg viser dig, når jeg går ind for at konfigurere egenskaberne for denne forekomst, og jeg går til afsnittet med analysekonfiguration - vi har en masse forskellige kategorier, der er her anført, og en del af det har vi indeksoptimering og forespørgseloptimering. Så vi vurderer ikke kun selve målingerne og lignende ting, men også ting som arbejdsmængder og indekser. I tilfældet her foretager vi faktisk nogle yderligere hypotetiske indeksanalyser. Så det er en af de situationer, hvor jeg ikke vil, i mange tilfælde vil jeg ikke tilføje et indeks, hvis jeg ikke har brug for det. Men på et tidspunkt er der en slags vippepunkt, hvor jeg siger: ”Nå, tabellen er ved at komme til størrelsen eller de typer forespørgsler, der kører inden for arbejdsbyrden, giver mening nu at tilføje et indeks. Men det ville ikke have været fornuftigt måske seks uger før. ”Så dette giver dig mulighed for dynamisk at få den indsigt i ting, som sandsynligvis, som sagt, vil forbedre ydelsen baseret på hvad der sker i miljøet, hvad der sker inden for arbejdsmængderne, og gør den slags ting.
Og så får du en masse god information her såvel som muligheden for automatisk at optimere disse ting. Så det er et andet område, hvor vi ville være i stand til at hjælpe med, hvad vi kalder forudsigelig analyse. Nu skal jeg udover det også sige, at vi også har andre områder, som jeg synes generelt kun egner sig til at hjælpe dig med at tage beslutninger. Og når vi snakker om at tage beslutninger, endnu engang at være i stand til at se på historiske data, give en vis indsigt for at få os til, hvor vi skal være for at forbedre denne præstation.
En af de ting, vi kan gøre, er nu, at vi har en baseline-visualisator, som giver os mulighed for selektivt at vælge hvilken metrisk vi ønsker - og lad mig finde en anstændig her - Jeg går til SQL CPU-brug, men pointen er dig kan gå tilbage over uanset mange uger for at male disse billeder, så du kan se, hvornår dine outliers er, for at se generelt hvor den værdi falder inden for de tidsperioder, vi har indsamlet data. Og så vil du desuden bemærke, at når vi går ud til selve forekomsten, har vi muligheden for at konfigurere vores baselinjer. Og basislinjerne er en virkelig vigtig del om at være i stand til at automatisere tingene samt at kunne få besked om tingene. Og udfordringen, som de fleste DBA'er ville fortælle dig, er, at dit miljø ikke altid kører det samme i løbet af dagen, kontra aftenen og hvad ikke, som vi nævnte tidligere i eksemplet med de vedligeholdelsesperioder, hvor vi har høje niveauer af CPU eller hvad der måtte ske.
Så i tilfældet her, med disse faktiske baselinjer, kan vi have flere baselinjer, så jeg har muligvis en baseline for eksempel, det er i løbet af mine vedligeholdelsestimer. Men jeg kunne lige så let oprette en baseline til mine produktionstimer. Og poenget med at gøre det er, når vi går ind i en forekomst af SQL, og vi faktisk har disse flere baselinjer, så ville vi være i stand til at forudse og være i stand til at udføre en form for automatisering, en eller anden form for afhjælpning eller bare advarsel generelt, forskelligt specifikt for tidens vinduer. Så en af de ting, du vil se her, er disse baselinjer, som vi genererer, bruger de historiske data til at levere den analyse, men vigtigere er, at jeg kan ændre disse tærskler statisk, men jeg kan også automatisere disse dynamisk også. Når vedligeholdelsesvinduet, eller jeg skal sige, at vedligeholdelsesgrundvinduet kommer op, skifter disse tærskler automatisk specifikke til de belastninger, som jeg støder på i det tidsvindue, kontra måske midt på dagen, når mine belastninger er ikke så meget, når arbejdsmængderne ikke er så effektive.
Så det er noget andet, du skal huske på, med hensyn til baseline. Det er klart, at dette vil være meget nyttigt for dig med hensyn til også at forstå, hvad der er normalt, og at du også kan forstå, engagere dig, når du også er ved at løbe tør for ressourcer. Nu, den anden slags ting, vi har i værktøjet, som vil hjælpe dig med at tage beslutninger, ud over baslinjen og at være i stand til at konfigurere alarmer omkring disse baselinjer og de tærskler, du opretter dynamisk, er som jeg sagde tidligere, bare at være i stand til at køre en hel række rapporter, der hjælper mig med at besvare spørgsmål om, hvad der foregår.
Så som et eksempel, hvis jeg havde 150 forekomster, jeg styrer - i mit tilfælde gør jeg ikke det, så vi er nødt til at spille det foregive spil her - men hvis jeg havde alle mine produktionsinstanser, og jeg var nødt til at forstå, hvor det område, som jeg har brug for opmærksomheden på, med andre ord, hvis jeg kun har en begrænset tid til at udføre en form for administration for at forbedre ydeevnen, vil jeg fokusere på de centrale områder. Og så med det sagt, ville jeg være i stand til at sige, "Baseret på dette miljø, rangér mine tilfælde mod hinanden og giv mig den placering ved hjælp af stridsrør." Så hvad enten det er diskbrug, hukommelsesforbrug, om det venter, Uanset om det er svartid, er jeg i stand til at korrelere - eller jeg skal sige rang - disse tilfælde mod hinanden. Det er klart, det forekomst, der er øverst på hver liste, hvis det er den samme instans, er det sandsynligvis noget, jeg virkelig vil fokusere på, fordi det åbenbart igen er øverst på listen.
Så du har mange rapporter i værktøjet, der hjælper dig med at rangere miljøet på forekomstniveau; du kan også gøre dette på databaseniveau, hvor jeg kan rangere mine databaser mod hinanden. Især med tærskler og områder, som jeg kan indstille, kan jeg endda oprette jokertegn her, hvis jeg vil, for kun at fokusere på bestemte databaser, men pointen er, at jeg kan sammenligne mine databaser på samme måde. For så vidt angår andre typer komparativ analyse og det store i dette værktøj, er den baseline-analyse, som vi har. Så hvis du ruller ned til servicevisningen her, vil du se, at der er en grundlæggende statistikrapport. Nu vil denne rapport naturligvis hjælpe os med at forstå ikke kun, hvad de metriske værdier er, men for en bestemt instans kunne jeg gå ud, og for en hvilken som helst af disse beregninger, faktisk være i stand til at se på basislinjerne for disse målinger.
Så hvad end det måtte være, som en procentdel eller hvad jeg end kunne gå ud og sige, "Lad os se baseline for dette, der er udbrudt i de sidste 30 dage, " i hvilket tilfælde det viser mig de faktiske værdier kontra baseline og Jeg ville selvfølgelig være i stand til at tage nogle beslutninger ved hjælp af disse oplysninger, så dette er en af disse situationer, hvor det vil afhænge af hvilket spørgsmål det er, som du stiller på det tidspunkt. Men dette vil naturligvis hjælpe dig med mange af disse spørgsmål. Jeg ville ønske, jeg kunne sige, at vi havde en rapport, der gør det hele, og det er ligesom den lette rapport, hvor du trykker og holder på, og den svarer bare på ethvert "hvad hvis" -spørgsmål, du nogensinde kunne svare på. Men virkeligheden er, at du vil have en masse attributter og en masse muligheder for at være i stand til at vælge imellem i disse pull-downs for at være i stand til at formulere disse "hvad hvis" -typespørgsmål, som du leder efter .
Så mange af disse rapporter er rettet mod at kunne besvare disse typer spørgsmål. Og så er det virkelig vigtigt også, at disse rapporter og derudover alle de ting, vi allerede har vist dig i værktøjet, som jeg nævnte før, har fleksibilitet til at indarbejde nye målinger, der skal styres, endda være i stand til at skabe tællere eller SQL-forespørgsler, der er inkorporeret i dine pollingintervaller, for at være i stand til at hjælpe mig med at besvare disse spørgsmål, at du måske kan tilføje disse ting ud af boksen, som vi ikke forventede at overvåge. Og du vil være i stand til derefter at gøre alle de samme ting, som jeg lige har vist dig: baseline, køre rapporter og oprette rapporter fra den metrics, og være i stand til at besvare og gøre en masse af disse forskellige typer ting, som jeg viser dig her.
Nu, udover det - og en af de ting, vi tydeligvis har fundet en hel del i det seneste, er - først var det, alle, der flippede eller skiftede til VM'er. Og nu har vi mange mennesker, der er på vej mod skyen. Og der er mange spørgsmål, der dukker op omkring disse typer ting. Er det fornuftigt for mig at flytte til skyen? Skal jeg spare penge ved at flytte til skyen? Hvis jeg skulle placere disse ting på en VM på en maskine med delt ressource, hvor mange penge kan jeg spare? Disse typer spørgsmål kommer tydeligvis også frem. Så mange af disse ting skal huske, med Diagnostic Manager kan vi tilføje og trække fra de virtualiserede miljøer i både VMware og Hyper-V. Vi kan også tilføje forekomster, der er ude på skyen, så dine miljøer som f.eks. Azure DB, eller endda RDS, kan vi også trække målinger fra disse miljøer.
Så der er en masse fleksibilitet og meget at være i stand til at besvare disse spørgsmål, da det vedrører de andre typer miljøer, som vi ser mennesker er på vej hen. Og der er stadig mange spørgsmål omkring disse ting, og når vi ser folk konsolidere disse miljøer, har de brug for også for at kunne svare på disse spørgsmål. Så det er et temmelig godt overblik, vil jeg sige, af Diagnostic Manager, da det vedrører dette emne. Jeg ved, at emnet business intelligence kom op, og vi har også et værktøj til business intelligence, som vi ikke talte om i dag, men det kommer også til at give dig indsigt i at besvare disse typer spørgsmål, da det vedrører din terninger og alle disse forskellige typer ting også. Men forhåbentlig har dette været et godt overblik, i det mindste med hensyn til, hvordan dette produkt kan hjælpe med at kunne formulere en god plan.
Eric Kavanagh: Okay, gode ting. Ja, jeg kaster det ud til Rick, hvis han stadig er derude. Rick, spørgsmål fra dig?
Rick Sherman: Ja, så først op, dette er fantastisk, jeg kan godt lide det. Jeg kan især godt lide at udvide til VM'er og skyer. Jeg ser, at en masse appudviklere mener, at hvis det er i skyen, så behøver de ikke at indstille det. Så-
Bullett Manale: Okay, vi er stadig nødt til at betale for det, ikke? Du er stadig nødt til at betale for hvad det nu er, som folk lægger på skyen, så hvis det kører dårligt, eller hvis det forårsager en masse CPU-cyklusser, er det flere penge, du skal betale, så det er det ikke, du stadig nødt til at måle disse ting, absolut.
Rick Sherman: Ja, jeg har set en masse dårlige motiver i skyen. Jeg ville gerne spørge, ville dette produkt også blive brugt - Jeg ved, at du nævnte BI-produktet, og du har masser af andre produkter, der interagerer med hinanden - men ville du begynde at se på SQL-ydeevne, individuelle forespørgsler i dette værktøj? Eller ville det være andre værktøjer, der ville blive brugt til det?
Bullett Manale: Nej, det ville det absolut. Det er en af de ting, som jeg ikke dækkede, og som jeg mente, er forespørgselsdelen af det. Vi har mange forskellige måder at identificere forespørgselsydelsen på, uanset om det er relateret til, specifikt at vente, som vi ser på dette synspunkt her, eller om det er relateret til ressourceforbruget af forespørgsler generelt, der er et helt antal måder, vi kan analysere forespørgsel på ydeevne. Det er om det er varighed, CPU, I / O, og endnu en gang, vi kan også se på selve arbejdsmængderne for at give en vis indsigt. Vi kan give anbefalingerne i analysesektionen, og vi har også en webbaseret version, der indeholder information omkring forespørgsler selv. Så jeg kan få anbefalinger om manglende indekser og evnen til at se udførelsesplanen og alt det slags; det er også en evne. Så absolut kan vi diagnosticere forespørgsler syv veje til søndag (griner) og være i stand til at give den indsigt med hensyn til antallet af henrettelser, det være sig ressourceforbrug, ventetiden, varigheden, alt det gode.
Rick Sherman: OK, fantastisk. Og hvad er så belastningen på selve forekomsterne med al denne overvågning?
Bullett Manale: Det er et godt spørgsmål. Udfordringen med at besvare dette spørgsmål er, afhænger det, det er ligesom noget andet. Meget af hvad vores værktøj har at tilbyde, det giver fleksibilitet, og en del af denne fleksibilitet er, at du får at fortælle det, hvad det skal samles, og hvad der ikke skal indsamles. Så for eksempel med selve forespørgslerne, behøver jeg ikke at indsamle ventningsinformationen, eller det kan jeg også. Jeg kan indsamle oplysninger relateret til forespørgsler, der overstiger en varighed af tiden, for udførelsen. Som et eksempel på dette, hvis jeg skulle gå ind på konfigurationsforespørgselsmonitoren, og jeg skulle sige, ”Lad os ændre denne værdi til nul, ” virkeligheden er, at bare dybest set får værktøjet til at samle alle forespørgsler, der kører, og det er virkelig ikke ånd af hvorfor det er der, men generelt set, hvis jeg ville give en komplet stikprøve af data til alle forespørgsler, kunne jeg gøre det.
Så det er meget relativt til, hvad dine indstillinger generelt er ude af boksen. Det er overalt fra ca. 1-3 procent overhead, men der er andre betingelser, der vil gælde. Det afhænger også af, hvor meget portforespørgsler der kører på dit miljø, ikke? Det afhænger også af metoden til indsamling af disse spørgsmål og hvilken version af SQL det er. Så for eksempel SQL Server 2005 vil vi ikke være i stand til at trække fra udvidede begivenheder, mens vi derfor trækker fra et spor for at gøre det. Så det ville være en smule anderledes med hensyn til den måde, vi ville gå på med at indsamle disse data, men når det er sagt, har vi, som sagt, eksisteret, for jeg gætte siden omkring 2004 med dette produkt. Det har været i lang tid, vi har tusinder af kunder, så det sidste, vi gerne vil gøre, er at have et værktøj til overvågning af ydeevne, der forårsager ydelsesproblemer (griner). Og så prøver vi at undgå det så meget som muligt, men generelt set er ca. 1-3 procent en god tommelfingerregel.
Rick Sherman: OK, og det er ret lavt, så det er fantastisk.
Eric Kavanagh: Godt. Robin, nogen spørgsmål fra dig?
Robin Bloor: Jeg er ked af, jeg var i stum. Du har en flere databasefunktioner, og jeg er interesseret i, hvordan du kan se på flere databaser, og derfor kan du vide, at en større ressourcebase muligvis er opdelt mellem forskellige virtuelle maskiner og så videre og så videre. Jeg er interesseret i, hvordan folk rent faktisk bruger det. Jeg er interesseret i, hvad kunderne laver med det. Fordi det ser for mig godt ud, det bestemt, da jeg rodede sammen med databaser, noget jeg aldrig havde på hånden. Og jeg ville kun nogensinde overveje et eksempel på nogen meningsfuld måde på et givet tidspunkt. Så hvordan bruger folk dette?
Bullett Manale: Generelt taler du generelt kun om selve værktøjet? Hvordan bruger de det? Jeg mener generelt, det handler om at være i stand til at have et centralt punkt i miljøets tilstedeværelse. At have ro i sindet og vide, at hvis de stirrer på en skærm og ser grønt, ved de, at alt er godt. Det er når der opstår problemer, og åbenbart de fleste af sagerne fra en DBA's perspektiv, mange gange forekommer disse problemer, når de er foran konsollen, så at være i stand til at blive underrettet, så snart problemet sker. Men derudover at være i stand til at forstå, når problemet sker, at være i stand til at komme til hjertet af de oplysninger, der giver dem en vis kontekst med hensyn til, hvorfor det sker. Og det er, tror jeg, den største del: At være proaktiv overfor det, ikke være reaktiv.
De fleste af DBA'erne, jeg taler med - og det ved jeg ikke, det er en god procentdel af dem - er desværre stadig i den reaktive type miljø; de venter på, at en forbruger nærmer sig dem for at fortælle dem, at der er et problem. Og så ser vi mange mennesker forsøger at bryde væk fra det, og jeg tror, det er en stor del af grunden til, at folk kan lide dette værktøj, er at det hjælper dem med at være proaktive, men det giver dem også indsigt i, hvad der foregår, hvad er problemet, men i mange tilfælde, hvad vi i det mindste finder - og måske er det bare DBA'erne, der fortæller os dette - men DBA'erne, opfattelsen er, at det altid er deres problem, selvom det er applikationsudvikleren, der skrev applikationen der skrev ikke det ordentligt, det er dem, der vil tage skylden, fordi de tager denne applikation ind i deres systemer eller servere, og når resultaterne er dårlige, peger alle på DBA, ”Hej, det er din skyld.”
Så dette værktøj bliver mange gange brugt til at hjælpe med at gøre det muligt for DBA at sige, “Hej, det er her problemet ligger, og det er ikke mig.” (Ler) Vi er nødt til at forbedre dette, uanset om det ændrer forespørgsler eller hvad det måtte være. I nogle tilfælde falder det i deres spand med hensyn til deres ansvar, men i det mindste at have værktøjet til at være i stand til at hjælpe dem med at forstå det og vide det, og at gøre det på en rettidig måde er naturligvis den ideelle tilgang.
Robin Bloor: Ja, de fleste af de websteder, som jeg er bekendt med, men det har været et stykke tid siden jeg har været derude og kigget på forskellige multidatabase-websteder, men mest hvad jeg plejede at finde var at der ville være DBA'er, der fokuserede på en håndfuld databaser. Og det ville være databaserne, at hvis de nogensinde gik ned, ville det være et rigtig stort problem for virksomheden, og så videre og så videre. Og de andre, de indsamler bare statistik nu og da for at se, at de ikke løber tør for plads, og de ville aldrig se på dem overhovedet. Og mens du udførte demoen, så jeg på dette, og jeg tænkte godt, på en eller anden måde udvider du bare ved at give noget lignende til databaser, der ofte var, brydde ingen sig for meget om, fordi de har datavækst, de har også applikationsvækst til tider. Du udvider DBA-dækning på en ganske dramatisk måde. Så det er det, spørgsmålet egentlig handler om, er det, at du med et sæt værktøjer som dette ender med at være i stand til stort set at give en DBA-service til enhver database, der findes i virksomhedsnetværket?
Bullett Manale: Sikker på, jeg mener, udfordringen er, er, at ligesom du sagde temmelig veltalende, er som om der er nogle databaser, som DBA'erne interesserer sig for, og så er der nogle, de ikke bryder sig om så meget. Og den måde, netop dette produkt, den måde, det er licenseret på, er pr. Instans. Så der er, antager du, du vil sige, en tærskel for, når folk beslutter “Hej, dette er ikke et kritisk nok tilfælde, at jeg vil administrere det med dette værktøj.” Når det er sagt, er der andre værktøjer, som vi gør har der mere, antager jeg, at der er catering til de mindre vigtige tilfælde af SQL. En af dem ville være som Inventory Manager, hvor vi foretager lette sundhedskontroller mod forekomsterne, men ud over det, vi gør, er vi at finde, så vi identificerer nye tilfælde, der er bragt online og derefter fra det tidspunkt, som en DBA kan jeg sige, ”OK, her er en ny forekomst af SQL, er det nu Express? Er det gratisversionen, eller er det en virksomhedsversion? ”Det er sandsynligvis et spørgsmål, jeg vil stille mig selv, men for det andet, hvor vigtig er den instans for mig? Hvis det ikke er så vigtigt, har jeg måske dette værktøj til at gå ud og gøre det, generisk, hvad jeg vil kalde generisk sundhedskontrol i den forstand, at det er de elementære typer af ting, jeg er interesseret i som DBA: Er drevet påfyldt ? Besvarer serveren problemer? De vigtigste ting, ikke?
Mens Diagnostic Manager, det værktøj, jeg lige viste dig, det vil komme ned på forespørgselsniveauet, det vil komme ned i anbefalingen fra indekser, se på udførelsesplanen og alt det gode, mens dette hovedsageligt er fokuseret på hvem ejer hvad, hvad er det, jeg ejer, og hvem er ansvarlig for det? Hvilke servicepakker og hot fixes har jeg? Og kører mine servere med de vigtigste ingredienser i det, jeg ville betragte som et sundt eksempel på SQL? Så for at besvare dit spørgsmål er der lidt af en blanding. Når vi har folk, der ser på dette værktøj, ser de typisk på et mere kritisk sæt af forekomster. Når det er sagt, har vi nogle mennesker, der køber alle eksempler, de har, og administrerer det, så det afhænger bare. Men jeg siger, generelt er der bestemt en tærskel for de mennesker, der mener, at deres miljø er vigtigt nok til at have et værktøj som dette til at styre disse tilfælde.
Robin Bloor: Okay, et andet spørgsmål, før jeg overleverer det til Eric. Det indtryk man får, bare ved at se branchen er, at databaser stadig har et liv, men alle data hældes ud i alle disse datasøer og så videre og så videre. Det er den hype, virkelig, og den hype afspejler aldrig virkeligheden, så jeg er interesseret i, hvilken slags virkelighed du opfatter derude? Er de vigtige databaser inden for en organisation, oplever de den traditionelle datavækst, som jeg plejede at tænke på som 10 procent om året? Eller vokser de mere end det? Er det store data, der fremstiller disse databaser til ballon? Hvad er det billede, du ser?
Bullett Manale: Jeg tror, at i mange tilfælde ser vi nogle af dataene, der flyttes til de andre segmenter, hvor det er mere fornuftigt, når der er andre teknologier, der er blevet tilgængelige. Som for nylig nogle af de større data ting. Men disse databaser, vil jeg sige, det er svært at generalisere i mange tilfælde, fordi alle er lidt forskellige. Generelt set er jeg dog en vis afvigelse. Som jeg sagde, er folk ved at flytte til de elastiske modeller i mange tilfælde, fordi de ønsker at vokse ressourcerne og ikke så meget på andre områder. Nogle mennesker flytter til big data. Men det er svært at få en fornemmelse af, siger du, opfattelsen, for generelt taler de folk, jeg taler til, alle de traditionelle databaser og bruger dette i et SQL Server-miljø.
Når det er sagt, vil jeg sige med hensyn til selve SQL, jeg synes bestemt stadig, at det vinder markedsandele. Og jeg tror, at der er en masse mennesker, der stadig er på vej mod SQL fra andre steder som Oracle, fordi det er mere overkommelig og ser ud til at være åbenlyst, da SQL-versioner bliver mere avancerede - og du ser dette med de nyere ting, som foregår med SQL, hvad angår kryptering og alle de andre muligheder, der gør det til et miljø eller en databaseplatform - det er åbenlyst meget missionskritisk, antager jeg. Så det tror jeg også, vi ser. Hvor du ser et skift, sker det stadig. Jeg mener, det skete for 10 år siden, det sker stadig, tror jeg, i form af SQL Server, hvor miljøet vokser og markedsandelen vokser.
Robin Bloor: OK, Eric, jeg formoder, at publikum har et spørgsmål eller to?
Eric Kavanagh: Ja, lad mig kaste en hurtig en hen til dig. Det er faktisk et ret godt spørgsmål. En af de deltagende spørger, vil dette værktøj fortælle mig, om en tabel muligvis har brug for et indeks for at fremskynde forespørgslen? I bekræftende fald, kan du vise et eksempel?
Bullett Manale: Ja, så jeg ved ikke, om jeg har en til et specifikt tilføjelse af et indeks, men du kan se her, vi har fragmenteringsanbefalinger her. Jeg tror også bare, vi lige havde haft, og dette var en del af Diagnostic Manager, der tilbyder den webbaserede version, hvor det fortæller mig, at jeg har et manglende indeks. Og vi kan se disse anbefalinger, og det vil fortælle os den potentielle gevinst ved at indeksere disse oplysninger. Den anden ting, jeg bare skal nævne, er, at når vi udfører anbefalingerne, vil scriptet blive bygget til det for mange af disse. At man ikke er et godt eksempel, men du vil være i stand til at se, ja, de situationer, hvor et indeks - enten et duplikatindeks eller tilføjelse af et indeks - ville forbedre ydeevnen, og som jeg sagde tidligere, gør vi meget af det gennem hypotetisk indeksanalyse. Så det hjælper virkelig med hensyn til forståelse af arbejdsbyrden at være i stand til at anvende det på anbefalingen.
Eric Kavanagh: Det er gode ting, og dette vil give mig et godt afsnit til de endelige kommentarer her. Robin og jeg og Rick har også hørt i mange år nu, der er tale om selvindstillende databaser. Det er en selvindstillingsdatabase! Alt hvad jeg kan fortælle dig er: Tro ikke dem.
Bullett Manale: Tro ikke på hypen.
Eric Kavanagh: Der kan være nogle små små ting, der gøres dynamisk, men endda det, kan du tjekke det ud og sørge for, at det ikke gør noget, du ikke vil have det til at gøre. Så i ganske lang tid har vi brug for værktøjer som dette for at forstå, hvad der sker på databaseniveau, og som Robin sagde, datasøer er fascinerende koncepter, men der er sandsynligvis omtrent lige så stor chance for, at de overtager, som der er af der er et Loch Ness-monster når som helst snart. Så jeg vil bare sige igen, den virkelige verden har en masse databaseteknologi, vi har brug for mennesker, DBA'er, til at se på dette og syntetisere det. Du kan fortælle, at du er nødt til at vide, hvad du laver for at få disse ting til at fungere. Men du har brug for værktøjerne til at give dig informationen for at vide, hvad du laver. Så bundlinjen er, at DBA'er klarer sig fint.
Og en stor tak til Bullett Manale og vores venner på IDERA. Og selvfølgelig Rick Sherman og Robin Bloor. Vi arkiverer alle disse webcasts, så hopp online insideanalysis.com eller til vores partnerwebsted www.techopedia.com for at få flere oplysninger om alt det.
Og med det giver vi dig farvel, folkens. Tak igen, vi taler til dig næste gang. Pas på. Hej hej.