Hjem Databaser Hvad er videnopdagelse i databaser (kdd)? - definition fra techopedia

Hvad er videnopdagelse i databaser (kdd)? - definition fra techopedia

Indholdsfortegnelse:

Anonim

Definition - Hvad betyder Knowledge Discovery in Databases (KDD)?

Videnopdagelse i databaser (KDD) er processen med at opdage nyttig viden fra en indsamling af data. Denne vidt anvendte data mining-teknik er en proces, der inkluderer dataforberedelse og -selektion, datarensning, der inkorporerer forudgående viden om datasæt og fortolker nøjagtige løsninger fra de observerede resultater.

Større KDD-applikationsområder inkluderer marketing, bedrageridetektion, telekommunikation og fremstilling.

Techopedia forklarer Knowledge Discovery i databaser (KDD)

Traditionelt blev data mining og viden fundet udført manuelt. Efterhånden som tiden gik, voksede mængden af ​​data i mange systemer til større end terabyte-størrelse og kunne ikke længere opretholdes manuelt. For at få en succesrig eksistens af enhver virksomhed anses det for at være nødvendigt at opdage underliggende mønstre i data. Som et resultat blev flere software-værktøjer udviklet til at opdage skjulte data og antage antagelser, der udgjorde en del af kunstig intelligens.

KDD-processen har nået sit højdepunkt i de sidste 10 år. Det huser nu mange forskellige tilgange til opdagelse, som inkluderer induktiv læring, Bayesianske statistikker, semantisk forespørgseloptimering, videnindsamling for ekspertsystemer og informationsteori. Det ultimative mål er at udtrække viden på højt niveau fra data på lavt niveau.

KDD inkluderer tværfaglige aktiviteter. Dette omfatter datalagring og adgang, skalering af algoritmer til massive datasæt og tolkningsresultater. Datarensning og datatilgangsprocessen inkluderet i datalagring letter KDD-processen. Kunstig intelligens understøtter også KDD ved at opdage empiriske love fra eksperimentering og observationer. De mønstre, der genkendes i dataene, skal være gyldige på nye data og have en vis grad af sikkerhed. Disse mønstre betragtes som ny viden. Trin involveret i hele KDD-processen er:

  1. Identificer målet for KDD-processen ud fra kundens perspektiv.
  2. Forstå de involverede applikationsdomæner og den viden, der kræves
  3. Vælg et måldatasæt eller en delmængde af dataprøver, som opdagelsen udføres på.
  4. Rens og forarbejd data ved at beslutte strategier for at håndtere manglende felter og ændre dataene i henhold til kravene.
  5. Forenkle datasættene ved at fjerne uønskede variabler. Analyser derefter nyttige funktioner, der kan bruges til at repræsentere dataene, afhængigt af målet eller opgaven.
  6. Match KDD-mål med dataindvindingsmetoder for at foreslå skjulte mønstre.
  7. Vælg data mining algoritmer for at finde skjulte mønstre. Denne proces inkluderer beslutning om, hvilke modeller og parametre der kan være passende til den samlede KDD-proces.
  8. Søg efter mønstre af interesse i en bestemt repræsentationsform, der inkluderer klassificeringsregler eller træer, regression og klynger.
  9. Fortolke essentiel viden fra de udvindede mønstre.
  10. Brug viden og integrer den i et andet system til yderligere handling.
  11. Dokumenter det og lav rapporter til interesserede parter.
Hvad er videnopdagelse i databaser (kdd)? - definition fra techopedia