Indholdsfortegnelse:
Definition - Hvad betyder karakterisering?
Karakterisering er en big data-metodik, der bruges til at generere beskrivende parametre, der effektivt beskriver egenskaberne og opførslen for en bestemt datapost. Dette bruges derefter i uovervåget indlæringsalgoritmer for at finde mønstre, klynger og tendenser uden at inkorporere klassetiketter, der kan have partier. Det har sine anvendelser i klynge-analyse og endda dyb læring.
Techopedia forklarer karakterisering
Big data-karakterisering er en teknik til at omdanne rådata til nyttig information, der bruges i maskinlæringsalgoritmer og data mining. Karakterisering genererer i det væsentlige kondenserede repræsentationer af uanset informationsindhold, der er skjult i data. Derfor kan det bruges som et middel til at måle og spore begivenheder, ændringer og ny opstående adfærd i store dynamiske datastrømme.
Nogle fordele ved karakterisering:
- Kan generere nyttige metrics til sporing og måling af begivenheder og afvigelser i datasæt
- Opretter små fodaftryksrepræsentationer af væsentlig information
- Gør hurtigt data-til-information-konvertering, hvilket bringer branchen tættere på den fulde data-til-information-til-viden-transformation
- Er nyttig til indeksering og tagging af specifikke objekter, begivenheder og andre funktioner i en dataindsamling
