Indholdsfortegnelse:
Definition - Hvad betyder det Bayesiske filter?
Et bayesisk filter er et computerprogram, der bruger Bayesian-logik eller Bayesian-analyse, der er synonyme udtryk. Det bruges til at evaluere overskriften og indholdet af e-mail-meddelelser og bestemme, om det udgør spam - uopfordret e-mail eller det elektroniske ækvivalent til harddisk-bulk-mail eller junk-mail). Et bayesisk filter bruges bedst sammen med antivirusprogrammer.
Techopedia forklarer det Bayesiske filter
Et bayesisk filter fungerer med sandsynligheder for, at specifikke ord vises i overskriften eller indholdet af en e-mail. Visse ord indikerer en stor sandsynlighed for, at e-mailen er spam, såsom Viagra og refinansiere. Filteret starter ikke med at vide sandsynligheden for, at et ord indikerer en stor sandsynlighed for spam. Brugere skal manuelt identificere e-mailen som spam. Når der findes tilstrækkelige forekomster af ordet, og e-mailen identificeres som spam, lærer det Bayesiske filter "identificering" af ordet ved hjælp af sandsynlighedsfunktioner. Det gør det samme med mange andre ord og sætninger. Med tiden bliver det bayesiske filter mere og mere effektivt til at identificere spam for en bestemt bruger. Når sandsynligheden når en bestemt tærskel, såsom 95 procent, identificeres e-mailen som spam og flyttes ofte til en uønsket mappe (eller nogle gange endda slettes automatisk). Brugeren kan med jævne mellemrum se den og beslutte, om den skal slettes eller ej. Alternativt vil nogle spam-programmer flytte den til en karantæneplacering, hvor brugere kan se e-mailen og gennemgå softwarens beslutning.
Indledende "træning" kan ofte forbedres til at reducere falske positive eller falske negativer, når der findes forkerte vurderinger. Dette tillader softwarens Bayesiske filter at tilpasse sig den spam, der konstant udvikler sig.
Nogle spamfiltre bruger også heuristik sammen med det Bayesiske filter. Forud definerede regler indstilles af brugeren for yderligere at øge nøjagtigheden af at identificere e-mail som spam. Disse regler kan omfatte antallet af forekomster af et givet ord, eliminere eller ignorere neutrale ord som "the", "a" eller "some" eller identificere sekvenser af værker som "Viagra er godt for" i modsætning til at anvende en sandsynlighed funktion til alle fire individuelle ord.
Spammere kan bruge en teknik kaldet Bayesian-forgiftning for at forringe effektiviteten af spamfiltre ved hjælp af Bayesian-filtrering. Nogle teknikker inkluderer indsprøjtning af legitim tekst fra nyheder eller litterære kilder, ved hjælp af tilfældige uskyldige ord, der sjældent findes i spam eller endda erstatte tekst med billeder.
Mange e-mail-klienter deaktiverer visning af billeder af sikkerhedsmæssige årsager. Således kan spam muligvis nå ud til færre modtagere.
Et Bayesian-filter ved hjælp af Bayesian-logik kan bruges til at klassificere alle slags data. Medicin, videnskab og teknik har alle fundet anvendelser. Interessant nok har videnskabelige forskere spekuleret i, at selv den menneskelige hjerne kan bruge Bayesiansk logikmetodologi til at klassificere stimuli og bestemme specifik responsadfærd.
