Creare un cocktail antispam: le migliori tecniche di rilevazione e di filtering – Parte III

3. Blocco scientifico dei contenuti. I filtri bayesiani si avvalgono della scienza, sotto forma di statistica, per identificare lo spam. Un filtro bayesiano definisce due tabelle — una per tutte le parole che compaiono nelle e-mail legittime e l’altra …

3. Blocco scientifico dei contenuti.
I filtri
bayesiani si avvalgono della scienza, sotto forma di statistica, per
identificare lo spam. Un filtro bayesiano definisce due tabelle — una per tutte
le parole che compaiono nelle e-mail legittime e l’altra per le parole che
compaiono nello spam — e dà a ogni parola un punteggio.
Nella maggior parte
delle aziende, a una parola come “Viagra” viene dato un punteggio che
indica che molto probabilmente appartiene a un messaggio di spam, al contrario
di quanto avviene per esempio con una parola come “riunione“.

Controllando il punteggio globale della probabilità che il messaggio sia uno
spam, il filtro bayesiano può definire in modo piuttosto accurato se l’e-mail è
legittima o meno.
La cosa interessante di questi filtri è che con il tempo
possono apprendere dalle e-mail: maggiore è il numero di messaggi a cui il
filtro dà un punteggio, migliore diventerà la precisione del punteggio stesso.

I filtri bayesiani non sono però sufficienti a dissuadere gli spammer.
Probabilmente avrete notato strani blocchi di testo in alcuni spam che avete
ricevuto.
Gli spammer hanno iniziato a includere alla fine delle loro e-mail
del testo casuali, insolito o con un aspetto legittimo nel tentativo di
confondere i filtri bayesiani.
Questa procedura si basa sulla teoria che,
aggiungendo molte parole trovate dentro un’e-mail legittima, diminuisce il
punteggio globale relativo alla probabilità che il messaggio sia uno spam e che
quindi più difficilmente venga riconosciuto come tale. L’abilità di imparare del
filtro bayesian può però rivelarsi una lama a doppio taglio.
Per usare nel
modo migliore questa tecnologia, i vostri utenti devono indicare al sistema
quali sono i messaggi di spam che passano attraverso il filtro. Nonostante
questo si traduca solitamente in una semplice procedura di point e click, alcuni
utenti possono essere infastiditi da tale operazione oppure la ignorano
completamente, riducendo di conseguenza l’efficienza del sistema.


Come potete vedere, ciascuno degli ingredienti dentro questo
cocktail antispam aggiunge una proprio contributo alla ricetta. Combinando in
modo adeguato queste tecniche e mettendole a punto, il sistema savvy sys admin
può ridurre in modo significativo il livello dello spam sulla vostra rete,
portandolo dalle dimensioni di un torrente a quelle di un ruscello.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome