Spambayes

Original: http://entrian.com/spambayes/

 

Detta är ett tillägg till artikeln „En introduktion till SpamBayes-projektet“, publicerad i utgåvan mars 2003 av Linux Journal (men det är fortfarande bra även om du inte har läst artikeln).

Som utlovat, har flera saker förändrats sedan artikeln gick till pressen:

Webbplats
Den Linux Journal artikeln pekar på vår Sourceforge projektsida på http://sf.net/projects/spambayes – det är platsen att gå för nedladdningar, rapportera buggar eller begära funktioner, och så vidare. Vi har nu även en hemsida på http://spambayes.sf.net som ger lite bakgrund och dokumentation för projektet, och har pekare till vår mailinglista och till relaterade resurser på webben.

Installer
Det finns nu ett installationsprogram för programvaran. Det är fortfarande en källa-kod fördelning, så du måste fortfarande ha Python 2.2.2 eller senare installerat. Du kan ladda ner installationsprogrammet från Sourceforge projektsida på http://sf.net/projects/spambayes – att installera det, packa upp arkivet till en temporär katalog, cd spambayes-1.0a2 kör sedan python setup.py installera. I Windows, kommer detta att installera olika program som utgör SpamBayes till skript område på din Python installation. På Unix, kommer de att gå in i standardplatsen för Python-skript, vanligtvis / usr / local / bin.

Glöm inte att i Windows, behöver du också den bsddb3 modulen. Det finns en binär installatör tillgänglig från http://pybsddb.sf.net

Webbaserad konfiguration
För människor som vill använda SpamBayes via POP3 proxy, finns det inte längre något behov av att skapa och redigera en bayescustomize.ini – du kan konfigurera allt via webben:

Skapa en katalog för SpamBayes att lagra sina data.
cd till den katalogen och kör python pop3proxy.py-b. Ditt webbläsare bör visas, som visar SpamBayes programmets startsida. Om din webbläsare inte visas, måste du köra det själv och rikta den mot webbadress tryckt av pop3proxy.py.
Klicka på konfigurationssidan länk, och ange namnet på POP3-servern och portnumret för proxy att lyssna på. I Windows är det mest praktiskt att använda port 110, eftersom det är standard för POP3. På Unix (eller Unix-härledda system som MacOS X) bör du använda en hög port som 1110. Klicka på Spara för att spara konfigurationen.
Konfigurera din e-postklient för att prata med proxy. Om din e-postklient för tillfället talar till pop3.example.com på port 110, och du har konfigurerat proxy för att lyssna på port 1110, bör du konfigurera din e-postklient för att prata med localhost (eller namnet på den dator där du re att köra proxy) på port 1110.
Du bör nu kunna hämta din post via proxy, och se X-SpamBayes-Klassificering rubriker läggs till meddelandena. Nu kan du ställa in filter i din e-postklient för att hantera misstänkt spam men du väljer. All din post kommer att klassificeras som osäker tills du tränar programvaran, vilket du också göra via webben med hjälp av sidan Review meddelanden. Om du inte vill vänta på meddelanden att komma fram för träning, kan du använda „ladda upp ett meddelande eller mbox-fil“ formulär för att träna via webbgränssnittet, antingen på enskilda meddelanden eller Unix mbox-filer.

Sekretess för webbgränssnittet
Om du är orolig för andra människor tillgång din SpamBayes webbgränssnittet kan du konfigurera den för att bara acceptera anslutningar från maskinen den körs på. Det gör du genom att lägga till den här:

[html_ui]
html_ui_allow_remote_connections: False
till dina bayescustomize.ini.

Integration med Mutt och Gnus
I contrib katalog distributionskällan är muttrc och spambayes.el, som gör att du kan träna SpamBayes inifrån Mutt och Gnus – se dessa filer för detaljer.

Köra flera fullmakter på samma port
Vissa e-postklienter (särskilt Eudora) inte låter dig ställa in olika portar för olika POP3-servrar. Detta är problem för SpamBayes, eftersom POP3 proxy kan bara prata med en server per port. Lösningen till detta är att tilldela flera adresser till maskinen, och köra en proxy per adress. Här är ett exempel (för MacOS X, men det borde fungera på samma sätt på alla Unix-baserad plattform). Det körs två POP3-proxy, både på port 110, men på olika lokala adresser:

#! / bin / sh
sudo ifconfig lo0 inet 127.0.0.2 add
sudo python pop3proxy.py
Och i bayescustomize.ini:

pop3proxy_servers = pop3.example1.com, pop3.example2.com
pop3proxy_ports = 127.0.0.1:110, 127.0.0.2:110
Med hjälp av webbutbildning gränssnittet med procmail
Om du använder hammiefilter att klassificera post via procmail, kan du fortfarande använda webbutbildning gränssnitt för att träna SpamBayes. När du har en procmail regel ungefär så här:

: 0fw
| hammiefilter.py
du kan lägga till ytterligare en regel som den här:

: 0fw
| proxytee.py
Det kommer att ladda upp varje mottaget meddelande till webbgränssnittet för senare utbildning. Du måste köra pop3proxy.py för detta, men du behöver inte ha några POP3-servrar konfigurerade.

Observera att för närvarande hammiefilter.py och pop3proxy.py använder olika standardinställningar för databas plats – det är något vi kommer att ta upp i framtida versioner, men just nu måste du komma runt detta genom att konfigurera pop3proxy.py att peka på samma databas används av hammiefilter.py. Som standard är ~ / hammiedb -. Gå till webbkonfigurationssidan, skriv in ~ / hammiedb som din databas filnamn och klicka på Spara..

Comments are closed.