Официален версии: в
английски или
Franais или
италиански злато
български
Отговорник: Дейвид Relson <relson@osagesoftware.com>
Преводач: Фабрис Prigent <Fabrice.Prigent@univ-tlse1.fr>
Този документ е предназначен да ни отговори на въпросите за frquemment bogofilter пози.
Bogofilter Bayesian филтър е бързо надолу за работата на
Пол Греъм
в статията си план срещу спам. Bogofilter използва алгоритъм на средната gomtrique
Gary Robinson
с промени
mthode Фишър (chi2)
за класифициране на спам и бутове
(NDT: липсата на спам поща).
Уеб страницата на bogofilter в SourceForge е фокусна точка за всички ресурси на bogofilter.
Bogofilter т кр от Eric S. Raymond на 19 AOT 2002 година. Тя придоби популярност, тъй като септември 2002 г., както и много програмисти са започнали да участват.
Файлът НОВИНИ Описва историята на версии на bogofilter.
Bogofilter е един вид bogomtre
(bogometer)
или филтър бъг
(bogon-филтър)
е, че тя се опитва да се идентифицират фалшиви имейли
(фалшиви)
чрез измерване на техните Bogos
(Bogosity).
Обърнете внимание на първата
част
ТЕОРИЯ
НА РАБОТА на ръководството за въвеждане. Основният източник за
разбиране е статията на Gary Robinson в Linux Journal
“статистически подход към Спам проблем”
(A статистически подход към проблема на спам).
APRS четете това, вероятно имате някакви въпроси. ПЪРВИТЕ може да бъде “bogofilter той наистина е Bayesian филтър за спам?” Bogofilter е ниско на Thorma Бейс и го използва в част първа на изчисление, както и други статистики mthodes след това. Следователно можем да кажем, че това е спам филтър на Бейс статистика с един аромат.
Други въпроси, които могат да се отнасят към hypothses нападение вас или prrequis на Тората Бейс. В rponses са прости: “Не, те не са изпълнени” и “На кого му пука, докато тя работи.” По-rponse labore споменава, че основната предпоставка, която казва “имейл случаен образ е сбор от думи, напълно indpendants всеки друг” е изнасилване. Има няколко места, където тази практика се свободи с Тора. Някои от тях са през цялото време Изпратено други dpendent на Manir използвате bogofilter:
Когато мъжът страница обяснява, bogofilter се опитва да се справи с влиянието на тези ngative hypothses не се спазват. Някои казват, че “картата Ralite gnral работят в наша полза” (член на Гари). Други казват, че дори в този случай, ние не трябва да стане твърде картера hypothses база. В действителност, о не знае наистина. Просто имайте предвид, че ако “зареди муле”, проблемът ще възникнат. Подходът на CL bogofilter е: това, което най-важното е, че той работи в света REL.
Сега, когато имате тон prvenus, да се забавляват и използването bogofilter на най-добрите от вас.
Понастоящем съществуват четири пощенски списъци за bogofilter (на английски):
Адрес списъци | Връзки | Описание |
---|---|---|
bogofilter-announce@bogofilter.org | [Абонамент] [архиви: пощальон, Gmane] |
O списък на реклами са новите версии. |
bogofilter@bogofilter.org | [Абонамент] [архиви: пощальон, Gmane] |
А gnraliste пощенския списък на bogofilter. |
bogofilter-dev@bogofilter.org | [Абонамент] [архиви: пощальон, Gmane] |
Борса за списък на петна, на dveloppement и технически дискусии. |
bogofilter-cvs@lists.sourceforge.net | [Абонамент] [Архив] |
В списъка, за да обяви промени в кода на CVS архив. |
За да се класифицират съобщения като шунка или спам, bogofilter
трябва да научи вашата поща. За начало, най-добре е да има тяло
(възможно най-широка) на вашия съобщения SR на държавата, шунка
или спам. (Грешки тук ще доведе до проблем по-късно, така че
бъдете внимателни;-)
). Бъдете внимателни, използвайте само
вашата електронна поща. Използването на друг орган (като орган по
интернет), може да доведе до bogofilter да изготви погрешни
заключения В крайна сметка, целта ви е да го накара да
разбере вашето мнение.
След като сте си корпус на спам и шунка, имате четири възможности за избор. Във всички случаи това работи най-добре, ако си за обучение, (корпуса по-горе) е consquente. Плюс един корпус е малък, толкова по-голям броят на грешките, ще bogofilter в производството. Да предположим, че тялото ви е в два файла mbox: ham.mbox и spam.mbox.
Mthode 1) Full Обучение: Entran bogofilter с всичките си съобщения. В нашия пример:
bogofilter -s < spam.mbox bogofilter -n < ham.mbox
Забележка: директорията допринесоха bogofilter съдържа две
скриптове, които и двете използват техника за обучение по
грешка. Тази техника добавя стойност и всяко съобщение до базата
данни, че посланията, които са били на стойност лош тон (съобщения
маркирани като несигурни, шунка е струвало като спам или
обратното). Целта е да се CRER база данни от думи наистина
ncessaires правилно да класифицира съобщения. Rsultante
до базата данни е по-малка от пълната обучение.
Mthode 2) Използвайте скрипта bogominitrain.pl (в допринесоха
директория). Той мнения същия обхват като стойност вашата пощенска
кутия файлове. Вие трябва да използвате опцията-F ще инструктира
работа rpter скрипт, докато, че всички съобщения са правилно
classs. (Ако ncessaire, дори можете да регулирате нивото на
сигурност). Тъй като скрипт гарантира, че сраснали база даде
“всичко” обучението си колекция (с точност по ваш
избор), тя работи добре TRS. Можете да
използвате-o
За да
създадете линия на сигурността около “SPAM_CUTOFF”
spam_cutoff = 0,6 може да искате да се оцени всеки шунка в
колекцията си под 0,3 и всички спам дел 0.9. В нашия пример е:
bogominitrain.pl -fnv ~/.bogofilter ham.mbox spam.mbox '-o 0.9,0.3'
Mthode 3) Използвайте скрипта randomtrain (в допринесоха директория). Сценарият gnre списък на всички съобщения в пощенската кутия, разбъркват в списъка и стойността на всяко съобщение, с обучение, както ncessaire. В нашия пример:
randomtrain -s spam.mbox -n ham.mbox
Що се отнася до mthode 4, тя работи по-добре, ако се започне с обучение корпус от няколко хиляди съобщения. Това ще ви даде една база данни на по-complte и значително по-големи.
Mthode 4) Ако имате достатъчно спам и шунка в тялото си, “Резервиран” 10000 спамове и 10 000 бутове във файлове рангоута mbox, след това използвайте корпус за Entran. След това използвайте bogofilter за класифициране на останалите спама и шунки. Вземете всяко съобщение или като неправилно спечели несигурно положение, и ги използват за нови знания. Това дава на най-добрите mthode mthode евентуална дискриминация. Ето две малки скриптове, които могат да бъдат използвани за класифициране на съобщения utiliss “лоши lves”.
#! /bin/sh # class3 -- classe un message en mauvais, bon ou incertain cat >msg.$$ bogofilter $* <msg.$$ res=$? if [$res = 0]; then cat msg.$$ >>corpus.bad elif [$res = 1]; then cat msg.$$ >>corpus.good elif [$res = 2]; then cat msg.$$ >>corpus.unsure fi rm msg.$$
#! /bin/sh # classify -- Place tous les messages dans un fichier mbox l'aide de class3 src=$1; shift formail -s class3 $* <$src
В нашия пример (APRS първоначалното обучение):
classify spam.mbox [bogofilter options] bogofilter -s < corpus.good rm -f corpus.* classify ham.mbox [bogofilter options] bogofilter -n < corpus.bad rm -f corpus.*
Важно е да се разбере consquences на методите, които са dcrire. За пълно обучение, както и в 1 и 4, произведени mthodes база данни за повече, отколкото би една тренировка с mthodes 2 или 3. Ако вашата база данни трябва да се дават малки (например, защото на квоти), използвайте mthodes 2 или 3.
Обучението с mthode 1 е най-бързо. Обучение по грешка (както в mthodes Описва 2,3 и 4) е ефективна, но обучението е plutt бавно.
bogofilter -M -s -I ~/mail/Spam bogofilter -M -n -I ~/mail/NonSpam
bogofilter -s -B ~/Maildir/.Spam bogofilter -n -B ~/Maildir/.NonSpam
bogofilter -M -Ns -I ~/mail/Missed_Spam bogofilter -M -Sn -I ~/mail/False_Spam
bogofilter -s -B ~/Maildir/.Missed_Spam bogofilter -n -B ~/Maildir/.False_Spam
Bogofilter ще правят грешки от време на време. Ето защо обучението е важно rgulier. Има два основни mthodes да го направят. Premire, можете да Entran с всяко ново съобщение (с помощта на U-опция). Deuximement, можете да направите на грешки Entran.
В допълнение, Вие може да изгради база данни пъти, като при голяма нова функционалност се добавя bogofilter. След това може да бъде полезна за деня корпус rgulirement обучение.
Bogofilter винаги си върши най-добре с наличната
информация. Въпреки това, той ще прави грешки, като класифициране
на шунка като спам (фалшиво положителни) или спам като шунка
(фалшиво ngatifs). Rduire за вероятността от rapparition на
грешка, тя ще ncessaire да се обучават bogofilter с погрешно
послание. Ако съобщението е неправилно класифицирани като спам,
използвайте-n
ще се
интегрират като шунка. Използвайте-s
ще интегрира като спам.
Bogofilter има опция -u
, което автоматично поставя списък от
думи, дни след всяка оценка на съобщенията. Като bogofilter
понякога прави грешки, това е mthode inconvnient на DGRAD обучение
с грешни входа. Ще трябва да разгледаме и правилно
frquemment. Корекцията може да се
използва-Sn
за
промяна на класификацията на спам съобщение като шунка
и -Ns
за промяна
на шунка като спам.
Коригира misclassified съобщение може да повлияе на класирането на другите съобщения. Освен това базата данни ще предоставя на малките, толкова по-голяма вероятността за грешка обучение неправилна класификация.
Използването на mthode 2 или 3 (по-горе) може да компенсира този ефект. Repti обучение с пълен корпус (включително съобщения добавени след предишния живот). Това ще добави съобщения до базата данни с цел постигане на ново равновесие, вероятно преодоляване на ефекта на “свръхкомпенсация”.
А алтернатива stratgie, въз основа на mthode 4 от предишния раздел е: Периодично се блокове на съобщения и използването на скриптове на mthode 4, да ги класифицира. Ръчно сканиране спам, шунка и несигурно, коригиране на грешки, и несигурната бутове Sparer и спам. Докато не са спам 10000 и 10000 шунка в обучението,, Entran с бутове, спам, и грешки и накрая несигурност. По-късно само с несигурни и, игнорирайки посланията, които bogofilter правилно клас.
Имайте предвид, че rgulirement изпълнете:
bogoutil -d wordlist.db | bogoutil -l wordlist.db.new mv wordlist.db wordlist.db.prv mv wordlist.db.new wordlist.db
или за файлове и spamlist.db goodlist.db (ако използвате bogofilter с рангоута дума списъци). Това ще компресирате Данни за заемане само минимален ncessaire дисково пространство.
Bogofilter включва традиционни mbox, Maildir и МЗ. Bogofilter не поддържа поддиректории, трябва изрично да им списък, ако имате директории Maildir++ или МЗ – само да спомена, пълния път към поддиректориите.
За неподдържани формати, трябва да конвертирате файла в един формат bogofilter разбира. Mbox често е удобен, защото тя може да бъде директно enovy bogofilter.
Например, за да го превърне в mbox формат mbx UW-IMAP/PINE:
mailtool copy /full/path/to/mail.mbox '#driver.unix//full/path/to/mbox'
или:
for MSG in /full/path/to/maildir/* ; do formail -I Status: < "$MSG" >> /full/path/to/mbox done
Можем да кажем, bogofilter за показване на информация за оценката на едно съобщение от техническата работна група, като се обадите на потребителски настройки с “-V”, “ВВ-”, “ВВВ-” или “-R”.
X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000
X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000 int cnt prob spamicity histogram 0.00 29 0.000209 0.000052 ############################# 0.10 2 0.179065 0.003425 ## 0.20 2 0.276880 0.008870 ## 0.30 18 0.363295 0.069245 ################## 0.40 0 0.000000 0.069245 0.50 0 0.000000 0.069245 0.60 37 0.667823 0.257307 ##################################### 0.70 5 0.767436 0.278892 ##### 0.80 13 0.836789 0.334980 ############# 0.90 32 0.984903 0.499835 ################################
Изпратено всеки ред интервал, броят на символите (lment NDT минимално лечение, gnralement дума) с оценка в този диапазон, средната вероятност за спам за тези символи, оценката на “spamicit” на съобщението (за символи на този интервал или предишните) и бар за броя на символите.
В хистограма по-горе, има много символи ниска оценка и висок рейтинг. Те s’quilibrent да се даде “spamicit” на 0.500000
на символите в съобщението, с информация за всеки един. Например:
X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000 n pgood pbad fw U "which" 10 0.208333 0.000000 0.000041+ "own" 7 0.145833 0.000000 0.000059+ "having" 6 0.125000 0.000000 0.000069+ ... "unsubscribe.asp" 2 0.000000 0.095238 0.999708+ "million" 4 0.000000 0.190476 0.999854+ "copy" 5 0.000000 0.238095 0.999883+ N_P_Q_S_s_x_md 138 0.00e+00 0.00e+00 5.00e-01 1.00e-03 4.15e-01 0.100
Колоните даде следните плакати:
Последният ред показва:
Продукцията на “-R” е да се използва Добавен с езика R за статистически изчисления. Повече информация е на разположение на проекта R за статистически компютърни http://www.r-project.org/.
По подразбиране на bogofilter класифицира съобщение като спам или не спам. Аргументът SPAM_CUTOFF се използва за това. Съобщения с по-висок резултат или момиче в SPAM_CUTOFF classs са спам. Останалите шунка.
Налице е също така един параметър HAM_CUTOFF. Когато се използва, съобщенията трябва да имат оценка по-долу или classs Гал HAM_CUTOFF да бъде шунка. Съобщения с резултат между HAM_CUTOFF и билети за SPAM_CUTOFF са “сигурни”. Ако се вгледате в bogofilter.cf, ще видите следните редове:
#### CUTOFF Values # # both ham_cutoff and spam_cutoff are allowed. # setting ham_cutoff to a non-zero value will # enable tri-state results (Spam/Ham/Unsure). # #ham_cutoff = 0.45 #spam_cutoff = 0.99 # # for two-state classification: # ## ham_cutoff = 0.00 ## spam_cutoff= 0.99
За да може класификация Да / Не / сигурни, премахнете да кажа на последните два реда.
Освен това, ако използвате етикети prfrez Да / Не / Не сте сигурни, вместо за Спам / Хем / сигурни, премахване на предната линия кажа:
## spamicity_tags = Yes, No, Unsure
След това се прави, можете да включите следните правила за филтъра, за да си поща:
if header contains "X-Bogosity: Spam", put in Spam folder if header contains "X-Bogosity: Unsure", put in Unsure folder
В допълнение, bogofilter.cf possde насоки за промяна на темата: напр.
#### SPAM_SUBJECT_TAG # # tag added to "Subject: " line for identifying spam or unsure # default is to add nothing. # ##spam_subject_tag=***SPAM*** ##unsure_subject_tag=??UNSURE??
С такива маркери, правилата за филтър ще изглежда така:
if subject contains "***SPAM***", put in Spam folder if subject contains "??UNSURE??", put in Unsure folder
“Обучение на грешка” включва анализ на корпус на съобщения, чийто статут е известен спам или шунка. Само тези, които са зле classs, или чиято класификация е несигурна, ще Intgr в до базата данни на обучение. Тя не показва, че изберете само съобщения “лошо lves” тихи ефективно средство за обучение. Ако тренирате bogofilter всички съобщения, че ще науча със спама и бутове празна.
Това може да бъде mthode amliore с помощта на “маржа на сигурност.” Чрез увеличаване на стойността “изключване спам” и от намаляване на стойността “шунка изключване” съобщенията, които са близо до прага ще utiliss за обучение. Използването на този марж сигурност показа ефективността си в rsultats amliorer обучението по грешка. В gnral, по-широки граници са supplmentaire помощ (въпреки факта, че границите са твърде големи, не са оптимално). За една държава три режим, можете да използвате средата на сигурни държава с интервал от+ / – 0.3 за обучение
Rpter обучение на грешка на един и същи орган на съобщението може да amliorer точност. В IDE е, че съобщенията, които имат classs тона и може да ПЪРВИ ПЪТ, след обучение, било погрешно classs. Трябва да бъде компенсирано от rptition.
“Обучение на изтощение” е rptition на обучението по грешка, със същия корпус съобщение, че няма грешки, докато остане. Това може да се mthode amliore благодарение на маржовете на сигурността. Вижте защо
статия
Гари Робинсън
за повече информация.
Забележка: bogominitrain.pl
possde
опция -f
couraging,
която позволява на “обучение до изтощение”. Ако решите
да го използвате, да са наясно с възможните странични
ефекти. Използването на-fn
бързо rpter обучение за всяко
съобщение.
В “-U” (AutoUpdate) се използва за автоматично complter списък дума. Когато тази опция се използва и bogofilter класифицира съобщение като спам или Хам, съобщение символи се добавят към списъка на думи с маркер за спам или шунка (според случая).
Вземете случая с пристигането на ново съобщение “рефинансира сега – най-добрите лихви по ипотечните кредити”. Той съдържа думи, които bogofilter ADJ видели и вероятно ново. Използването на “-U” тези нови думи са добавени към списъка с думи, така че по-добре да bogofilter reconnatre следните съобщения като него.
Ако използвате “-U”, трябва да се вгледате внимателно неправилна класификация и rentrainer bogofilter с това съобщение, е погрешно идентифициран. А посланието, че е неправилно класифицирани и самоук _peut_ усилват бъдеще недоброто класифициране на bogofilter. Това е същия проблем като теб, системен администратор, запишете лошо послание шунка като спам или обратно.
Ако имате актив SpamAssassin (или ако искате CRER), можете да използвате на неговото връщане, кодове за влак bogofilter. Най-лесният начин е да CRER скрипт за MDA, която работи SpamAssassin, тестове за състоянието на спам кода на връщане / шунка, и тичам bogofilter за валидиране на съобщението. Сценарият procmail по-долу е един от начините да го направите:
BOGOFILTER = "/usr/bin/bogofilter" BOGOFILTER_DIR = "training" SPAMASSASSIN = "/usr/bin/spamassassin" :0 HBc *? $SPAMASSASSIN -e #spam yields non-zero #non-spam yields zero | $BOGOFILTER -n -d $BOGOFILTER_DIR #else (E) :0Ec | $BOGOFILTER -s -d $BOGOFILTER_DIR :0fw | $BOGOFILTER -p -e :0: * ^X-Bogosity:.Spam spam :0: * ^X-Bogosity:.Ham non-spam
Много хора reoivent на нежелана поща, като използват азиатски символи. Тъй като те не практикуват езика и познават лицето надолу, те предполагат, че е спам.
Добрата новина е, че bogofilter DTECT на Manir plutt ефективни. Лошата новина е, че тя може да бъде coteux. Можете основно са три възможности:
Можете просто да bogofilter решетка на проблема. Entran с азиатски съобщения, определени като спам. Bogofilter анализ на съобщения като най-той може и ще добави жетони списък на спам думи. Списъкът на думи ще съдържа много символи, които не правят смисъл за вас (в зависимост от масата на символи, които не могат да бъдат показвани), но bogofilter може да работи с тях и правилно да идентифицира спам Азия.
## Efface silencieusement tous les mails en langue asiatique UNREADABLE='[^?"]*big5|iso-2022-jp|ISO-2022-KR|euc-kr|gb2312|ks_c_5601-1987' :0: * 1^0 $ ^Subject:.*=\?($UNREADABLE) * 1^0 $ ^Content-Type:.*charset="?($UNREADABLE) spam-unreadable :0: * ^Content-Type:.*multipart * B? $ ^Content-Type:.*^?.*charset="?($UNREADABLE) spam-unreadable
С такава програма, bogofilter ще видите никога
съобщението.
Периодично Можете да компактен базата данни, за да заемат най-малко дисково пространство. Ако приемем, че си е списък от думи в директорията ~ / Bogofilter, за bogofilter 0.93.0 (или последния брой) тип.:
bf_compact ~/.bogofilter wordlist.db
За antrieur bogofilter 0.93.0, използвайте:
cd ~/.bogofilter bogoutil -d wordlist.db | bogoutil -l wordlist.db.new mv wordlist.db wordlist.db.prv mv wordlist.db.new wordlist.db
Този скрипт е необходимо за дублиране на вашата среда база данни (за подкрепа на BerkeleyDB обработка на транзакции). Оригиналните ви директория ще бъде преименуван на ~ /. Bogofilter.old и ~ /. Bogofilter ще съдържа новата среда.
За по-старите версии на bogofilter не, използващи принципа на сделките на база данни е обикновен файл (wordlist.db) и не ncessite за използване на скрипт. Горните crent команди даде нова основа за по-компактен и преименуване на оригиналния файл wordlist.db.prv
Забележка: Това е напълно валиден за използване на скрипт с по-стари версии на bogofilter.
За да намерите броя на спам и шунка за знак (дума), използвайте bogoutil на “-w”. Например, “-w $ bogoutil BOGOFILTER_DIR / wordlist.db example.com” дава броя на шунка и спам за “example.com”.
Ако искате да изкарате повече spamicit броят на спам и шунка за знак, използвайте bogoutil на “-р”. Например, “-P $ bogoutil BOGOFILTER_DIR / wordlist.db example.com” осигурява повече номера шунка и спам, оценка на думата.
За да разберете колко съобщения са в списъка си с думи, е отправила искане за псевдо-символичен “. MSG_COUNT” (точка на БР). За пример, стартирайте командата “-w $ bogoutil BOGOFILTER_DIR / wordlist.db. MSG_COUNT”.
За колко жетони са подадени в думата си списък, изпратете на изхода на командата да се отърват bogoutil командата “тоалетна”. Например, използвайте “г-$ bogoutil BOGOFILTER_DIR / wordlist.db / wordlist.db | WC-л”, за да показва броя на случаи на символите (Ако използвате spamlist.db goodlist.db и стартирайте командата за всеки един от тях).
Да. Bogofilter може да работи с няколко списъка на думи. Например,
ако сте списъкutilisateur
и
systeme
Bogofilter да vrifier ако думата е в списъка с потребители, и ако думата не е там, vrifier система списък. Bogofilter може да смесва информация и от двете листи.
Тук са възможностите за конфигурационния файл и някои примери:
Списък на думи possde няколко качества, particulirement тип, име, името на файла и prcdence.
Пример 1 – микс на потребителя и списъци система:
wordlist R,utilisateur,~/wordlist.db,1 wordlist R,systeme,/var/spool/bogofilter/wordlist.db,1
Пример 2 – Преди потребителя списък:
wordlist R,utilisateur,~/wordlist.db,2 wordlist R,systeme,/var/spool/bogofilter/wordlist.db,3
Пример 3 – Преди списък система:
wordlist R,utilisateur,~/wordlist.db,5 wordlist R,systeme,/var/spool/bogofilter/wordlist.db,4
Бележка 1: Опции enregristrement bogofilter (“-ите”, “-н”, “-U”, “-S”, “-N”) ще се прилага само списъци на най-ниските в PR cdence.
Бележка 2: разполагат със списъци от типа “R” и “аз” на една и съща prcdence не е позволено, защото видовете са противоречиви.
Чрез използването на списъци от типа “игнорирай”, bogofilter не ще вземе предвид списъците жетони за оценка на съобщението.
Пример:
wordlist I,ignore,~/ignorelist.db,7 wordlist R,systeme,/var/spool/bogofilter/wordlist.db,8
Като ignorelist.db
има индекс infrieur (7), че на
wordlist.db
(8), bogofilter няма да изглежда на жетони, които ще бъдат в ignorelist.db
.
Забележка: Технически bogofilter дава оценка на ROBX на символи, както и очаква, че min_dev Аргументът прави “Cancel”.
Има два основни mthodes за изграждане / поддържане на списък на “игнорирай”.
Първо, текстов файл може да бъде кр и поддържа от издателя. Bogoutil може да конвертирате текстов файл в база данни, например “bogoutil ignorelist.db-л <ignorelist.txt”.
Secondo, echo... |
bogoutil...
може да се използва за добавяне на един символ,
например “ignorez.moi”
echo ignorez.moi | bogoutil -l ~/ignorelist.db
Стартирайте bogoupgrade скрипт. За повече информация писта “bogoupgrade-H” за да видите помощта съобщение, или “човекът bogoupgrade” страница и прочетете ръководството.
Ако смятате, че думата си списъци DGRAD нужно, можете да гледате какво се казва, че от стартирането BerkeleyDB:
db_verify wordlist.db
Ако има проблем, можете да rcuprer или всички от символите и броя със следната команда:
bogoutil -d wordlist.db | bogoutil -l wordlist.new.db
или – списъкът не може да бъде rcupre командата Предишна – с:
db_dump -r wordlist.db > wordlist.txt db_load wordlist.new.db < wordlist.txt
В основата на думи могат да бъдат превърнати от суров формат Unicode помощта на следните команди:
bogoutil -d wordlist.db > wordlist.raw.txt iconv -f iso-8859-1 -t utf-8 < wordlist.raw.txt > wordlist.utf8.txt bogoutil -l wordlist.db.new < wordlist.utf8.txt
или:
bogoutil --unicode=yes -m wordlist.db
В основата на думи могат да бъдат превърнати от Unicode формат до суровини, като напишете следното:
bogoutil -d wordlist.db > wordlist.utf8.txt iconv -f utf-8 -t iso-8859-1 < wordlist.utf8.txt > wordlist.raw.txt bogoutil -l wordlist.db.new < wordlist.raw.txt
или:
bogoutil --unicode=no -m wordlist.db
Процедурата е compltement документи по преписката документ / README.db раздел 2.2.1. Моля, прочетете suggrons параграф compltement.
В резюме, използвайте тези команди:
cd ~/.bogofilter bogoutil -d wordlist.db > wordlist.txt mv wordlist.db wordlist.db.old bogoutil --db-transaction=yes -l wordlist.db < wordlist.txt
Ако всичко върви добре, можете да премахнете архивиране на файлове:
rm wordlist.db.old wordlist.txt
Процедурата е compltement документи по преписката документ / README.db раздел 2.2.1. Моля, прочетете suggrons параграф compltement.
В резюме, можете да използвате bogoutil да копирате и презареждане на базата данни от думи, като например:
cd ~/.bogofilter bogoutil -d wordlist.db > wordlist.txt mv wordlist.db wordlist.db.old rm -f log.????? __db.?? bogoutil --db-transaction=no -l wordlist.db < wordlist.txt
На сделката и едновременно видове BerkeleyDB ncessitent ключалка таблица, която съответства на база данни размер. Прочетете файлаREADME.db Търговец на дребно за обяснение и решение.
Размерът на заключване на таблица могат да бъдат в paramtre bogofilter.cf или DB_CONFIG. Bogofilter.cf използва db_lk_max_locks и db_lk_max_objects директиви, докато DB_CONFIG използва set_lk_max_objects и set_lk_max_locks директиви.
APRs са тези ценности в DB_CONFIG Чанг, стартирайте
bogoutil --db-recover /votre/repertoire/bogofilter
за възстановяване на таблицата за заключване.
Вие със сигурност имате проблем с базата си на даване BerkeleyDB. Има две възможни причини: или сте достигнали лимита, или на базата данни е повреден.
Някои пощенски сървъри, като Postfix, да налагат ограничения на размера на файла. Когато bogofilter до базата данни достига тази граница, проблемът изглежда писмена форма.
За да видите размера на използвания от до базата данни:
ls -lh $BOGOFILTER_DIR/wordlist.db
За да видите максималния размер с Postfix:
postconf | grep mailbox_size_limit
За да зададете максималния размер на 73MB (или каквото и размер е приложимо):
postconf -e mailbox_size_limit=73000000
Ако смятате, че вашата база данни е повреден даде, прочетете
точка
Какво става, ако в моя списък на думи е corroumpue?
често задавани въпроси.
Някои дистрибуции (например Fedora) предлага BerkeleyDB с поддръжка на теми POSIX и POSIX mutexes consquent, когато системата ви не поддържа тези mutexes. (Това dpend си версия на ядрото и точният вид на процесор).
За да се справите с проблема
Да, може. Има много stratgies да го направят. двете крайности са:
Настоящият компромис: bogofilter администратор поддържа глобална wordlists и всеки потребител има право да използват глобалната списък или списък частни. А MDA като procmail, могат да бъдат програмирани за изпълнение на първия изчерпателен списък (със строг лимит TRS спам) и, когато е необходимо, да се прилага списък на думи отрича.
Ако току-що прочетох, няма проблем. Ако сте ги сложили дни, трябва да предоставите правото възможности за заключване се избегне повреда на данни. Когато се съставят bogofilter, ще трябва vrifier, че конфигурирате скрипт е разположен “# определи HAVE_FCNTL 1″ в config.h вашия файл. Операционната система UNIX всички поддържат този стандарт. Ако използвате версия particulirement екзотични или стар, се уверете, че подкрепя fcntl (). Ако “# определи HAVE_FCNTL 1″ се определя, като се посочва, че вашата система, за да сраснали fcntl (), след това dcommentez “# определи HAVE_FLOCK 1″, така че системата използва заключване fcntl () вместо на стадото () за заключване. Ако системата ви не поддържа fcntl, така че можете да споделяте wordlists през NFS, без да рискуват повреда на данни.
След това се уверете, че NFS е конфигуриран правилно с “lockd” работи. Rfrez си NFS документация за стартиране на “lockd” или “rpc.lockd”. Повечето от активното Systmes с NFS по подразбиране.
Вероятно кодове връщане са тона rcrits от waitpid (2). С
използването WEXITSTATUS (статус) в макро-системи / wait.h, или
съпоставими, за да получите правилната стойност. Perl употреба
“система (” bogofilter $ вход “)>> 8. Ако
искате повече информация, стартирайте
"man waitpid"
.
Що се отнася, bogofilter е натрупал голям брой опции. Някои от
тях са изчезнали или променени. Виж файла
НОВИНИ за повече информация.
В lexer, частта, която извлича знаците на съобщения, се развива. Това води до промяна в gnration списъка на символи, които на свой ред ще направи старите символи inutiliss.
Ако се сблъскате с този проблем, призова ви възстановяване на базата данни. Ако това не е възможно, можете да използвате версия
0.15.13
и прочетете документацията, която върви с него, за да видите как да мигрират.
Bogoutil ви позволява да се изброят (дъмп) един списък от думи и натоварване на символите в нов списък от думи. С помощта на инструменти като awk и Впиши, номерата могат да бъдат пуснати zros и символите, чиито сметки ще бъдат за нула-спам и бутове може да бъде dtruits.
По-долу ще dtruire жетони от спам съобщения:
bogoutil -d wordlist.db | \ awk '{print $1 " " $2 " 0"}' | grep -v " 0 0" | \ bogoutil -l wordlist.new.db
По-долу ще dtruire жетони от спам съобщения.
bogoutil -d wordlist.db | \ awk '{print $1 " 0 " $3}' | grep -v " 0 0" | \ bogoutil -l wordlist.new.db
Ако не сте DJ версия 3.0 или по-висока от
BerkeleyDB, а след това
актуализациите файлове за изтегляне (под една от 4.2.x), на dcompactez, и изпълнете следните команди в директорията “DIST”:
$ cd build_unix $ sh../dist/configure $ make # make install
След Tlcharger на преносима версия на bogofilter.
Dcompactez и след това да направите:
$./configure --with-libdb-prefix=/usr/local/BerkeleyDB-4.2 $ make # make install-strip
След това можете да направите или символично libdb.so връзка в / ЮЕсАр / ИЪ, или използването на модифицирана версия на променливата на средата LD_LIBRARY_PATH, преди да пуснете bogofilter.
$ LD_LIBRARY_PATH=/usr/lib:/usr/local/lib:/usr/local/BerkeleyDB-4.2 $ export LD_LIBRARY_PATH
Имайте предвид, че някои версии на книги направи с по-стара версия Solaris почивка, когато се опитваме да изградим bogofilter извън нейната директория източник. Или ще съставя регистъра източник (като suggr по-горе) или да използвате GNU марка (gmake).
Пакетите са на разположение с версии на trsrcentes bogofilter. Този подход се използва пакети TRS се препоръчва portupgrade и portsnap. За да инсталирате тези две прекрасни инструменти (което трябва да направите това само веднъж):
# pkg_add -r portupgrade cvsup
За да инсталирате или актуализирате bogofilter, само няколко
дни
до
дървото преобразуване (пристанища дърво) с CVSup след това
въведете
# portupgrade -N bogofilter
Забележка:. Това предполага, че са корен В противен
случай, прочетете mmento на този раздел FreeBSD и да видим как да
се
съставят, ако не разполагат с привилегии изисква..
В зависимост от вашата система, може да зададете някои системни променливи, да се контролира ./configure
. Пример:
# env CPPFLAGS=-I/usr/local/include/db3 LIBS=-ldb3 LDFLAGS=-L/usr/local/lib./configure
Dpendent пътеки на вашата система и версии на бази от данни, които сте инсталирали. Уверете се, и промяна в consquence.
Виж файла
DOC / програмист / README.hp-UX
в източник на разпространение.
Bogofilter успешно съставен от няколко Systmes с помощта на GNU и да направи родния команди. Въпреки това, Makefile bogofilter не работи с някои команди направи.
GNU да се препоръчва за изграждане bogofilter, защото ние знаем, че работи. Ние не може да поддържа поръчки правят по-малко ефективни. Ако не-GNU да работи, страхотно!. Ако се сблъскате с някакъв проблем, нещо, което да направите е да инсталирате GNU направи. Ако не-GNU да могат да съставят bogofilter, ние сме Съжалявам, но това е ваш проблем. Ако това не ncessite собствен малък участък да стане съвместим, ние ще интегрира възможно.
Bogofilter да се инсталира в директория нестандартни (като без
корен не са разрешения за директории нормално), ще трябва prciser
префикса, когато инсталирате стартира
./configure
.
APRS dcompacter изтеглите и
са
изходния код, стартирайте./configure --prefix=PATH
. о PATH е
инсталацията префикс за gnrs файлове (изпълними файлове, човек
страници и т.н.) След това стартирайте обичайните команди -
make && make
check && make install
.
Ако сте ncessaire прилагат петна, rcuprez
изходния код
и използването на dcompacteztar -xzf
или gunzip
. Промяна на източника директория и да стартирате
| tar -xf -./configure --prefix=PATH
о PATH е инсталацията префикс за gnrs файлове (изпълними файлове,
човек страници и т.н.) След това APRS са приложили петна, изпълнете
обичайните команди. -
make && make install
.
Намалява Когато пространство, можете да
използвате make
вместо
install-stripmake install
. Това позволява SAVE дисково
пространство, но не позволява отстраняването на грешки в катастрофата,
освен ако повече информация за възпроизвеждане на грешки се предоставя
dveloppeurs.
Ако зададете пътя до базата данни, например, – с-libdb-префикс или чрез CPPFLAGS и LIBS, не забравяйте да осигури
абсолютния път (с наклонена черта в начинаещи), един
относителния път няма да работи. Пример: използване
- с-libdb-префикс = / usr/local/BerkeleyDB.4.2, но
не - с-libdb-префикс =.. / BerkeleyDB.4.2
Bogofilter rput е да се работи с KMail, Mozilla поща, куче, алпийски, Sylpheed-нокти. А за търсене на Google ще ви помогне да получите повече информация за използване bogofilter с редовни пощата си програма.
Използвайте поща филтър (procmail, maildrop и др.) Да филтрират електронна поща в папки РАЗЛИЧНИ след връщането код на bogofilter, както и бутони за връзка влак bogofilter на грешки:
macro index S "|bogofilter -s\ns=junkmail" "Apprendre comme spam et sauvegarder dans junk" macro pager S "|bogofilter -s\ns=junkmail" "Apprendre comme spam et sauvegarder dans junk" macro index H "|bogofilter -n\ns=" "Apprendre comme spam et sauvegarder" macro pager H "|bogofilter -n\ns=" "Apprendre comme spam et sauvegarder"
Това ще изпращат съобщения, за да изберете bogofilter, преподаване фалшиви шунка в спам и обратно, а след това предложи да запишете в папка по-различно.
ПРАВИЛА добавите филтър, за да тече bogofilter за входящи съобщения и извършване на действия, ако това е спам.
condition: * test "bogofilter < %F" action: * move "#mh/VOTRE_BOITE_A_SPAM"
Забележка: Това предполага, че bogofilter е по пътя си!
Създаване на две Claws действия – един за маркиране на съобщения като спам и един за маркиране на съобщения като шунка. Използвайте действие “Маркирай като Спам” съобщения за неправилно classs като шунка и използване “Маркирай като Хем” classs за съобщения неправилно като спам.
Mark as ham / spam: * bogofilter -n -v -B "%f" (mark ham) * bogofilter -s -v -B "%f" (mark spam)
Друг подход е да се запишете на съобщения в папка неправилно classs (или повече) и да стартирате скрипт, като например:
#!/bin/sh CONFIGDIR=~/.bogofilter SPAMDIRS="$CONFIGDIR/spamdirs" MARKFILE="$CONFIGDIR/lastbogorun" for D in `cat "$SPAMDIRS"`; do find "$D" -type f -newer "$MARKFILE" -not -name ".sylpheed*" done|bogofilter -bNsv touch "$MARKFILE"
Този сценарий може да се използва като действие или трансформират като бутон. Това ще спести като спам, съобщения в $ {} са SPAMDIRS последния брой MARKFILE като $ {}.
Повече информация е на разположение в
уики Sylpheed-Claws.
Друг подход е да стартирате bogofilter от procmail, maildrop и др. и да Claws vrifier от заглавието X-Bogosity и филтър съобщения в Спам и несигурна папки. Например:
Condition: header "X-Bogosity" matchcase "Spam" Action: move "#mh/Mailbox/Spam" Condition: header "X-Bogosity" matchcase "Unsure" Action: move "#mh/Mailbox/Unsure"
Всички съобщения в Несигурни папка трябва да се научи, тъй като всички съобщения неправилно класифицирани като шунка или спам. Следните действия greront такива случаи:
Register Spam: bogofilter -s < "%f" Register Ham: bogofilter -n < "%f" Unregister Spam: bogofilter -S < "%f" Unregister Ham: bogofilter -N < "%f"
За да проверите bogofilter mcanisme вкарване, след поставяне на диагнозата е от полза:
BogoTest -vv: bogofilter -vv < "%f" BogoTest -vvv: bogofilter -vvv < "%f"
Допълнителна информация за този подход са достъпни тук.
Трябва да включите файла VM-bogofilter.el (както можете да се обърнете към търговеца е bogofilter или Tlcharger http://www.cis.upenn.edu/ ~ bjornk / bogofilter / VM-bogofilter.el) в път библиотека на Emacs.
Тя остава само за вас, които поставят в конфигурационния файл ~ / VM.:
;; Lutte contre les pourriels (via bogofilter) ;; (require 'vm-bogofilter) ;; Raccourcis-clavier pour bogofilter ;; C (shift-c): pourriel ;; K (shift-k): message correct (define-key vm-mode-map "K" 'vm-bogofilter-is-spam) (define-key vm-mode-map "C" 'vm-bogofilter-is-clean)
Всички съобщения се филтрират от bogofilter когато Проверете вашите нови съобщения. При промяна на състоянието на съобщение, заглавията на съобщението са променени (заглавието X-Bogosity:).
Има едно ограничение: не можете да промените състоянието на изберете набор от съобщения: вие трябва да направите, APRS съобщение съобщение…
Paramtrage опцията по подразбиране “MH-боклуци програма” е “Автоматично откриване”, което означава, че MH-E автоматично ще избере между SpamAssassin, bogofilter, или SpamProbe, в този ред. Ако, например, да инсталирате SpamAssassin и bogofilter, а вие искате да използвате bogofilter, трябва да промените това “bogofilter”.
“PG” Командата (“MH-боклуци черен списък”) влакове на спам в ход програма с изберете съдържанието и след това третира (и) съобщение (я), както Задава опцията ” MH-боклуци разпореждане “. По подразбиране тази опция е настроена на “Delete Спам” Но можете да spcifier името на директорията, която ще бъде полезно за изграждането на корпуса на спам за обучение.
Вместо това, командата “w J” (“MH-боклуци-белия списък”) прекласифицира съобщения Изберете Хем, тъй като те неправилно taient classs като спам. След това тя dplace мнения в “+ кутия”.
За повече информация прочетете на страницата MH-E