SpamAssassin объясняет правила - PullRequest
0 голосов
/ 06 апреля 2020

У меня маленькая проблема с SpamAssassin . Я не нахожу документацию для правил.

Например, для правила MIME_HTML_MOSTLY У меня есть эта ссылка: https://wiki.apache.org/spamassassin/Rules/MIME_HTML_MOSTLY Но, очевидно, документация больше не доступна, и я не сделал не можете найти новую ссылку.

Не могли бы вы помочь мне найти новую ссылку вики?

Заранее спасибо.

Ответы [ 2 ]

0 голосов
/ 15 апреля 2020

Вот что мне ответила поддержка SpamAssassin:

Вики недавно была в основном перенесена в экземпляр ASF Confluence и теперь находится на https://cwiki.apache.org/confluence/display/SPAMASSASSIN/. Описания старых правил (которые не поддерживались с версии v3.3) не были перенесены, так как они были в значительной степени устаревшими, где они не были избыточными.

У меня нет окончательной ссылки на решение прекратить поддерживать описание правил в вики, так что там может быть более правильное объяснение в головах людей, которые были в PM C в то время. Тем не менее, я считаю, что это было правильное решение из-за управления правилами по умолчанию. Правила могут перемещаться и выходить из канала обновлений на основе автоматизированного процесса контроля качества, и существует непрерывный поток новых правил, изменений правил и удалений правил, поступающих от команды разработчиков, которые интегрируются (или нет) через RuleQA. Никогда не было функционального процесса для правильного ведения вики-страниц для правил в сочетании с этим процессом непрерывных изменений, и описания в большинстве случаев были не намного более яркими, чем строки описания в файлах правил.

0 голосов
/ 06 апреля 2020

Не все правила описаны в вики SpamAssassin - их слишком много, чтобы сделать это. Вы можете получить автоматизированные данные об эффективности для MIME_HTML_MOSTLY из системы контроля качества SpamAssassin, но не определения.

Текущее определение этого правила (дисконтирование переводов) из rules / 20_body_tests.cf is:

# … line 139 (quite likely to change)
body MIME_HTML_MOSTLY       eval:check_mime_multipart_ratio('0.00','0.01')
describe MIME_HTML_MOSTLY   Multipart message mostly text/html MIME
# … rules/50_scores.cf line 616 (also quite likely to change)
score MIME_HTML_MOSTLY 0.1

Это правило eval, поэтому вам нужно взглянуть на код perl, чтобы точно узнать, что он делает.

В lib / Mail / SpamAssassin / Plugin / MIMEEval.pm , вы найдете:

# … line 214
sub check_mime_multipart_ratio {
  my ($self, $pms, undef, $min, $max) = @_;

  $self->_check_attachments($pms) unless exists $pms->{mime_checked_attachments};
  return 0 unless exists $pms->{mime_multipart_ratio};
  return ($pms->{mime_multipart_ratio} >= $min &&
      $pms->{mime_multipart_ratio} < $max);
}

# … line 491
    if (defined($text) && defined($html) && $html > 0) {
      $pms->{mime_multipart_ratio} = ($text / $html);
    }

Это означает отношение длины части текста MIME к длине части HTML MIME должно быть равно или выше нуля, а также меньше 1%.

(Номера строк взяты из текущего хранилища внешних линий, а не выпуска. Код не должен сильно меняться, но номера строк, скорее всего, будут, особенно в пределах .cf файлов.)

...