Инструменты пользователя

Инструменты веб-сайта


электронные письма об ошибках

Это старая версия документа!


Обработка электронных писем во время импорта

После того, как электронные письма, подлежащие импорту, будут скопированы во входящие сообщения Benno MailArchiv, как здесь , они считываются демоном архива Benno. Это включает в себя анализ заголовков и вычисление контрольной суммы электронного письма. Затем контрольная сумма используется для определения имени файла, под которым будет сохранено электронное письмо.

Теперь электронное письмо хранится в каталоге репозитория по адресу /srv/benno/archive/boxname . В стандартной установке имя ящика всегда соответствует текущему году.

Ошибки обработки

Falls es bei der Verarbeitung einer E-Mail zu einem Fehler kommt, wird dieser intern abgefangen und im Log vermerkt. Die zu importierende E-Mail in der Inbox wird unbenannnt und bekommt die Endung .err. Eine zu importierende E-Mail wird direkt nach dem Einlesen im Repository gespeichert. Daher ist eine fehlerhafte E-Mail in der Regel schon im Repository gespeichert, wenn der Fehler festgestellt wird. Aus Sicherheitsgründen kann Benno MailArchiv keine E-Mail aus dem Repository löschen, so dass die E-Mail im Fehlerfall in der Regel zweifach vorhanden ist.

Ошибка индексации

Nachdem die E-Mail im Repository abgelegt wurde, wird der durchsuchbare Text aus der E-Mail und den Anhängen extrahiert. Diese Analyse wird mit Hilfe der Apache Bibliothek Tika durchgeführt. Tika bietet ausschließlich eine high-Level Schnittstelle zur Analyse von E-Mail an. Die gesamte E-Mail wird über die Schnittstelle an Tika übergeben. Tika liefert dann einen Token-Strom, der in Apache Lucene indexiert wird. Im Falle von fehlerhaften Anhängen in der E-Mail bricht Apache Tika die Text-Extraktion insgesamt  ab und gibt einen Fehler zurück. Benno MailArchiv erkennt das Problem und benennt die E-Mail in der Inbox nach .err um, so dass die E-Mail auf keinen Fall verloren geht und das Problem auffällig dokumentiert ist.

Начиная с версии 2.1.0 Benno MailArchiv, интеграция с Apache Tika стала более надежной. Теперь, прежде чем Apache Tika начнет анализ электронного письма, оно разбивается на компоненты (тело письма и отдельные вложения). Затем эти части анализируются Apache Tika по отдельности. Если обнаруживается некорректное вложение, это записывается в файл журнала, и следующее вложение индексируется. Это гарантирует, что индексируется максимально возможная часть электронного письма, что делает его доступным для поиска.

Повторный импорт некорректных электронных писем

Начиная с версии Benno MailArchiv 2.1.6, ошибочные электронные письма можно повторно импортировать, просто переместив их обратно в папку «Входящие». В процессе импорта архиватор проверяет, существует ли контрольная сумма уже в репозитории. Если да, то соответствующая запись в индексе заменяется новыми импортированными данными.

Если расширение файла будет изменено на .eml, электронные письма будут импортированы повторно.

error-mails.1594289708.txt.gz · Zuletzt geändert: 2020/07/09 10:15 von lwsystems