User tools

Website tools


error emails

This is an old version of the document!


Processing emails during import

After the emails to be imported have been copied to the Benno MailArchiv inbox as here , they are read by the Benno Archive Daemon. This involves analyzing the headers and calculating the email's checksum. The checksum is then used to determine the filename under which the email is saved.

The email is now stored in the repository directory under /srv/benno/archive/boxname . In the default installation, the box name is always the current year.

Processing errors

Falls es bei der Verarbeitung einer E-Mail zu einem Fehler kommt, wird dieser intern abgefangen und im Log vermerkt. Die zu importierende E-Mail in der Inbox wird unbenannnt und bekommt die Endung .err. Eine zu importierende E-Mail wird direkt nach dem Einlesen im Repository gespeichert. Daher ist eine fehlerhafte E-Mail in der Regel schon im Repository gespeichert, wenn der Fehler festgestellt wird. Aus Sicherheitsgründen kann Benno MailArchiv keine E-Mail aus dem Repository löschen, so dass die E-Mail im Fehlerfall in der Regel zweifach vorhanden ist.

Indexing error

Nachdem die E-Mail im Repository abgelegt wurde, wird der durchsuchbare Text aus der E-Mail und den Anhängen extrahiert. Diese Analyse wird mit Hilfe der Apache Bibliothek Tika durchgeführt. Tika bietet ausschließlich eine high-Level Schnittstelle zur Analyse von E-Mail an. Die gesamte E-Mail wird über die Schnittstelle an Tika übergeben. Tika liefert dann einen Token-Strom, der in Apache Lucene indexiert wird. Im Falle von fehlerhaften Anhängen in der E-Mail bricht Apache Tika die Text-Extraktion insgesamt  ab und gibt einen Fehler zurück. Benno MailArchiv erkennt das Problem und benennt die E-Mail in der Inbox nach .err um, so dass die E-Mail auf keinen Fall verloren geht und das Problem auffällig dokumentiert ist.

Starting with version 2.1.0 of Benno MailArchiv, the integration with Apache Tika has been made more robust. Now, before Apache Tika analyzes the email, it is split into its components (mail body and individual attachments). These parts are then analyzed individually by Apache Tika. If a faulty attachment is detected, this is recorded in the log file, and the next attachment is indexed. This ensures that the largest possible portion of the email is indexed and therefore searchable.

Reimporting faulty emails

Starting with Benno MailArchiv version 2.1.6, faulty emails can be directly re-imported by simply moving them back into the inbox directory. During the import process, the archiver checks whether the checksum already exists in the repository. If so, the corresponding entry in the index is replaced with the newly imported data.

If the file extension is renamed to .eml, the emails will be imported again.

error-mails.1594289708.txt.gz · Zuletzt geändert: 2020/07/09 10:15 von lwsystems