Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Letzte Überarbeitung | |||
— | error-mails [2016/11/08 08:49] – Externe Bearbeitung 127.0.0.1 | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
+ | |||
+ | ====== Verarbeitung der E-Mails beim Import ====== | ||
+ | |||
+ | |||
+ | Nachdem die zu importierenden E-Mails wie [[Import|hier]] beschrieben in die Inbox von Benno MailArchiv kopiert wurden, werden sie vom Benno Archive Daemon eingelesen. Hierbei wird eine Analyse der Header vorgenommen sowie die Checksumme der E-Mail berechnet. Aus der Checksumme leitet sich der Dateiname ab, unter der die E-Mail gespeichert wird. | ||
+ | |||
+ | Die E-Mail wird jetzt im Repository-Verzeichnis unterhalb von ''/ | ||
+ | |||
+ | ====== Verarbeitungsfehler ====== | ||
+ | |||
+ | Falls es bei der Verarbeitung einer E-Mail zu einem Fehler kommt, wird dieser intern abgefangen und im Log vermerkt. Die zu importierende E-Mail in der Inbox wird unbenannnt und bekommt die Endung //.err//. Eine zu importierende E-Mail wird direkt nach dem Einlesen im Repository gespeichert. Daher ist eine fehlerhafte E-Mail in der Regel schon im Repository gespeichert, | ||
+ | |||
+ | ===== Fehler beim Indexieren | ||
+ | |||
+ | Nachdem die E-Mail im Repository abgelegt wurde, wird der durchsuchbare Text aus der E-Mail und den Anhängen extrahiert. Diese Analyse wird mit Hilfe der Apache Bibliothek [[http:// | ||
+ | |||
+ | Ab Version 2.1.0 von Benno MailArchiv wurde die Anbindung von Apache Tika robuster gestaltet. Jetzt wird die E-Mail vor der Analyse von Apache Tika in ihre Bestandteile (Mail-Body und einzelne Anhänge) zerlegt. Diese Teile werden dann einzeln von Apache Tika analysiert. Falls ein fehlerhafter Anhang erkannt wird, wird dieses im Logfile vermerkt und der nächste Anhang indexiert. Somit ist gewährleistet, | ||
+ | |||
+ | ====== Reimport fehlerhafter E-Mails | ||
+ | |||
+ | Ab Benno MailArchiv 2.1.6 können die fehlhaften E-Mails direkt reimportiert werden indem sie noch einmal in das Inbox-Verzeichnis geschoben werden. Beim Importieren überprüft der Archiver, ob die Checksumme schon im Repository vorhanden ist. In diesem Fall wird der zugehörige Eintrag im Index durch die neu eingelesenen Daten ersetzt. | ||
+ | |||