Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
re-indexierung [2016/11/08 09:22] – Externe Bearbeitung 127.0.0.1 | re-indexierung [2023/04/19 10:11] (aktuell) – [benno-bennobox2eml] lwsystems | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== | + | ====== |
- | Zur Re-Indexierung eines Containers müssen alle E-Mails einmal neu gelesen | + | Wird eine schon archivierte E-Mail erneut importiert, wird dieses mit Hilfe der Duplikatserkennung festgestellt. |
+ | In diesem Fall wird die Mail nicht erneut archiviert. Auch wird die archivierte Mail nicht verändert. Die zu importierende | ||
- | Um einen Container komplett zu re-indexen ist es erforderlich, den bestehenden Index zu löschen und alle E-Mails aus dem Repository erneut zu importieren. Für den Re-Import werden | + | Dieses Vorgehen kann beispielsweise eingesetzt werden, wenn der Tokenizer ein vorher nicht bekanntes Dateiformat (Attachmenttyp) unterstützt. Die Inhalte von Anhängen, |
- | ====== Vorbereitung | + | (Hinweis: Der Tokenizer unterstützt Stand Ende 2017 ca. 1.300 unterschiedliche Dateiformate). |
- | Zuerst werden der Archvierungs- und der REST-Daemon gestoppt. Dann werden das Index- und das Repo-Verzeichnis des Containers | + | ====== Re-Indexierung eines Containers |
- | < | + | Zur Re-Indexierung eines Containers müssen alle E-Mails einmal neu gelesen und indexiert werden. |
- | mv / | + | |
- | mv / | + | |
- | </ | + | |
- | Danach können die Dienste wieder neu gestartet werden. Die Index- und Repoverzeichnisse | + | Um einen Container komplett zu re-indexen, ist es erforderlich, |
- | ====== Re-Import | ||
- | Im Repo-Verzeichnis liegen die E-Mails als gezippte Dateien in einem erweiterten [[Archiv-Format|RFC822-Format]] vor. Da beim Re-Import | + | ====== |
- | Zur Vereinfachung des Imports stellen wir das Perl-Script | + | Im Repository-Verzeichnis liegen die E-Mails als gezippte Dateien in einem erweiterten |
+ | |||
+ | Für den Re-Index muss zuerst der Benno-spezifische Header entfernt werden. Die Mail ist dann wieder dem Original entsprechend. Danach muss die E-Mail [[Import# | ||
+ | |||
+ | Der Re-Imports stellen kann mit dem Programm '' | ||
===== benno-bennobox2eml ===== | ===== benno-bennobox2eml ===== | ||
+ | |||
+ | Das Programm ist im Paket // | ||
< | < | ||
- | Usage: | + | Usage: |
[-e <export directory] | [-e <export directory] | ||
- | -a archive directory | + | -a archive |
- | -e export files to this directory (default current archive directory) | + | -b boxstate file (default $archive_dir/ |
- | -d dry run | + | -e export files to directory (default current archive directory) |
- | -m < | + | -d dry run |
- | -v verbose | + | -s skip defective marked mails |
+ | -m < | ||
+ | -v verbose | ||
+ | -V print version | ||
</ | </ | ||
Beispiel-Aufruf: | Beispiel-Aufruf: | ||
- | ./benno-bennobox2eml | + | sudo -u benno benno-bennobox2eml -a / |
- | Die Verzeichnisstruktur unterhalb des repo_old Verzeichnisses wird nach Archiv-Dateien durchsucht. Aus den Dateien werden die RFC822 E-Mails extrahiert und in das Inbox-Verzeichnis geschrieben. Falls mehr als 250 .eml Dateien in der Inbox liegen, wird pro " |