Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende ÜberarbeitungNächste ÜberarbeitungBeide Seiten der Revision | ||
re-indexierung [2017/12/11 11:29] – [Re-Indexierung eines Containers] lwsystems | re-indexierung [2017/12/11 13:04] – [Re-Import] lwsystems | ||
---|---|---|---|
Zeile 2: | Zeile 2: | ||
- | Wird eine schon archivierte E-Mail erneut importiert, wird dieses mit Hilfe der Duplikatserkennung festgestellt. | + | Wird eine schon archivierte E-Mail erneut importiert, wird dieses mit Hilfe der Duplikatserkennung festgestellt. |
- | In diesem Fall wird die archivierte | + | In diesem Fall wird die Mail nicht erneut archiviert. Auch wird die archivierte |
- | Anschließend wird der Index-Eintrag der E-Mail gelöscht und durch die aktualisierten Index-Daten | + | |
- | Dieses Vorgehen kann beispielsweise | + | Dieses Vorgehen kann beispielsweise |
+ | |||
+ | (Hinweis: Der Tokenizer unterstützt Stand Ende 2017 ca. 1.300 unterschiedliche Dateiformate). | ||
====== Re-Indexierung eines Containers ====== | ====== Re-Indexierung eines Containers ====== | ||
Zeile 17: | Zeile 18: | ||
====== Re-Import ====== | ====== Re-Import ====== | ||
- | Im Repository-Verzeichnis liegen die E-Mails als gezippte Dateien in einem erweiterten [[Archiv-Format|RFC822-Format]]. Die Dateien enthalten einen speziellen Header mit internen Metainformationen sowie die eigentliche E-Mail. | + | Im Repository-Verzeichnis liegen die E-Mails als gezippte Dateien in einem erweiterten [[Archiv-Format|RFC822-Format]]. Die Dateien |
- | Für den Re-Index | + | Für den Re-Index |
Zur Vereinfachung des Imports stellen wir das Perl-Script [[http:// | Zur Vereinfachung des Imports stellen wir das Perl-Script [[http:// |