Benutzer-Werkzeuge

Webseiten-Werkzeuge


benno.xml

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
benno.xml [2018/05/28 09:02] – [Dateiablage] Veraltete Konfiguration entfernt lwsystemsbenno.xml [2023/11/23 11:56] (aktuell) – [Regex] lwsystems
Zeile 70: Zeile 70:
     * %%to = "true"%%     * %%to = "true"%%
     * %%cc = "true"%%     * %%cc = "true"%%
 +    * %%regex = "true"%%
   * //%%<domain sender="true" recipient="true">domain</domain>%%// - Vergleicht nur den Domain-Name   * //%%<domain sender="true" recipient="true">domain</domain>%%// - Vergleicht nur den Domain-Name
     * %%sender = "true"%%     * %%sender = "true"%%
Zeile 76: Zeile 77:
     * %%to = "true"%%     * %%to = "true"%%
     * %%cc = "true"%%     * %%cc = "true"%%
 +    * %%regex = "true"%%
  
  
 Alle **nicht** gesetzten Attribute sind per Default auf **true** gesetzt. Alle **nicht** gesetzten Attribute sind per Default auf **true** gesetzt.
  
 +Ein Semikolon ";" ist laut [[https://datatracker.ietf.org/doc/html/rfc822#section-6.2.6|RFC2822]] und [[https://datatracker.ietf.org/doc/html/rfc2822#appendix-A.1.2|RFC2822]] **kein** Trenner einzelner  Adressen, sondern dient in Verbindugn mit dem ":" dazu eine Gruppe einzuklammern.
 ==== not ==== ==== not ====
  
Zeile 95: Zeile 98:
 Hier wird **jede** E-Mail, die die Adresse //blockme@hansen-und-meyer.de// in einem der Sender- oder Empfänger Header enthält nicht archiviert! Dieses Hier wird **jede** E-Mail, die die Adresse //blockme@hansen-und-meyer.de// in einem der Sender- oder Empfänger Header enthält nicht archiviert! Dieses
 ist unabhängig davon, ob die E-Mail per CC an eine Adresse geschickt wurde, die archiviert werden soll. ist unabhängig davon, ob die E-Mail per CC an eine Adresse geschickt wurde, die archiviert werden soll.
 +==== Regex ====
 +
 +
 +''<domain sender="true" recipient="true" regex="true">(?i)^((?!\blw-systems\.net\b).)*$</domain>''
 +
 +Der regläre Ausdruck wird als Java-Regex interpretiert.
 ==== Hinweise ==== ==== Hinweise ====
  
 === Prüfung der Kriterien === === Prüfung der Kriterien ===
  
-Die überprüften Adress-Header werden die eigentlichen Adressen (der Form "personal@domain") extrahiert. Nur dieser String wird mit +Aus den konfigurierten Headern für Senderund Empfänger werden die eigentlichen Adressen (der Form "personal@domain"als Token extrahiert. Nur dieser String wird mit der konfigurierten Adresse verglichen. Vor dem Vergleich werden die "<" und ">" ebenfalls entfernt. Bei der Prüfung wird die Groß- und
-der konfigurierten Adresse verglichen. Vor dem Vergleich werden die "<" und ">" ebenfalls entfernt. Bei der Prüfung wird die Groß- und+
 Kleinschreibung nicht beachtet. Kleinschreibung nicht beachtet.
 +
 +Die Prüfung der Token erfolgt //einzeln// gegen jeden der konfigurierten logischen Ausdrücke. Bei der Prüfung wird der Zustand (State) der E-Mail nicht gespeichert, so daß keine Entscheidung der Form //WENN abc@domain UND NICHT def@domain// getroffen werden kann.
 +
  
 **Alle** E-Mails der Inbox werden gelöscht! Dieses betrifft auch E-Mails, auf die keines der Kriterien zutrifft. **Alle** E-Mails der Inbox werden gelöscht! Dieses betrifft auch E-Mails, auf die keines der Kriterien zutrifft.
Zeile 122: Zeile 133:
  
 <file> <file>
-<directorywatcher directory="/srv/benno/inbox" +<directorywatcher directory="/srv/benno/inbox" pattern=".*\.eml">
-                  pattern=".*">+
   <mailfile>...</mailfile>   <mailfile>...</mailfile>
 </directorywatcher> </directorywatcher>
Zeile 155: Zeile 165:
     <name>BCC</name>     <name>BCC</name>
   </secretheaders>   </secretheaders>
 +  <customhash>
 +    <name>From</name>
 +    <name>To</name>
 +    <name>Subject</name>
 +    <name>Date</name>
 +    <name>Message-Id</name>
 +  </customhash>                
 </mailfile> </mailfile>
 </file> </file>
Zeile 160: Zeile 177:
 Die Zuordnung von Sender- und Empfängerdaten erfolgt innerhalb der Tags //<senderheaders />// bzw. //recipientheaders />//. Die Zuordnung von Sender- und Empfängerdaten erfolgt innerhalb der Tags //<senderheaders />// bzw. //recipientheaders />//.
  
-Alle Header, die im Tag //<secretheaders />// aufgeführt sind, werden vor dem Speichern aus der E-Mail entfernt. Diese Informationen sind ausschließlich im Index vorhanden.+Alle Header, die im Tag //<secretheaders />// aufgeführt sind, werden vor Berechnung der Checksumme und dem Speichern aus der E-Mail entfernt. Diese Informationen sind ausschließlich im Index vorhanden.
  
  
Zeile 199: Zeile 216:
 <luceneindex version=“LUCENE_36“> <luceneindex version=“LUCENE_36“>
   <directory>/srv/mailarchive/default/index</directory>   <directory>/srv/mailarchive/default/index</directory>
 +  <indexTimeout>120</indexTimeout>
 </luceneindex> </luceneindex>
 </file> </file>
Zeile 204: Zeile 222:
   * version - Lucene-Versionsnummer des Indexes   * version - Lucene-Versionsnummer des Indexes
   * directory - Verzeichnis der Indexdateien   * directory - Verzeichnis der Indexdateien
 +  * indexTimeout - (optional) Timeout für Rückmeldung vom Tokenizer (default: 120 Sekunden)
  
 ===== Boxgenerator ===== ===== Boxgenerator =====
  
-  * [[#singlefsbox]] 
-  * [[#weeklyfsbox]] 
-  * [[#monthlyfsbox]] 
-  * [[#quarterlyfsbox]] 
   * [[#yearlyfsbox]]   * [[#yearlyfsbox]]
  
 ==== singlefsbox ==== ==== singlefsbox ====
 +
 +**VERALTET** Wird in zukünftigen Versionen entfallen!
  
 Eine einzelne Box wird konfiguriert und verwendet. Eine einzelne Box wird konfiguriert und verwendet.
Zeile 233: Zeile 249:
  
  
-==== weeklyfsbox ==== 
- 
-Konfiguration für wöchentliche Boxerstellung. Der Grundpfad wird in der Beispielkonfiguration der Box angegeben, für die echten Boxen wird jeweils eine Konfiguration mit dem erweiterten Pfad „.../2011w07/“ erstellt. Damit befinden sich die eigentlichen Boxen in Unterverzeichnissen des in der Beispielkonfiguration angegebenen Pfads. 
- 
-<file> 
-<weeklyfsbox> 
-  <Box /> 
-</weeklyfsbox> 
-</file> 
-==== monthlyfsbox ==== 
- 
-Konfiguration für monatliche Boxerstellung. Der Grundpfad wird in der Beispielkonfiguration der Box angegeben, für die echten Boxen wird jeweils eine Konfiguration mit dem erweiterten Pfad „.../201103/“ erstellt. Damit befinden sich die eigentlichen Boxen in Unterverzeichnissen des in der Beispielkonfiguration angegebenen Pfads. 
- 
-<file> 
-<monthlyfsbox> 
-  <Box /> 
-</monthlyfsbox> 
-</file> 
- 
-==== quarterlyfsbox ==== 
- 
-Konfiguration für quartalsweise Boxerstellung. Der Grundpfad wird in der Beispielkonfiguration der Box angegeben, für die echten Boxen wird jeweils eine Konfiguration mit dem erweiterten Pfad „.../2011q2/“ erstellt. Damit befinden sich die eigentlichen Boxen in Unterverzeichnissen des in der Beispielkonfiguration angegebenen Pfads. 
- 
-<file> 
-<quarterlyfsbox> 
-  <Box /> 
-</quarterlyfsbox> 
-</file> 
  
  
Zeile 283: Zeile 271:
   <id>boxname</id> // Name der Box, wird bei generierten Boxen meist automatisch vergeben.   <id>boxname</id> // Name der Box, wird bei generierten Boxen meist automatisch vergeben.
   <compression>none</compression> // Kompression der Mails in der Box.   <compression>none</compression> // Kompression der Mails in der Box.
-                                                              // Unterstützt werden „none“„gzip“ und „bzip2“+                                                              // Unterstützt werden „none“ und „gzip“.                                                              
   <directory>/srv/mailarchive/box</directory> // Verzeichnis in dem die Box ihre Dateien ablegt   <directory>/srv/mailarchive/box</directory> // Verzeichnis in dem die Box ihre Dateien ablegt
   <subdirs>3</subdirs> // Anzahl der Unterverzeichnisebenen bis zur Maildatei   <subdirs>3</subdirs> // Anzahl der Unterverzeichnisebenen bis zur Maildatei
Zeile 313: Zeile 301:
 ... ...
 </file> </file>
- 
-==== fshexmailbox ==== 
- 
-Box in der die Nachrichten "roh" im eml-Format abgelegt werden. Die Metadaten werden in einer zusätzlichen Datei abgelegt.  
-Der Pfad wird aus der Hex Darstellung des Hashwertes generiert, pro Unterverzeichnisebene werden jeweils „dirlength“ Zeichen verwendet, es gibt „subdirs“  
-Unterverzeichnisebenen. 
- 
-<file> 
-<fshexmailbox> 
-  <Journal /> // Journal dieser Box. Es wird im Unterverzeichnis „.../journal“ angelegt. 
-  <id>boxname</id> // Name der Box, wird bei generierten Boxen meist automatisch vergeben. 
-  <compression>none</compression> // Kompression der Mails in der Box. 
-                                                              // Unterstützt werden „none“, „gzip“ und „bzip2“ 
-  <directory>/srv/mailarchive/box</directory> // Verzeichnis in dem die Box ihre Dateien ablegt 
-  <subdirs>3</subdirs> // Anzahl der Unterverzeichnisebenen bis zur Maildatei 
-  <dirlength>2</dirlength> // Anzahl der Zeichen, die eine Unterverzeichnisebene bilden 
-</fshexmailbox> 
-</file> 
- 
  
  
Zeile 349: Zeile 318:
   <containerarchive>   <containerarchive>
     <identifier>LWsystems</identifier>     <identifier>LWsystems</identifier>
-    <conditions> +    <conditions><all /></conditions>
-      <domain sender="true" recipient="true" from="true" to="true" cc="true">lw-systems.de</domain> +
-    </conditions>+
     <readonly>true</readonly>     <readonly>true</readonly>
-    <directorywatcher directory="/srv/benno/inbox" pattern=".*">+    <directorywatcher directory="/srv/benno/inbox" pattern=".*\.eml">
       <!-- Parser der Eingangsdokumente (mailfile|bennomailfile) -->       <!-- Parser der Eingangsdokumente (mailfile|bennomailfile) -->
       <mailfile>       <mailfile>
Zeile 386: Zeile 353:
           <directory>/srv/benno/archives/lw-systems.de/index</directory>           <directory>/srv/benno/archives/lw-systems.de/index</directory>
         </luceneindex>         </luceneindex>
-        <singlefsbox+        <yearlyfsbox
-          <fshexbennobox> +            <fshexbennobox> 
-            <singlejournal/> +                <monthlyfsjournal/> 
-            <compression>gzip</compression> +                    <directory>/srv/benno/archives/lw-systems.de/repo</directory> 
-            <directory>/srv/benno/archives/lw-systems.de/repo</directory> +                    <subdirs>3</subdirs> 
-            <subdirs>3</subdirs> +                    <dirlength>2</dirlength> 
-            <dirlength>2</dirlength> +                    <compression>gzip</compression> 
-          </fshexbennobox> +            </fshexbennobox> 
-        </singlefsbox>+        </yearlyfsbox>
       </simplecontainer>       </simplecontainer>
     </configuredcontainers>     </configuredcontainers>
benno.xml.1527498173.txt.gz · Zuletzt geändert: 2018/05/28 09:02 von lwsystems