
Text
Processor
Zum Transformieren von Text gibt es bereits zahlreiche Werkzeuge. Leider sind viele dieser Werkzeuge sehr kompliziert in der Anwendung und erfordern das Beherrschen von Konzepten wie Regular Expressions. Das Ziel in dieser Projektarbeit war die Entwicklung einer einfacherer Möglichkeit. Der Anwender oder die Anwenderin definiert anhand mehrerer Beispiele, wie eine Transformation aussieht. Der TextProcessor erkennt dabei in vielen Fällen automatisch die Struktur des Textes und kann die gewünsche Transformation dann automatisch anwenden.
Beispiel
Die Ausgangslage in diesem Beispiel ist eine Liste von Emailadressen:
fritz@gmail.com
rene@hotmail.de
andrea@gmx.com
urs@bluewin.ch
…
Die Daten sollen so transformiert werden, dass nur alles vor dem “@“-Zeichen angezeigt werden soll. Die gewünschte Ausgabe ist also:
fritz
rene
andrea
urs
…
So wird diese Transformation im TextProcessor definiert:
Schritt 1: Daten in das Tool kopieren
Die Liste der Emailadressen wird im Tool erfasst
Schritt 2: Trenn-Zeichen für die Daten auswählen
Hier wird definiert, wie die einzelnen Datensätze voneinander getrennt sind. In diesem Beispiel handelt es sich um einen Zeilenumbruch (line break). In einigen Fällen kann das Tool das Trennzeichen selbstständig aus den Daten erkennen.
Schritt 3: Erfassen der Datenstruktur
Im nächsten Schritt wird definiert, welches Muster den Daten zugrunde liegt. In diesem Fall haben die einzelnen Einträge das Muster <name>@<domain>. In manchen Fällen kann das Tool das Muster in den Daten selbstständig erkennen.
Schritt 4: Beispieltransformation 1
Als nächstes wird dem Tool anhand von Beispielen beigebracht, wie der Text transformiert werden soll. In diesem Beispiel wird der Text “rene@hotmail.de” als Ausgangslage verwendet. Der gewünschte Output ist hier “rene“
Schritt 5: Beispieltransformation 2
In der Regel müssen mehrere Beispiele erfasst werden, bis sich das Tool sicher ist, das Muster der Transformation richtig erkannt zu haben. In diesem Beispiel genügen zwei Beispieltransformationen.
Schritt 6: Resultat
Am Ende transformiert das Tool Zeile für Zeile und gibt das Resultat auf dem Bildschirm aus.