Thread Vokale im Umlaute wandeln (20 answers)
Opened by Tom950 at 2014-03-18 06:48

Tom950
 2014-03-18 21:58
#174280 #174280
User since
2014-03-18
5 Artikel
BenutzerIn
[default_avatar]
Zunächst mal noch etwas Input:
Bei den Texten handelt es sich um Programmbeschreibungen, die einerseits normalen Text enthalten und anderseits kryptisch anmutende Fachkürzel beinhalten. Diese Fachkürzel sollen unverändert erhalten bleiben.
Im übrigen habe ich heute festgestellt, dass sich die Liste der Fachkürzel vermutlich um ein Vielfaches erweitern wird. Die Liste muss alle Fachkürzel enthalten, die ae, oe oder ue enthalten.

Ich gehe mal davon aus, dass die Fachkürzel eigenständige Wörter sind, also keine Wortteile eines größeren Wortes. Das muss ich aber noch verifizieren.

Prinzipiell ist richtig, dass ss noch ggf. in ß konvertiert werden muss. Aber das möchte ich mir dann als Kür aufbewahren.

Wenn man die Fachkürzel zunächst außer Acht lässt, können folgende Such- bzw. Ersetzen-RegEx unter Berücksichtigung der Groß- und Kleinschreibung verwendet werden:
Suchen: -> Ersetzen:
ae([^u]) -> ä$1
A[eE]([^uU]) -> Ä$1
([^ae])ue -> $1ü
([^ae])U[eE] -> $1Ü
oe -> ö
O[eE] -> Ö

In ersten Vorversuchen hat das prima geklappt.

Als prinzipielle Strategie habe ich mir folgendes überlegt:
1. Zunächst wird nach Wörtern gesucht, die potenzielle Kandidaten für Ersetzungen sind
2. Dann wird untersucht, ob es sich bei dem gefundenen Wort um eine Ausnahme handelt.
3. Falls es sich um keine Ausnahme handelt, werden alle möglichen Ersetzungen durchgeführt.

Mein Problem ist: Wie kann ich, nachdem ich festgestellt habe, dass keine Ausnahme vorliegt, in dem Wort die möglichen Ersetzungen durchführen und anschließend am Ende des gefundenen Wortes nach weiteren Wörter in der gleichen Zeile suchen?

View full thread Vokale im Umlaute wandeln