Thread Textnormalisierung...Hilfe! (18 answers)
Opened by Gast at 2008-06-26 17:45

Gast Gast
 2008-06-26 19:01
#111561 #111561
Gast+2008-06-26 16:56:00--
Wie lang ist denn der Text eigentlich?
So lang, dass man vom restlichen Text ( nicht die Satzanfänge ) herleiten kann, welche Wörter klein und welche groß geschrieben werden sollen?
Dann wäre das der Ansatz den ich wählen würde, er kommt mir vergleichsweise einfach vor, auch wenn man das in eine Regex bringen muss.

MfG


Ja, die Aufgabenstellung ist in der Tat recht simpel, aber ich komm einfach nicht auf die Lösung. Das Textkorpus, das wir bekommen haben, ist über 25000 Zeilen lang. ^^ Da bringts nicht viel, sich die Satzanfänge alle anzuschauen. Hättest du vielleicht einen konkreten Ansatz für mich mit einem regulären Ausdruck?

View full thread Textnormalisierung...Hilfe!