Thread Automatische Textgeneration: Kontakt zu Programmierenden gesucht (10 answers)
Opened by kusanowsky at 2010-11-30 14:27

topeg
 2010-12-01 23:32
#143264 #143264
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
Ich hatte mal ein Script angefangen, das sich durch das Internet spidert und Sätze sammelte. Dann schaute das Script welche Sätze aufeinander folgten um daraus dann neue Kombinationen zu machen. Leider ist so was rechtlich wohl nicht unproblematisch ...

Was den Regelbasierten basierten Ansatz betrifft, so ist gerade die deutsche Sprache sehr Regellastig und "wortarm" (viele Wörter entstehen durch Kombinationsregen) das macht es schwer einen guten Generator zu schreiben. Es gibt schon Systeme welche Grammatiken überprüfen, ich kenne aber keine die Open Source oder lizenzfrei nutzbar währen. Googe z.B. benutzt bei seinen Übersetzungen den statistischen Ansatz.

Wenn man nicht zu spezifisch für dieses Projekt arbeiten würde könnten auch andere davon Profitieren. So ist ein Generator unter Umständen auch ein gutes Tool zur Rechtschreib- oder Syntax-Prüfung. Auch zum indizieren von Dokumenten kann etwas ähnliches verwendet werden. Ähnlichkeitsprüfungen von Texten brauchen viele Bausteine die auch in einem Generator Verwendung finden. Man sollte sich eventuell überlegen, ob es nicht günstig wäre bei Office-Interessierten Hilfe zu suchen, oder ein gemeinsames Projekt zu starten.

Ich könnte mich durchaus für so was begeistern, aber ich würde dabei meine anderen Arbeiten vernachlässigen. :-/
Ich habe recht wenig Disziplin bei Dingen, die mich interessieren ;-)

View full thread Automatische Textgeneration: Kontakt zu Programmierenden gesucht