Thread Probleme bei Decodierung des XML-Zeichenformats: iso-8859-1 nach ??? (1 answers)
Opened by greenhornet at 2005-10-12 15:57

greenhornet
 2005-10-12 15:57
#58692 #58692
User since
2005-10-08
5 Artikel
BenutzerIn
[default_avatar]
Hi,

ich schreibe ein Perl-Modul, welches XML-Dateien verarbeitet und anschließend in ein Formular in TK einträgt.

Das Problem ist folgendes:
In dem XML stehen seltsame Dinge wie:
Code: (dl )
{\rtf1\ansi\ansicpg1252\deff0\deflang1031{\fonttbl{\f0\fnil\fcharset0 Tahoma;}}\viewkind4\uc1\pard\f0\fs17 Richtige Antwort\par}


Da das XML am Anfang als "ISO-8859-1" deklariert ist, vermute ich, dass das was mit der Codierung zu tun hat...
Der Teil den ich benötige ist hier: "Richtige Antwort" und evtl. noch Informationen ob der Text Fett, Kursiv,... ist.

Klar wäre es mit Regular Expressions kein Problem die Teile vorn und hinten abzuschneiden und evtl vorkommen \b (fett) herauszufiltern. Ich denke aber, dass es da wohl einen "saubereren" Weg geben müsste.

Für eure Hilfe wär ich euch dankbar!\n\n

<!--EDIT|greenhornet|1129118325-->

View full thread Probleme bei Decodierung des XML-Zeichenformats: iso-8859-1 nach ???