Thread DER richtige Zeichensatz ... (Windows, Linux, ...) (6 answers)
Opened by Hagen at 2007-09-24 18:20

Hagen
 2007-10-02 19:00
#100223 #100223
User since
2007-09-06
233 Artikel
BenutzerIn
[default_avatar]
Danke für die Hinweise und Idee. Dann werde wohl mal ein bisschen Kreativität in die Lösung stecken müssen.

Obwohl ich gedacht hätte, dass es sich eher um ein schon älteres Problem handeln würde. Schließlich laufen Perl-Scripte weltweit auf sehr unterschiedlichen Servern zur Vearbeitung von sehr unterschiedlichen Daten (z.B. Gästebuch auf einer Homepage).

Taulmarill+2007-09-25 10:27:36--
Mit "markieren" meine ich eine beliebige Methode, mit der der Datenlieferant die Daten um die Information ergänzt, um welche Codierung es sich handelt. Das kann z.b. ein Teil des Dateinamens sein oder einfach in der ersten Zeile stehen. An eine bestimmte Methode hatte ich nicht gedacht. Was am sinnvollsten ist, hängt von den Rahmenbedingungen ab.


Bei den Daten handelt es sich um reine CSV-Dateien. Man könnte sicherlich einen Test-String am Anfang oder Ende einfügen. Die Lösung finde ich aber nicht so optimal. Ebenfalls die Lösung mit dem Dateinamen finde ich nicht so toll, inbesondere wenn es über die Grenzen des (eigenen) Betriebssystems hinaus geht.

Quote
Schau dir an, wie die Daten erzeugt werden. Evtl. kann man da ansetzen und eine Vorgehensweise erarbeiten, die dir immer das selbe Format garantiert.


Wäre ein Ansatz.

In den CSV-Dateien sind eigentlich nur 'normale' Zeichen zugelassen (a-z, 0-9 und ein paar Symbole ), d.h. keine Steuerzeichen. D.h. wenn ich diese rausfiltern würde, dürften nur noch Problemzeichen übrig bleiben, die dann entsprechend ersetzt werden (also der Ansatz von ptk). Mal probieren, ob mir das reich.
Gruß
Hagen

View full thread DER richtige Zeichensatz ... (Windows, Linux, ...)