Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

Linuxer
 2014-07-15 23:28
#176460 #176460
User since
2006-01-27
3887 articles
HausmeisterIn

user image
Stimmt, das waren ja .txt.

Ich sehe momentan ein Problem beim Verarbeiten der Adresse.

Das Schema ist ja benannt:
Frau (Empfänger) Nachname Vorname Straße HSN PLZ Ort

Aber wie soll man die Daten sauber trennen? Vornamen können aus mehreren Namen bestehen; Straßen auch; Hausnummern können auch mehr als nur Zahlen sein, auch mit Leerzeichen.
Wie soll man also festlegen, wo das Semikolon hin soll?

Code: (dl )
1
2
Mustermann Max Musterstr. 1 12345 Musterstadt
Mustermann Eva Maria Am Musterplatz 2 b 23456 Musterdorf am Wasser


Stehen die Adressen so schon im PDF?
Vielleicht kann es hilfreicher sein, die Daten direkt aus dem PDF zu lesen... dafür habe ich aber bisher nichts mit PDF und den Modulen gemacht.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern