Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

Linuxer
 2014-07-15 23:34
#176462 #176462
User since
2006-01-27
3870 Artikel
HausmeisterIn

user image
Was man als Ansatz tun könnte:

Man versucht, die einfachen Fälle "Nachname Vorname Strasse Hsn PLZ Ort" zu ermitteln und Semikolons einzufügen.
Diese Fälle schreibt man in eine Ausgabedatei "gute_adressen.csv";

Alle anderen Fälle schreibt man in eine Datei "schlechte_adressen.csv" und kontrolliert sie per Hand.
Alles in der Hoffnung, dass nicht so viele Ausnahmefälle vorliegen.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern