Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern
(20 answers)
Opened by Thyrius at 2014-07-15 21:55
Wenn ich statt aus einer Datei (zum Test) aus dem DATA-Bereich des Programms lese und auf STDOUT ausgeben:
Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 my @csv = (); # Array das später alle Felder beinhaltet # 14 Zeilen überspringen scalar <DATA> for 1..14; # weitere Zeilen einlesen while ( my $line = <DATA> ) { # Zeilenendezeichen entfernen chomp $line; # Ende, wenn Zeile mit Telefon gefunden last if $line =~ /^Telefon:/i; # Datenfeld zwischenspeichern push @csv,$line; } # alle Felder mit dem ; verbunden ausgeben und ein Newline print STDOUT join( ';', @csv), "\n"; __DATA__ Firmenname Kontaktmöglichkeiten Deutscher Industrie und Handelskammertag (DIHK) Strasse Gesellschaft Ort und Telefon Hier noch was da noch was noch was, was nicht interessiert Adresse der Firma Vom Briefkopf rechts Zeile 1 Vom Briefkopf rechts Zeile 2 Vom Briefkopf rechts Zeile 3 Vom Briefkopf rechts Zeile 4 Absendername und -Adresse im Kuvertfenster 66663 Merzig Herrn Willi Mustermann c/o Wilhelmine Musterfrau 1-Strasse 7 12345 Musterstadt Telefon: 123 456-789 Mail: Blah@must.er Blubb ergibt es bei mir: Herrn;Willi Mustermann;c/o Wilhelmine Musterfrau;1-Strasse 7;12345 Musterstadt Kann es sein, dass die Zeile mit Telefon: doch nicht aso aussieht wie in meinem Beispiel? Leerzeichen am Anfang oder : woanders? |