Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

GwenDragon
 2014-07-17 17:19
#176494 #176494
User since
2005-01-17
14745 Artikel
Admin1
[Homepage]
user image
Wenn ich statt aus einer Datei (zum Test) aus dem DATA-Bereich des Programms lese und auf STDOUT ausgeben:
Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
my @csv = (); # Array das später alle Felder beinhaltet

# 14 Zeilen überspringen
scalar <DATA> for 1..14;
# weitere Zeilen einlesen
while ( my $line = <DATA> ) {
    # Zeilenendezeichen entfernen
    chomp $line;      
      
    # Ende, wenn Zeile mit Telefon gefunden
    last if $line =~ /^Telefon:/i;

    # Datenfeld zwischenspeichern       
    push @csv,$line;       
}
# alle Felder mit dem ; verbunden ausgeben und ein Newline
print STDOUT  join( ';', @csv), "\n"; 

__DATA__
Firmenname
Kontaktmöglichkeiten
Deutscher Industrie und Handelskammertag (DIHK)
Strasse Gesellschaft Ort und Telefon
Hier noch was
da noch was
noch was, was nicht interessiert
Adresse der Firma
Vom Briefkopf rechts Zeile 1
Vom Briefkopf rechts Zeile 2
Vom Briefkopf rechts Zeile 3
Vom Briefkopf rechts Zeile 4
Absendername und -Adresse im Kuvertfenster
66663 Merzig
Herrn
Willi Mustermann
c/o Wilhelmine Musterfrau
1-Strasse 7
12345 Musterstadt
Telefon: 123 456-789
Mail: Blah@must.er
Blubb

ergibt es bei mir:
Herrn;Willi Mustermann;c/o Wilhelmine Musterfrau;1-Strasse 7;12345 Musterstadt

Kann es sein, dass die Zeile mit Telefon: doch nicht aso aussieht wie in meinem Beispiel? Leerzeichen am Anfang oder : woanders?

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern