Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

Linuxer
 2014-07-15 23:00
#176458 #176458
User since
2006-01-27
3887 articles
HausmeisterIn

user image
Hallo Thyrius,

Wie schaut denn eine Zeile mit Adresse aus? Ist das schon ein CSV-Format?
Dann müsstest Du ja nur eine Ausgabedatei zum Schreiben öffnen und anstatt nach STDOUT (wie im Beispiel) in den Handle der Ausgabedatei schreiben.

Wenn die Adressen nicht im CSV-Format vorliegen, musst Du sie natürlich noch umformatieren.
Da Du aber kein Wort über das Format der Adresszeile geschrieben hast, kann man da allenfalls grob raten...

Zum Durchlaufen der Quelldateien.
Du kannst eine for-Schleife dafür nutzen und mit sprintf die Zahl auf 2 Stellen formatieren (da Du von 01 bis 1290 schriebst); hat die Zahl mehr Stellen, wird sie eben länger.

Die zweite Zahl kannst Du erhalten, indem Du nur zweimal vom Lesenden Handle liest.

Simpler ungetesteter Versuch:
Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#! /usr/bin/env perl
use strict;
use warnings;

my $outfile = 'adresses.csv';


open my $OUTH, '>>', $outfile or die "open($outfile, w+) failed: $!";

for my $i ( 1 .. 1290 ) {

   my $infile = sprintf "%02d.pdf", $i;

   open my $INH, '<', $infile or die "open($infile,ro) failed: $!";
   ( undef, my $address ) = <$INH>;  # zweimal lesen; erste "Zeile" ignorieren
   print $OUTH $address;
   close $INH;
}

close $OUTH or die "close($outfile) failed: $!";
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern