Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

Linuxer
 2014-07-15 23:36
#176463 #176463
User since
2006-01-27
3887 articles
HausmeisterIn

user image
edit: Nochmal angeguckt und drüber nachgedacht:

Hier mal zusammengefügt (Achtung $infile ist jetzt $txtfile):


Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#! /usr/bin/env perl
use strict;
use warnings;

my $outfile = 'adresses.csv';

open my $OUTH, '>>', $outfile or die "open($outfile, w+) failed: $!";

for my $i ( 1 .. 1290 ) {

   my $pdffile = sprintf "%02d.pdf", $i;
   my $txtfile = sprintf "%02d.txt", $i;
   
   my $prog = "C:/pdf/pdftotext.exe -f 1 $pdffile $txtfile";
   system( $prog ) == 0 or next; # bei Fehler weiter mit der naechsten datei

   open my $INH, '<', $txtfile or die "open($txtfile,ro) failed: $!";
   ( undef, my $address ) = <$INH>;  # zweimal lesen; erste "Zeile" ignorieren
   print $OUTH $address;
   close $INH;
}

close $OUTH or die "close($outfile) failed: $!";

Last edited: 2014-07-15 23:46:03 +0200 (CEST)
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern