Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern (20 answers)
Opened by Thyrius at 2014-07-15 21:55

Thyrius
 2014-07-15 21:55
#176455 #176455
User since
2013-01-23
42 articles
BenutzerIn

user image
Hallo Leute,

heute brauche ich mal einen dringenden Rat von Euch.

Ich habe hier etwas mehr als 1200 PDF-Dateien (Text), die jeweils ein Anschreiben mit verschiedenen Adressen und Kundennummern bzw. Vertragsnummern beinhaltet.
Leider müssen wir unser System wechseln und dazu muss ich nun die Adressen, die im Empfängerfeld stehen, auslesen und vorzugsweise für Excel aufbereiten.

Da ich so gut wie keine Erfahrung habe, aber weiss, dass es damit geht, wende ich mich an Euch.

Nun zur aktuellen IST-Situation:

Habe in einem Verzeichnis unter Windows etwa 1200 PDF-Files, benannt nach diesem Muster: <Name, Vorname.pdf>, alles ausgedruckte Kundenstammdaten aus unserem CMS-System in je eine PDF.
Mit ein wenig Tüfteln ist es mir gelungen, per Batch-Datei (in einem Sicherungskopie-Ordner) alle Files mit Hilfe von pdftotxt.exe so umzubenennen, dass die Files nun <01.pdf> bis <1209.pdf> heissen und dass die gewünschten Adressen alle in zweiter Zeile stehen.
Genau diese gilt es nun, auszulesen und vorzugsweise in eine Semikolon-separierte CSV-Datei zu schreiben, damit ich sie für einen Serienbrief in eine Excel-Datei bekomme.

Weiter habe ich ergoogelt, dass ich mit z.B.:

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#!/usr/bin/env perl
use CGI::Carp "fatalsToBrowser";
use strict;

print "Content-type: text/html\n\n";
print "<HTML><HEAD><TITLE>Test</TITLE></HEAD><BODY>\n";
print "<h1>Hello!</h1>\n";

# Read a text file #
open (TXTFILE, "01.txt") or die "Err $!\n";;
while (<TXTFILE>){
if ($. == 2) {
print "Zeile 2: $_\n<br>";
last;
}
}
print "</BODY></HTML>\n";


genau meine gewünschte Zeile auslesen kann und zumindest auf dem Bildschirm richtig ausgeben kann.
Ich möchte sie aber in einer importierbaren csv-Datei haben.

Wie schreibe ich die Datei um und wie sorge ich dafür, dass das Scribt alle Dateien ausliest und jeweils immer die zweite Zeile hinzufügt?

Vielen Dank für Eure Hilfe!!!

(oder gehts noch ganz anders, ohne viel Heckmeck???)

Lg

Christian

modedit Editiert von pq: "gelöst" aus titel genommen. bitte grünen haken benutzen
Last edited: 2014-07-17 15:55:11 +0200 (CEST)
Alter Mann ist kein D-Zug... :D

View full thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern