Thread Datenaufbereitung/Datenanalyse: Bitte um Tipps (2 answers)
Opened by Gast at 2006-10-07 23:19

Gast Gast
 2006-10-07 23:19
#70641 #70641
Hallo,

ich will Daten aufbereiten und auswerten, die als Datensätze in Text- oder Exceldateien vorliegen.

Für die Aufbereitung würde ich mir eine möglichst schnörkellose Syntax wünschen, so dass das Skript auch als Dokumentation für Kollegen dienen kann, die sonst nichts mit Perl zu tun haben. Ich denke da an so etwas wie

(Pseudo-Code; @spieleinsatz, @anzklasse1 sind die Ergebnisse einer Reihe von Lottoziehungen):
Code: (dl )
1
2
3
4
$einsatzprospiel = 0.75;
@anzspiel = @spieleinsatz / $einsatzprospiel;
if (@anzklasse1 eq 'Jackpot') {@anzklasse1 = 0;}
@faktorklasse1 = @anzklasse1 * 139_838_160 / @anzspiel;


Auswertungen sind dann vor allem Häufigkeiten, (mehrdimensionale) Kreuztabellen, (gruppierte) Mittelwerte.

* Was für eine Datenstruktur sollte ich in Perl verwenden? Wie man oben sieht, denke ich im Moment in einzelnen Arrays je Datenfeld. Damit wäre ein direktes Benennen der Datenfelder ähnlich obigem Code am ehesten möglich; die Arbeit mit ganzen Datensätzen (Sortieren, Selektieren) wäre dagegen eher umständlich (über Indexarrays, denke ich).

* Welche Module sollte ich mir anschauen?

* Brauche ich zusätzlich ein externes Datenbankprogramm? Ich möchte darauf und besonders auf monströse SQL-Abfragen lieber verzichten.

* Zur Größenordnung: Meist habe ich es mit einigen Tausend Datensätzen zu tun, der dickste Brocken waren mal 170.000 Datensätze. 10 bis 30 Felder, oft mit länglichen Klartextangaben, plus diverse von mir berechnete/kodierte Felder. Bis jetzt bearbeite ich solche Daten größtenteils mit SPSS für Windows.

Danke für alle Tipps und Hinweise,
Redoute

View full thread Datenaufbereitung/Datenanalyse: Bitte um Tipps