Datei lesen und in Hash schreiben? (Seite 3) (Allgemeines zu Perl)

[thread]6022[/thread]

Datei lesen und in Hash schreiben? (Seite 3)

Leser: 2

kabel

2004-01-19 21:58

User since
2003-08-04
704 Artikel
BenutzerIn
[default_avatar]

bullshit. wen interessiert die effizienz einer routine, die genau 1mal
ausgeführt wird und deren aufgabe als überschaubar zu bezeichnen einer untertreibung gleicht.
(an dem satz hab ich jetzt glatte 5 minuten gebastelt - DAS ist ineffizient! ;) )

das format der zu parsenden datei ist wieder mal ***, aber naja.

-- stefan

eisbeer

2004-01-19 22:40

User since
2003-08-29
347 Artikel
BenutzerIn

Ich bin verwirrt. :rock: :0

Die meisten PC Probleme befinden sich zwischen Bildschirm und Stuhl...

kabel

2004-01-19 22:59

User since
2003-08-04
704 Artikel
BenutzerIn
[default_avatar]

selbst ein typ2-parser (Parse::RecDescent und konsorten) ist schnell genug für die aufgabe :)
das einzige problem ist das format der datei.
benchmarks sind (fast) nie sinnvoll für einzelne codefragmente.
(ok, das ist eine behauptung, klingt aber verdammt plausibel)

-- stefan

eisbeer

2004-01-20 07:35

User since
2003-08-29
347 Artikel
BenutzerIn

Ja, genau, meine Meinung ;)

Die meisten PC Probleme befinden sich zwischen Bildschirm und Stuhl...

Patrick

2004-01-20 09:28

User since
2004-01-07
56 Artikel
BenutzerIn
[default_avatar]

@Crain
[quote=Crian,19.01.2004, 20:47]@Patrick: Antworte doch bitte mal auf meine Frage

> Ist es immer so, dass die Zeilen mit Listenelementen auf Backslach enden (bis auf die Zeile mit dem letzten Wert)?

Wenn ja, kann man da noch was löten, wenn nein, kann man etwas machen, falls die Werte auf keinen Fall Whitespace enthalten.

Also sag mal näheres dazu :)[/quote]

Sorry,

bin gestern etwas früher weg gewesen.

Antwort:
Ja, aber manchmal liegt ein Kommentar dazwischen und manchmal nicht. Das Ganze ist etwas kompliziert aufgebaut!

Hier nochmal ein Auszug:

Code: (dl )

#
# Kommentar
#

TOKSINGLE      = :Wa                  # Kommentar
TOKWORDS       = :W                   # Kommentar
TOKDELIMITER   = :Wd                  # Kommentar
TOKDESCRIPTION = :WND
TOKFILLER      = :WF
TOKMODIFIER    = :WMN

SPECTOKEN      =                      # -z /Path/xy.txt

PHRASES    = IllegalSyn               # Kommentar classes \
             Question                                               \
             Sure                                                   \
             NoPerm                                                 \
             AsIs                                                   \
             NewSentence                                            \
             NoNewSentence                                          \

#
# Kommentar
#

GENLIST    =  Array2.genlist                   # Kommentar
TERMLIST  =  02_IrgendeineListe             # Kommentar      \
           03_IrgendeineListe             # Kommentar,    \
                                                        # Kommentar
STARTLIST    = dateiname.ids                 # Kommentar
OUTPUTNAME =                                    # Kommentar
CROSSLIST    = 01_XY                          # Kommentar
ADDFILTER  =                                      # Kommentar

Das ganze ist etwas schwer einzulesen!

Ich befürchte auch, das ein Hash für die Listenelemente nicht unbedingt geeignet

Mfg
Paddy

Perl ist göttlich, die Kunst besteht darin Perl anwenden zu können.

Patrick

2004-01-20 10:28

User since
2004-01-07
56 Artikel
BenutzerIn
[default_avatar]

Ich versuche es am besten mit einem Array, da das Hash bei den Listen wohl streiken wird!

Von der Theorie der Ablauf dann so:
1.) Zeilenweises einlesen in ein Array
2.) Splitten auf Wert vor dem "=", den Wert zwischen "=" und "#" und dem Wert nach dem "#"
3.) Gesplitteten Werte in ein neues Array schreiben

Das neue Array soll wie folgt aussehen:

1. Element = @Array[GENLIST][wert][Kommentar]
2. Element = @array[STARTLIST][wert][Kommentar]
.
.
.
usw.

Mfg
Paddy

Perl ist göttlich, die Kunst besteht darin Perl anwenden zu können.

Crian

2004-01-20 12:40

User since
2003-08-04
5881 Artikel
ModeratorIn

Aha, danke :)

Hash ist schon ok, aber die Werte werden dann halt manchmal Skalare und manchmal Arrayreferenzen sein müssen.

Ich nehme mal an, dass die Backslashes die letzten Zeichen in ihrer jeweiligen Zeile sind.

Die passende Vorgehensweise beim Einlesen ist dann folgende:

Vor Einleseschleife:

- leeres Arbeitsarray anlegen.

In der Einleseschleife (while (<IN>) { ... }):

- Aktuelle Zeile in Arbeitsarray kopieren.

- Wenn das letzte Zeichen der aktuellen Zeile nicht ein Backslash ist: Arbeitsarray auswerten, Hasheintrag erstellen, Arbeitsarray leeren. (Das Auswerten muss dann abhängig davon, ob das Arbeitsarray eine oder mehrere Zeilen enthält unterschiedlich erfolgen.)

HTH

Wenn Du bei der Umsetzung Probleme hast, frag ruhig wieder nach.\n\n

s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite

Dubu

2004-01-20 13:00

User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image

Code: (dl )

#!/usr/bin/perl
use strict;
use warnings;

my %params;

open PARAM, "param.dat" or die $!;

my $buffer = '';
while (<PARAM>) {
    # Kommentare loeschen
    s/\s*#.*?(\\?\n)/$1/;

    # Leerzeichen an Anfang und Ende loeschen
    s/^\s+//;
    s/\s+$//;

    # Zeile jetzt leer?
    unless (length) {
        # vorhandenen Buffer bearbeiten
        insert_keys (\$buffer, \%params);
        next;
    }

    # Zeile merken
    $buffer .= $_;
    if ($buffer =~ /\\$/) {    # Fortsetzung folgt?
        # Fortsetzungszeichen durch Leerzeichen ersetzen
        chop $buffer; $buffer .= " ";
        next;
    }

    # Ein Satz zusammen => eintragen
    insert_keys (\$buffer, \%params);

}
# Falls die letzte Zeile noch ein Fortsetzungszeichen hatte ...
insert_keys (\$buffer, \%params);


use Data::Dumper;
print Dumper \%params;

#############################################
sub insert_keys {
    my ($bufferp, $paramp) = @_;
    return unless defined $$bufferp && length $$bufferp;

    die "Syntaxfehler in Zeile $." unless index ($$bufferp, '=') >= 0;
    my ($key, $val) = split /\s*=\s*/, $$bufferp, 2;


    unless (defined $val) {
        $paramp->{$key} = undef;
        return;
    }
    if ($val =~ /\s/) { # Leerzeichen zwischen Woertern? => Liste
        my @vals = split " ", $val;
        $paramp->{$key} = \@vals;
    } else {
        $paramp->{$key} = $val;
    }
    $$bufferp = "";
}

#############################################

_ _ END _ _
$VAR1 = {
          'TOKDELIMITER' => ':Wd',
          'ADDFILTER' => '',
          'CROSSLIST' => '01_XY',
          'TERMLIST' => [
                          '02_IrgendeineListe',
                          '03_IrgendeineListe'
                        ],
          'TOKMODIFIER' => ':WMN',
          'TOKWORDS' => ':W',
          'SPECTOKEN' => '',
          'TOKSINGLE' => ':Wa',
          'PHRASES' => [
                         'IllegalSyn',
                         'Question',
                         'Sure',
                         'NoPerm',
                         'AsIs',
                         'NewSentence',
                         'NoNewSentence'
                       ],
          'TOKFILLER' => ':WF',
          'OUTPUTNAME' => '',
          'STARTLIST' => 'dateiname.ids',
          'GENLIST' => 'Array2.genlist',
          'TOKDESCRIPTION' => ':WND'
        };

param.dat enthielt die Daten aus dem letzten Beispiel.

Crian

2004-01-20 13:13

User since
2003-08-04
5881 Artikel
ModeratorIn

Nö, der Kommentar wird gebraucht, siehe meinen Ansatz von oben, bevor wir wussten, dass es komplizierter ist:

Code: (dl )

#!/usr/bin/perl
use strict;
use warnings;
use Data::Dumper;

my %hash;
my @array = ('KEYWORD      =   wert # Kommentar',
             'KEYWORD2     =   wert2 # Kommentar2',
             'KEYWORD3=wert3#Kommentar3',
             'KEYWORD4  =wert4 #                 Kommentar4',
            );

for (@array) {
    my ($key, $val, $com) = m~^(.+?)\s*=\s*(.+?)\s*#\s*(.*)$~;
    $hash{$key} = { wert => $val, kommentar => $com };
}

print Dumper(\%hash);

s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite

Patrick

2004-01-20 13:26

User since
2004-01-07
56 Artikel
BenutzerIn
[default_avatar]

[quote=Crian,20.01.2004, 12:13]Nö, der Kommentar wird gebraucht, siehe meinen Ansatz von oben, bevor wir wussten, dass es komplizierter ist:

Code: (dl )

#!/usr/bin/perl
use strict;
use warnings;
use Data::Dumper;

my %hash;
my @array = ('KEYWORD      =   wert # Kommentar',
             'KEYWORD2     =   wert2 # Kommentar2',
             'KEYWORD3=wert3#Kommentar3',
             'KEYWORD4  =wert4 #                 Kommentar4',
            );

for (@array) {
    my ($key, $val, $com) = m~^(.+?)\s*=\s*(.+?)\s*#\s*(.*)$~;
    $hash{$key} = { wert => $val, kommentar => $com };
}

print Dumper(\%hash);

[/quote]
Die Datei, die ich auslesen soll dient sozusagen als Vorlage.
Die darin enthaltenen Werte müssen von mir übernommen werden.
Leerzeichen werden wenigen Problematisch sein.

Was mir wie gesagt Kopfzerbrechen bereitet, ist die Frage:
Wie erkenne ich wann eine "Liste" an Parametern kommt.
Bsp.:

Code: (dl )

DESCSCR    =  10    # Score Descriptor (%)
TOKEN      = ./Single                 # Computed single word list    \
             Words                    		# List of known token classes  \
             Delimiter                                               \
             Description                                           \
             Filler                                                     \
             Modifier                                               \

MIXEDSCR   = 100   # Score Alpha/num (%)

Mfg
Paddy

Perl ist göttlich, die Kunst besteht darin Perl anwenden zu können.

View all threads created 2004-01-18 22:12.