Thread Durchlaufzeit von 2 verschachtelten foreach-schleifen optimieren (5 answers)
Opened by kimmy at 2013-12-17 11:05

Muffi
 2013-12-17 11:27
#172634 #172634
User since
2012-07-18
1465 Artikel
BenutzerIn
[default_avatar]
Du musst auch aufpassen mit deinem Split nach Leerzeichen. Das kann genausgut ein Satzzeichen sein.

Falls deine gesamte Datei in den Speicher passt vielleicht sowas, das sollte schneller gehen.

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
my @suffixe = qw(en er);
my $suff_str = '(?:'.join('|', @suffixe).')';
my $txt = join('', <DATA>);

while ($txt =~ m/(\w+($suff_str))\b/g) {
        print "$1 $2\n";
}


__DATA__
Hallo Zusammen,

ich habe 2 relativ langen TXT-Dateien. Eine Text-Datei
ist ein ganz normaler deutscher Artikel (ca. 40000 Zeilen).
Die andere Datei ist eine Liste von Suffixe (Nomen, ADJ, etc.).
Was ich haben möchte, ist der Inputdatei einzulesen und
mit der Liste zu vergleichen. Mein Code sieht wie folgt aus:


edit: Die Datei als utf8 abspeichern und "use utf8;" oben einfügen, sonst gibt's wahrscheinlich Probleme mit Umlauten.

edit2: Falls das 1:1 das Echtskript ist kann auch die Ausgabe (Konsole) der limitierende Faktor sein.
Last edited: 2013-12-17 11:33:38 +0100 (CET)
1 + 1 = 10

View full thread Durchlaufzeit von 2 verschachtelten foreach-schleifen optimieren