Font
[thread]1338[/thread]

Wörterliste: Liste mit vielen Wörtern gesucht

Reader: 1


<< |< 1 2 >| >> 14 entries, 2 pages
DS
 2003-09-01 21:31
#17157 #17157
User since
2003-08-04
247 articles
BenutzerIn
[default_avatar]
Bevor ich überhaupt erst anfange, möchte ich mich für den Titel entschuldigen, der zugegeben vielleicht nicht allzu aussagekräftig ist, aber nun zum Thema:

Ich bin auf der Suche nach eine Wörterliste mit deutschen Wörtern, und zwar so viel und so allgemein wie möglich. Unter Goggle findet man zu 99% <ironie>ganz ganz tolle "Hackerseiten"</ironie> (soviele habe ich bisher noch nie in einem Suchergebniss gesehen) und ein paar wenige sehr spezialisierte Wörterlisten, aber sowas kann ich leider nicht brauchen...

Und keine Angst, ich hab' keinen Blödsinn damit vor, mein Ziel ist eher... sagen wir ein persönliches Interesse statistischer Natur...
Ishka
 2003-09-01 22:05
#17158 #17158
User since
2003-08-04
771 articles
HausmeisterIn
[Homepage] [default_avatar]
Was hälst du davon, dir nen Bot zu schreiben, der Webseiten nach Wörtern durchsucht? Lass ihn ein Startwort in Google eingeben, nimm die ersten 100 Treffer, Liste sie auf, nimm ein Wort aus der Liste such weiter usw...

Dabei solltest du natürlich die Webseiten cachen, damit du keine mehrmals aufrufst, zudem solltest du irgendwie verifizieren, ob das deutsche Webseiten sind.
sub z{if(@_){1while$x[$k=rand 10];t($t=$x[$k]=1)}print map"$z[$x[$_]]$_".($_%3?
"":"\n"),1..9}sub t{$j=0;$x[$_+1]==$t&&($j+=2**$_)for 0..8;z,die"Gewinner $z[$t]
"if grep$_==($j&$_),7,56,73,84,146,273,292,448;z,die"Gleichstand\n"if@x>9&&!grep
!$_,@x}@x=4;@z=qw{. [ (};z$^T&1;while(<>){next if$_>9||$x[$_];t$t=$x[$_]=2;z 1}
DS
 2003-09-01 22:22
#17159 #17159
User since
2003-08-04
247 articles
BenutzerIn
[default_avatar]
Nix halte ich davon, weil das 1. viel zu lang dauern würde und 2. der Erfolg äußert fragwürdig wäre... ansonsten eine... nette Idee... ;)

Hat keiner eine oder weiß, wo man sowas herkriegt?
jan10001
 2003-09-01 22:30
#17160 #17160
User since
2003-08-14
962 articles
BenutzerIn
[default_avatar]
Schau mal da nach, bei Wortlisten solltest du mehr als genug finden. War übrigens der erste Google Treffer auf meine Suche. :)
http://wortschatz.uni-leipzig.de/
DS
 2003-09-01 22:33
#17161 #17161
User since
2003-08-04
247 articles
BenutzerIn
[default_avatar]
Danke, da werd' ich mich mal umschaun...

Betreffs Google: Nach was hast du da gesucht?

Nachtrag: Frage geklärt... nach "Wortschatz"... auf die Idee bin ich natürlich vorher nicht gekommen... aber heute ist mein erster Zivi-Tag, das könnte man doch als Ausrede gelten lassen, oder?\n\n

<!--EDIT|DS|1062441345-->
jan10001
 2003-09-01 22:45
#17162 #17162
User since
2003-08-14
962 articles
BenutzerIn
[default_avatar]
Naja eigentlich hatte ich nach "deutsche Wörter" gesucht, allerdings als Wortgruppe.
[E|B]
 2003-09-01 22:48
#17163 #17163
User since
2003-08-08
2561 articles
HausmeisterIn
[Homepage] [default_avatar]
Kleiner Tipp zu Google:
Wenn ihr Hacker Seiten ausschließen möchtet, müsst ihr nach folgendem suchen: "wörterliste -hacker".
Gruß, Erik!

s))91\&\/\^z->sub{}\(\@new\)=>69\&\/\^z->sub{}\(\@new\)=>124\&\/\^z->sub{}\(\@new\)=>);
$_.=qq~66\&\/\^z->sub{}\(\@new\)=>93~;for(@_=split(/\&\/\^z->sub{}\(\@new\)=>/)){print chr;}

It's not a bug, it's a feature! - [CGI-World.de]
Crian
 2003-09-02 14:51
#17164 #17164
User since
2003-08-04
5866 articles
ModeratorIn
[Homepage]
user image
[quote=Ishka,01.09.2003, 20:05]Was hälst du davon, dir nen Bot zu schreiben, der Webseiten nach Wörtern durchsucht? Lass ihn ein Startwort in Google eingeben, nimm die ersten 100 Treffer, Liste sie auf, nimm ein Wort aus der Liste such weiter usw...

Dabei solltest du natürlich die Webseiten cachen, damit du keine mehrmals aufrufst, zudem solltest du irgendwie verifizieren, ob das deutsche Webseiten sind.[/quote]
Also wenn man auf richtig geschriebene Wöter wert legt, sollte man sowas lieber lassen.

Kann man nicht vielleicht die Liste eines Dudens auf CD oder sowas verwenden? (Falls man da irgendwie drankommt / es erlaubt ist.)
s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite
jan10001
 2003-09-02 18:44
#17165 #17165
User since
2003-08-14
962 articles
BenutzerIn
[default_avatar]
Ich denke mal die 10000 am häufigsten verwendeten Wörter, werden wohl reichen. Oder??
snadra
 2003-09-02 18:53
#17166 #17166
User since
2003-08-11
265 articles
BenutzerIn
[Homepage] [default_avatar]
Der Duden wird doch jetzt auch mit CD Rom verkauft, und da es sich dabei um normale Worte handelt, müßte man die runterholen können. Die dazugehörigen Erklärungen aber wahrscheinlich nicht.
Nur wie findet man dann die 1000 häufigsten raus. Denn ich denke der Duden beinhaltet zu viele Wörter für Deinen Geschmack, außderdem müßtest Du erst einmal eine Methode entwickeln, die Dir die Wörter von der CD holt...
http://hamburg.pm.org
jeden 2. mittwoch im monat
--
#!/usr/bin/perl -w
$l=join('',map chr,(116,110,105,114,112))if$^T;
!!$$?@_=qw(Jhfg Aabgure Prey Hnpxre):$l=1;
for(@_){eval reverse($l)."'"._(_(_($_))).' \''}
sub _{$_=~y+a-z+n-za-m+and pop}
<< |< 1 2 >| >> 14 entries, 2 pages



View all threads created 2003-09-01 21:31.