Thread Text nahe bei anderem Text (13 answers)
Opened by Raubtier at 2014-06-10 17:36

Raubtier
 2014-06-10 20:56
#175963 #175963
User since
2012-05-04
1054 Artikel
BenutzerIn

user image
Na gut, du nimmst jetzt einfach 100 Zeichen links und rechts mit. Ich würde dann noch von beiden Seiten bis \b wegschneiden, damit ich Wortgrenzen bekomme. Ich hatte ursprünglich eher an eine Wortanzahl gedacht (also bis +-8 oder 9 Wörter), das scheint mir naiv besser eine Nähe auszudrücken.

Daher hatte ich überlegt, mit split an Whitespace zunächst Worte zu bilden und dann - tja, und dann? Die Suchphrasen haben 1 bis 3 oder 4 Wörter, selten auch mal mehr. Und effizient sollte es auch sein.

Vielleicht ist der Ansatz, erstmal +-100 Zeichen auszuwählen, ganz gut. Ist ja vor allem einfach zu implementieren und vermutlich ebenso gut :-)

View full thread Text nahe bei anderem Text