Thread Zeichen in RegEx darf nicht zwischen <> stehen (26 answers)
Opened by Matze at 2006-04-18 11:40

Dubu
 2006-04-19 01:57
#65024 #65024
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
[quote=sid burn,18.04.2006, 20:23]
Quote
Das eben ist das Problem deines Codes. Eigentlich sollte die Information reichen, dass es eine (valide) HTML-Datei ist, evtl. noch die HTML-/XHTML-Version, denn dann ist die Syntax definiert.

Naja, diese Informationen kann ich aber nirgendswo finden. Auser die Angabe das es eine "textdatei" ist. Was doch etwas oberflächlich ist.
[/quote]
Stimmt, du hast recht. Das macht es natürlich schwieriger.

Quote
Und Html::parser nachprogrammieren möchte ich nicht. Die Angabe ist aber letztendlich das es eine textdatei ist die schon HTML Tags enthält. Es kann also genauso ein Java, C++ eine Latex File oder sonst irgendetwas sein.

Damit ist auch nicht klar, ob HTML::Parser überhaupt anwendbar ist.

Quote
Das ist ein Quick&Dirty Hack für die Aufgabe, vielleicht reicht diese Möglichkeit aus, vielleicht auch nicht. Was von beiden zutrifft muss der Thread ersteller selber wissen.

Da hast du recht. Sollte es sich tatsächlich um HTML handeln, dann ist HTML::Parser die beste Lösung, ansonsten muss das Problem genauer spezifiziert werden.

Quote
Ich muss aber auch sagen das ich HTML::Parser nicht kenne, und deren Möglichkeit nicht kenne, Textdateien auser HTML Dateien zu bearbeiten. Und ich weiß nicht was bei dem Modul als HTML gesehen wird. JavaScrpt oder embedded PHP gehört Meiner Meinung nach nicht zu HTML.

Nein, HTML::Parser erwartet schon validen HTML- oder XHTML-Code.


Quote
Ich meinte Nicht Anführungszeichen als Normalen Text, sondern wenn man ein Anführungsezeichen innerhalb eines String Schreiben möchte.

Als Wert eines Attributes? Da kann man &quot; benutzen. Oder doppelte in einfachen Anführungszeichen.

Quote
z.b. den String: "Hallo, Welt", und wie inenrhlab eines Strings Anführungszeichen escaped werden. Sonst wäre das nächste Anführungszeichen ja sofort der nächste Begrenzer.

<img src="/img/next.gif" alt=""Hallo, Welt"">

<img src="/img/next.gif alt="&quot;Hallo, Welt&quot;">
oder
<img src="/img/next.gif alt='"Hallo, Welt"'>

View full thread Zeichen in RegEx darf nicht zwischen <> stehen