Thread Zeichen in RegEx darf nicht zwischen <> stehen (26 answers)
Opened by Matze at 2006-04-18 11:40

Dubu
 2006-04-18 19:55
#65021 #65021
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
[quote=sid burn,18.04.2006, 17:37]Ob nun Java Script, PHP oder auch Perl Code in der Datei vorkommt weiß ich ja nicht, wenn dies der Fall ist muss man es defintiv anpassen.
[/quote]
Das eben ist das Problem deines Codes. Eigentlich sollte die Information reichen, dass es eine (valide) HTML-Datei ist, evtl. noch die HTML-/XHTML-Version, denn dann ist die Syntax definiert.

Quote
Ansonsten das andere probleme mit dem Größer Gleich Zeichen innerhalb von Anführungszeichen, dass ist sicherlich etwas was zu einem Problem führen könnte. Ich habe die regex nun angepasst das wenn innerhalb von Spitzen klammern Anführungszeichen vorkommen, dass alles was zwischen den Anführungszeichen vorkommt, ignoriert wird.

Was ist mit einfachen Anführungszeichen? Was ist mit HTML-Kommentaren? "<!-- Nur für x > y -->"
Du siehst, wir können hier Hase und Igel spielen: Ich beschreibe eine evtl. sehr abstruse, aber gültige Syntaxvariante, du verbesserst deinen Code, ich denke mir die nächste Konstruktion aus ... Am Ende landen wir dabei, dass du HTML::Parser nachimplementierst.

Quote
Allerdings weiß ich gerade gar nicht wie man innerhalb von HTML ein Anführungszeichen schreibt? Wird das einfach mit einem Backslash escaped?

Nö, wozu? Anführungszeichen sind AFAIK erlaubte Textzeichen. Ansonsten kann man auch &quot; schreiben (für die doppelten), z.B. in Attributen.

Quote
Wenn ja muss ich das auch noch einbauen.

Ob nun JavaScript, PHP oder sonstiges in der Datei vorkommt, muss der Thread ersteller Wissen, oder sagen.

Wie gesagt, eigentlich sollte die Information reichen, dass es HTML (3.2/4.x/wasweißich) ist.

View full thread Zeichen in RegEx darf nicht zwischen <> stehen