Thread Zeichen in RegEx darf nicht zwischen <> stehen (26 answers)
Opened by Matze at 2006-04-18 11:40

sid burn
 2006-04-18 22:23
#65023 #65023
User since
2006-03-29
1520 Artikel
BenutzerIn

user image
Quote
Das eben ist das Problem deines Codes. Eigentlich sollte die Information reichen, dass es eine (valide) HTML-Datei ist, evtl. noch die HTML-/XHTML-Version, denn dann ist die Syntax definiert.

Naja, diese Informationen kann ich aber nirgendswo finden. Auser die Angabe das es eine "textdatei" ist. Was doch etwas oberflächlich ist.

Quote
Was ist mit einfachen Anführungszeichen? Was ist mit HTML-Kommentaren? "<!-- Nur für x > y -->"
Du siehst, wir können hier Hase und Igel spielen: Ich beschreibe eine evtl. sehr abstruse, aber gültige Syntaxvariante, du verbesserst deinen Code, ich denke mir die nächste Konstruktion aus ... Am Ende landen wir dabei, dass du HTML::Parser nachimplementierst.

Ich sagte ja bereits das auch Kommentare Editiert werden, und das man sich zig andere Sachen ausdenken kann womit es letztendlich nicht klappt.

Und Html::parser nachprogrammieren möchte ich nicht. Die Angabe ist aber letztendlich das es eine textdatei ist die schon HTML Tags enthält. Es kann also genauso ein Java, C++ eine Latex File oder sonst irgendetwas sein.

Das ist ein Quick&Dirty Hack für die Aufgabe, vielleicht reicht diese Möglichkeit aus, vielleicht auch nicht. Was von beiden zutrifft muss der Thread ersteller selber wissen.

Ich muss aber auch sagen das ich HTML::Parser nicht kenne, und deren Möglichkeit nicht kenne, Textdateien auser HTML Dateien zu bearbeiten. Und ich weiß nicht was bei dem Modul als HTML gesehen wird. JavaScrpt oder embedded PHP gehört Meiner Meinung nach nicht zu HTML.

Quote
Nö, wozu? Anführungszeichen sind AFAIK erlaubte Textzeichen. Ansonsten kann man auch &quot; schreiben (für die doppelten), z.B. in Attributen

Ich meinte Nicht Anführungszeichen als Normalen Text, sondern wenn man ein Anführungsezeichen innerhalb eines String Schreiben möchte.

z.b. den String: "Hallo, Welt", und wie inenrhlab eines Strings Anführungszeichen escaped werden. Sonst wäre das nächste Anführungszeichen ja sofort der nächste Begrenzer.

<img src="/img/next.gif" alt=""Hallo, Welt"">

Quote
Wie gesagt, eigentlich sollte die Information reichen, dass es HTML (3.2/4.x/wasweißich) ist.

Ja, wenn so etwas angegeben ist, würde es reichen.\n\n

<!--EDIT|sid burn|1145384724-->
Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de

View full thread Zeichen in RegEx darf nicht zwischen <> stehen