Thread Aus Text "&nbsp (ctrl+shift+leer), &quote,.." o.a. entfernen ? (23 answers)
Opened by kezall at 2014-05-02 08:30

kezall
 2014-05-03 07:10
#175175 #175175
User since
2014-03-18
84 Artikel
BenutzerIn

user image
Quote
Wie hast du das gemacht?

Per html2text mit 'utf8'. Kann aber jeder Zeit was anderes (?) nehmen, Diese mords Aufgabe ist noch nicht fertig. Was sich aus meinen Perl-Anfragen sicherlich ergibt. Der Perl-Skript steht und läuft klasse. Jetzt muss ich nur noch 'feilen'.
Hierbei hätte ich gerne eine andere Lösung: mir ist nur die opendir also DIR in Array Lösung bekannt. Ich glaube ohne in Array einzulesen wäre sicherlich besser. Leider ist der einzige kleine Hinweis im Buch mit Fehldrücken behaftet. Meine Mühe reichte nicht aus.

Quote
Kann nicht sein, denn   ist eine gültige HTML-Entität. Da hat dein benutztes Konvertierungsprogramm HTML->Text erheblich gepfuscht.

Mit LibreOffice als HTML Datei. Die Abstände von Deu zu Lat habe ich per Ctrl+Shift+Leer Taste bestimmt, besseres wusste ich nicht. Gepfuscht sicher, deshalb ist die Konvertierung auch so schlecht.

- - -

Quote
Äh, wie was? Du meinst ,das steht als \x000A und \#0160 8also mehrfache Zechen!) im Text?

Natürlich nicht. Nur mir war kein/ist einfacher Abstandhalter bekannt. Schon damals habe ich diese untersucht um sie zu beseitigen. Die unterschiedliche Code kommt von Schreibprogramm, Search&Replase oder Hex-Editor zustande. Im Text selbst steht nur    .. Es war/ist eine einfache, bequeme und schnelle Art es in HTML zu 'Meistern'.

Es scheint(!) dass ich es gelöst habe. In eine (1) Datei - vermutlich unter andere Codierung (Urzeit) verblieb ein E2 80 93 Fragment. Es ist ein LibreOffice Zeichen für mittleres Bindestrich, ist somit ok.
Entsprechend der Lösung, gehe ich mein Problem von Grund auf.
Last edited: 2014-05-03 10:01:26 +0200 (CEST)

View full thread Aus Text "&nbsp (ctrl+shift+leer), &quote,.." o.a. entfernen ?