Thread Firefox, Chrome, bookmarks.html parsen (2 answers)
Opened by Steven at 2016-09-17 19:44

GwenDragon
 2016-09-18 10:36
#185388 #185388
User since
2005-01-17
14533 Artikel
Admin1
[Homepage]
user image
Vorgehensweise für die Lesezeichen:
In den Browsern die Lesezeichen im Netscape-Format als HTML-Datei exportieren.
Dann z.B. mit CPAN:Netscape::Bookmarks die einzelnen Ordner und einzelnen Lesezeichen mit Titel, Url etc. auslesen.

Regexe für das Parsen von HTML sind nicht so der Hit und fehlerbehaftet.
Siehe diese Artikel https://blog.codinghorror.com/parsing-html-the-cth... und http://blogs.perl.org/users/kirk_kimmel/2012/08/q-...

Zum Parsen von HTML nimmt man eher HTML::Parser und ähnliche. Schau doch mal: https://metacpan.org/search?q=HTML+parser&search_t...

Wie der Zugriff auf eine MySQL-DB mit CPAN:DBI und CPAN:DBD::mysql geht weißt du?

Reicht das Alles als Anregung oder brauchst du auch Code?

Editiert von GwenDragon: Artikel-Links, Hinweis auf DBI
Last edited: 2016-09-18 11:42:48 +0200 (CEST)
die Drachin, Gwendolyn


Unterschiedliche Perl-Versionen auf Windows (fast wie perlbrew) • Meine Perl-Artikel

View full thread Firefox, Chrome, bookmarks.html parsen