Firefox, Chrome, bookmarks.html parsen - #185388 (Allgemeines zu Perl)

GwenDragon

2016-09-18 10:36

User since
2005-01-17
14943 Artikel
Admin1

Vorgehensweise für die Lesezeichen:
In den Browsern die Lesezeichen im Netscape-Format als HTML-Datei exportieren.
Dann z.B. mit CPAN:

Netscape::Bookmarks die einzelnen Ordner und einzelnen Lesezeichen mit Titel, Url etc. auslesen.

Regexe für das Parsen von HTML sind nicht so der Hit und fehlerbehaftet.
Siehe diese Artikel https://blog.codinghorror.com/parsing-html-the-cth... und http://blogs.perl.org/users/kirk_kimmel/2012/08/q-...

Zum Parsen von HTML nimmt man eher HTML::Parser und ähnliche. Schau doch mal: https://metacpan.org/search?q=HTML+parser&search_t...

Wie der Zugriff auf eine MySQL-DB mit CPAN:

DBI und

DBD::mysql geht weißt du?

Reicht das Alles als Anregung oder brauchst du auch Code?

Editiert von GwenDragon: Artikel-Links, Hinweis auf DBI
Last edited: 2016-09-18 11:42:48 +0200 (CEST)

die Drachin Gwen

Meine Perl-Artikel · perldev – verschiedene Perl-Versionen unter Windows starten