Das deutsche QBasic- und FreeBASIC-Forum

E605 · Anmeldungsdatum: 06.02.2011 Beiträge: 1

Hey,

Ich versuche derzeit mit FreeBasic eine HTML-Seite erst herunterzuladen und dann anschließend zu verarbeiten. Das herunterladen klappt dank http://www.freebasic-portal.de/porticula/test-clientbas-739.html ohne Probleme, allerdings harpert es bei der Verarbeitung. Die HTML-Seite ist wie folgt aufgebaut:

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4726 Wohnort: ~/

Zu XML gibt es auf jeden Fall schon gute Parser für FreeBASIC; HTML weiß ich nicht auswendig. Wenn du dir über den Seitenaufbau zu 100% sicher bist, dann kannst du auch mit INSTR arbeiten. Für Seiten, die ich selbst verwalte, nutze ich dafür auch gern Markierungen mittels 
_________________
Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1.

-----

"Das wissen doch sowieso nur Nerdinauten, die Schlaumeierologie studiert haben." - coldmirror

ThePuppetMaster · Verfasst am: 08.02.2011, 20:56 Titel:

nun ... da gibt es mehrere varianten, wie du vorgehen kannst.

wenn du eine seit hast, die immer so aussieht, und deren struktur immer gleich bleibt, dann kannst du das sehr simpel mit instr und instrrev lösen ..

wenn sich die struktur jedoch ändert, dann solltest du einen strukturierten parser basteln, (falls du das überhaupt selbst basteln willst)

dieser könnte dann die tag's und deren inhalt in eine Baumstruktur übersetzen, die du Windows-Explorer like auflistesten kannst.

dort kannst du dann entsprechend deinen rahmenbedinungen die informationen extrahieren.

MfG
TPM
_________________
[ WebFBC ][ OPS ][ ToOFlo ][ Wiemann.TV ]