[C/C++] text aus quellcode einer htm seite extrahieren

Dieses Thema im Forum "Programmierung & Entwicklung" wurde erstellt von Caribicjoe, 15. Januar 2012 .

  1. 15. Januar 2012
    text aus quellcode einer htm seite extrahieren

    Hallo Leute,

    Ich würde gerne aus
    http://prg41.ews.uni-ulm.de/strahl.htm
    den Wert der Globalstrahlung auslesen und in meinem Programm als Zahl oder als String verwenden.
    Dazu würde dich den Quellcode der Seite nach der Zahl vor W/m durchsuchen.
    Mir fehlen allerdings die Befehle in C um auf den Quelltext zuzugreifen und ihn nach etwas zu durchsuchen.

    Für Vorschläge und Beispiele wäre ich wirklich sehr dankbar!!!
    Viele Grüße,
    Hans
     
  2. 24. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Erst einmal willkommen bei Raid-Rush,
    du kannst einfach einen Socket aufmachen und dem Server "prg41.ews.uni-ulm.de" ganz einfach den Befehel "GET strahl.htm". Nun bekommst du den Inhalt der Seite als String zurück und du kannst dir deinen Infos ganz einfach mit String Zerlegung zusammen suchen

    greez
     
  3. 24. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Etwas komfortabler gehts mit libcurl. Kommt inkl. Beispielcodes.
     
  4. 25. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Danke für die Antworten!!!
    Ich lass das Programm auf nem 16-Bit Webserver laufen mit nem eigenen Betriebssystem. die Daten kommen auch von so einem Webserver. Funktionieren die genannten Vorschläge da? Ich kenn mich mit Sockets leider überhaupt nicht aus. Wenn es ein bischen detailierter gehen würde, würde mir das sehr helfen
    Grüße
     
  5. 25. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Da du hier wahrscheinlich keine Standard toolchain hast, bin ich mir nicht sicher, ob du libcurl ohne viel Aufwand dafür kompilieren kannst. Ansonsten halt wirklich via Sockets das sollte gehen.
     
  6. 25. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Wenn es sich um einen Webserver handelt, impliziere ich, dass das OS (welches auch immer oO) wohl Sockets unterstützt, weil ja sonst Kommunikation über nen Netzwerk nicht funktionieren würde (und das ist notwendiger Bestandteil eines Webservers^^)

    Details:
    Linux Howtos: C/C++ - Sockets Tutorial

    Wenn man ein wenig Programmieren kann, ist das nicht so schwer. Musste mal für nen Seminar was proggen, mit C und Sockets, hatte mit C nicht so sonderlich viel Erfahrung, geschweige denn mit Sockets in C, aber es ging ziemlich gut von der Hand.

    Und naja, ob der andere Server das unterstützt: Ja. Firefox macht ja quasi nix andres. Nen Socket öffnen, mit dem Server verbinden und ein "GET bla.html" schicken (wie der Vorposter es schon erwähnte). Die Antwort dann in nen Buffer rein und damit machen, was man möchte (also z.b. Anzeigen, oder Teile extrahieren).

    Zum Thema "String"verarbeitung in C bin ich der Falsche.

    Edit:
    Ganz einfach... Made my Day
     
  7. 25. Januar 2012
    AW: text aus quellcode einer htm seite extrahieren

    Danke für die große Beteiligung an meinem Problem!
    Der letzte Beitrag war besonders hilfreich, er war sehr gut an meinen Wissensstand angepasst! Ich werde mir das Tutorial bald anschauen und meinen Erfolg oder Misserfolg mit euch teilen!
    Falls jemand noch mehr super Tipps hat, bin ich natürlich ganz Ohr ;-)
    Viele Grüße
     
  8. Video Script

    Videos zum Themenbereich

    * gefundene Videos auf YouTube, anhand der Überschrift.