[Java] [S] HTML Sonderzeichen Decoder

Dieses Thema im Forum "Programmierung & Entwicklung" wurde erstellt von Super Mario, 17. Juli 2010 .

  1. 17. Juli 2010
    HTML Sonderzeichen Decoder

    Wie der Titel schon sagt suche ich einen Decoder der Unicode und HTML-Abkürzungen zurück in die richtigen Zeichen umwandelt.
    Ich will damit von einer Internetseite NFOs auslesen und diese dann woanders Eintragen mit einem kleinem Java Programm.

    Beispiel:

    HTML:
    & #9608; => ?
    ö => ö
     
  2. 17. Juli 2010
    AW: HTML Sonderzeichen Decoder

    hi,

    dass geht ganz einfach mit String.replaceAll(RegEx,Char/String);

    Musst dann nur noch den entsprechenden Regulären Ausdruck für die Zeichen zusammen basteln, die ersetzt werden sollen.
     
  3. 19. Juli 2010
    AW: HTML Sonderzeichen Decoder

    also, html-symbole findest du in den dtd'd:
    http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent
    http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent
    http://www.w3.org/TR/xhtml1/DTD/xhtml-special.ent

    darin findest du die jeweiligen unicode-entities (also &#1234), welche du mit deinem javaprogramm eigl. übersetzen können solltest.

    mit String.replaceAll jedoch nicht, da musst du nen regulären ausdruck verwenden.
     
  4. 19. Juli 2010
    AW: HTML Sonderzeichen Decoder

    Schau die diese Klasse mal an, hab die mal verwendet und hat einwandfrei funktioniert

    HTMLEntities | Free Development software downloads at SourceForge.net
     
  5. 20. Juli 2010
    AW: HTML Sonderzeichen Decoder

    Natürlich geht das damit, wenn man alle kennt kann man sich einfach nen Array basteln.
    einfacher gehts natürlich wenn man die Klasse verwendet, die frankred geposted hat.
    Aber die machen nichts andres
    zumindest für special characters wie < > usw.
    für die allgemeinen Zeichen machen sies etwas anders, gehen würds aber auch mit replaceAll
     
  6. 20. Juli 2010
    AW: HTML Sonderzeichen Decoder

    klar gehts mit nem array und replaceAll, aber ich denke du weißt wie viele unicode-zeichen es gibt? *hust*
     
  7. Video Script

    Videos zum Themenbereich

    * gefundene Videos auf YouTube, anhand der Überschrift.