[Code] Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

Dieses Thema im Forum "Programmierung & Entwicklung" wurde erstellt von Fuselmeister, 24. Februar 2009 .

Status des Themas:
Es sind keine weiteren Antworten möglich.
  1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen
  1. #1 24. Februar 2009
    Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    Hi RR'lers
    ich bin gerade dabei nen Alogrithmus zu schreiben der die ähnlichkeit von Zeichenketten (Strings) überprüft. Ein Kriterium das ich prüfen könnte habe ich schon, aber der Algo soll ziemlich effektiv arbeiten und desshalb wollte ich noch anderen "ersatz" Kriterien mit reinnehmen die auch greifen wenn nur ein Buchstabendreher in den Strings ist.
    Das ganze soll dienen um Rechtschreibfehler oder andere Schreibformen beim Sortieren zu erkennen und zu berücksichtigen.

    Kriterium #1:
    S1: String 1
    S2: String 2

    S1 kommt in S2 vor, dann ->
    Die Längendifferenz (Zeichenanzahl) der Strings wird errechnet. Wenn der Unterschied zu groß ist werden die Strings nicht als gleich/ähnlich gewertet.
    Die max. Abweichung ist eine konstante​

    Bei guten Ansätzen ist ne BW ganz klar ;)
     

  2. Anzeige
  3. #2 24. Februar 2009
    AW: Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    -Die längste Zeichenkette finden, die in beiden Strings enthalten ist (und mit der Gesamtlänge der Strings vergleichen)
    -Wegen Drehern: Übereinstimmungen des Inhalts ohne Beachtung der Zeichenreihenfolge überprüfen
    -Anzahl aller identischen Abschnitte mit einer Mindestlänge von z.B. 1/10 der Zeichenkette
     
  4. #3 24. Februar 2009
    AW: Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    sehr gute ideen ;)
    Ich werds mal umsetzen
     
  5. #4 24. Februar 2009
    AW: Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    Sowas nennt sich Editierdistanz, also die minimale Anzahl an Operationen (Einfügen, Löschen, Ersetzen) um ein Wort in ein anderes zu überführen.

    Levenshtein-Distanz – Wikipedia

    Es gibt da die unterschiedlichsten Algorithmen, kannst dir ja einen raussuchen, je nach Programmieraufwand und Komplexität.
     
  6. #5 25. Februar 2009
    AW: Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    Danke ich denke der Levenshtein Algorithmus ist das richtige für mich. Hab ich inet auch schon nen fertigen Code gefunden^^
     
  7. #6 25. Februar 2009
    AW: Ähnlichkeit zweier Zeichenketten prüfen -> Brauche Ideen für Kriterien

    [X] Erledigt!?

    ~closed~

    Mfg,

    Kolazomai
     

  8. Videos zum Thema
Die Seite wird geladen...
Similar Threads - Code Ähnlichkeit zweier
  1. Antworten:
    6
    Aufrufe:
    7.484
  2. Antworten:
    1
    Aufrufe:
    1.288
  3. Antworten:
    2
    Aufrufe:
    4.863
  4. Antworten:
    0
    Aufrufe:
    802
  5. Antworten:
    2
    Aufrufe:
    754