Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
Autor |
Nachricht |
Sebastian Administrator
Anmeldungsdatum: 10.09.2004 Beiträge: 5969 Wohnort: Deutschland
|
Verfasst am: 29.05.2007, 22:34 Titel: Zeichenketten-Ähnlichkeiten herausfinden |
|
|
Hallo,
ich suche im Moment nach einem Ansatz, ähnliche Zeichenketten herauszufinden. Müsste die Routine nur mit einzelnen falschen Buchstaben klarkommen (z.B. Schreibzisch statt Schreibtisch), könnte man ja einfach die prozentuale Übereinstimmung errechnen. Sollen aber auch Druckschrift und Drucschrifft als ähnlich erkannt werden, wird das Ganze schon schwieriger. Wie sollte ich da am besten vorgehen?
Viele Grüße!
Sebastian _________________
Der Markt regelt das! | Opas Leistung muss sich wieder lohnen - für 6 bis 10 Generationen! |
|
Nach oben |
|
|
nemored
Anmeldungsdatum: 22.02.2007 Beiträge: 4597 Wohnort: ~/
|
Verfasst am: 29.05.2007, 22:41 Titel: |
|
|
Ich weiß, dass es z. B. für PHP eine Funktion gibt, die eine solche Übereinstimmung berechnet. Vielleicht gibt es dazu auch eine Dokumentation, wie die vorgehen.
edit: ich habe einfach mal auf gut Glück bei Google "wortübereinstimmung berechnungsroutine" eingegeben. Links kamen keine, dafür aber folgende Meldung:
Zitat: | Meinten Sie: farbübereinstimmung berechnungsregen |
_________________ Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1. |
|
Nach oben |
|
|
Sebastian Administrator
Anmeldungsdatum: 10.09.2004 Beiträge: 5969 Wohnort: Deutschland
|
Verfasst am: 29.05.2007, 22:48 Titel: |
|
|
Ja, die kenn ich auch. Das sind metaphone und soundex, aber ich möcht das schon mit FB/VB machen und die Routine auch noch dahingehend ausbauen, dass sie erkennt, wo die Wörter wie voneinander abweichen (an einer Stelle überflüssige Buchstaben, an einer anderen Stelle zu wenige, wiederum an einer anderen einfach falsche Buchstaben). Vermutlich ist das ziiiieemlich schwierig. _________________
Der Markt regelt das! | Opas Leistung muss sich wieder lohnen - für 6 bis 10 Generationen! |
|
Nach oben |
|
|
nemored
Anmeldungsdatum: 22.02.2007 Beiträge: 4597 Wohnort: ~/
|
Verfasst am: 29.05.2007, 23:11 Titel: |
|
|
Ich habe nochmal gegoogelt mit den Begriffen Wortvergleich Algorithmus. Ganz zufrieden bin ich noch nicht, aber vielleicht ist ja trotzdem was dabei. _________________ Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1. |
|
Nach oben |
|
|
Mao
Anmeldungsdatum: 25.09.2005 Beiträge: 4409 Wohnort: /dev/hda1
|
|
Nach oben |
|
|
Jojo alter Rang
Anmeldungsdatum: 12.02.2005 Beiträge: 9736 Wohnort: Neben der Festplatte
|
Verfasst am: 30.05.2007, 15:56 Titel: |
|
|
nemored hat Folgendes geschrieben: | Meldung:
Zitat: | Meinten Sie: farbübereinstimmung berechnungsregen |
|
der screenshot kommt in meine fun-ecke _________________ » Die Mathematik wurde geschaffen, um Probleme zu lösen, die es nicht gäbe, wenn die Mathematik nicht erschaffen worden wäre.
|
|
Nach oben |
|
|
Sebastian Administrator
Anmeldungsdatum: 10.09.2004 Beiträge: 5969 Wohnort: Deutschland
|
|
Nach oben |
|
|
Mao
Anmeldungsdatum: 25.09.2005 Beiträge: 4409 Wohnort: /dev/hda1
|
Verfasst am: 30.05.2007, 17:14 Titel: |
|
|
Kein Problem.
(Nein, ich würde so ein Post nicht einfach so aufsetzen, es kommt noch was hinzu. )
Was hat eigentlich deine neue Signatur zu bedeuten? _________________ Eine handvoll Glück reicht nie für zwei.
--
|
|
Nach oben |
|
|
Sebastian Administrator
Anmeldungsdatum: 10.09.2004 Beiträge: 5969 Wohnort: Deutschland
|
|
Nach oben |
|
|
Flo aka kleiner_hacker
Anmeldungsdatum: 23.06.2006 Beiträge: 1210
|
Verfasst am: 31.05.2007, 20:08 Titel: |
|
|
also DIESE lösung dürft wahrscheinlich sehr langsam sein:
Code: |
dim as string zuTesten,vergleichsstring,temp
dim as integer i,j
for i=1 to len (zuTesten)
for j=0 to 255
temp=mid(zuTesten,1,i-1)+chr(j)+mid(zuTesten,i+1) 'jedenfalls: an position i noch chr(j) einfügem
ProzentualenUnterschiedErrechnen
next
next
|
aber wenn man for j=0 to 255 durch werte austauscht, die vllt näher am "normalen" buchstabenbereich dran sind ? _________________ MFG
Flo
Satoru Iwata: Wer Spaß am Spielen hat, fragt nicht nach Grafik.
zum korrekten Verstaendnis meiner Beitraege ist die regelmaessige Wartung des Ironiedetektors unerlaesslich. |
|
Nach oben |
|
|
|