Levenshtein-Distanz: Unterschied zwischen den Versionen
aus GlossarWiki, der Glossar-Datenbank der Fachhochschule Augsburg
Kowa (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Kowa (Diskussion | Beiträge) |
||
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt) | |||
Zeile 12: | Zeile 12: | ||
Michael, Jörg - Doppelgänger gesucht Ein Programm für die kontextsensitive phonetische | Michael, Jörg - Doppelgänger gesucht Ein Programm für die kontextsensitive phonetische | ||
Textumwandlung, erschienen in C’T vom 25/99 S. 252 | Textumwandlung, erschienen in C’T vom 25/99 S. 252 | ||
{{{{SITENAME}}-konformer Artikel}} | {{{{SITENAME}}-konformer Artikel}} | ||
{{Quellenangaben verbessern | {{Quellenangaben verbessern | ||
| Formatierung = true | | Formatierung = true | ||
}} | }} | ||
[[Kategorie:Content-Management]] |
Aktuelle Version vom 31. Dezember 2006, 17:39 Uhr
Definition
Die Levenshtein-Distanz dient der Berechnung von Wortähnlichkeiten, welche beispielsweise bei der unschaften Fuzzy-Suche verwendet wird. Die Berechnung erfolgt durch Zählen der Schritte, die nötig sind, um eine Zeichenkette durch Einfügen, Löschen und Ersetzen von Zeichen in eine andere Zeichenkette zu überführen.
Beispiel
Um von dem Begriff „Auto“ zu dem Begriff „aus“ zu kommen sind zwei Schritte nötig:
0. Auto
1. Auso (Ersetzen von „t“ durch „s“)
2. Aus (Löschen von „o“ )
Die Levenshtein-Distanz betägt zwei, da zwei Umwandlungsschritte benötigt werden.
Literatur
Michael, Jörg - Doppelgänger gesucht Ein Programm für die kontextsensitive phonetische Textumwandlung, erschienen in C’T vom 25/99 S. 252
Dieser Artikel ist GlossarWiki-konform.
In diesem Artikel sollten die Quellenangaben überarbeitet werden.
Bitte die Regeln der GlossarWiki-Quellenformatierung beachten.
Bitte die Regeln der GlossarWiki-Quellenformatierung beachten.