Phasen der Handschriftenerkennung

aus GlossarWiki, der Glossar-Datenbank der Fachhochschule Augsburg
Wechseln zu:Navigation, Suche
Dieser Artikel sollte überarbeitet werden.
Die Regeln für GlossarWiki-Artikel sollten beachten werden.
Der Titel des Artikels sollte geändert werden.
In diesem Artikel sollten die Quellenangaben überarbeitet werden.
Bitte die Regeln der GlossarWiki-Quellenformatierung beachten.

Dieser Artikel ist nicht korrekt kategorisiert (siehe Regeln für GlossarWiki-Artikel).

1 Allgemeines

Die Erkennung von menschlichen Handschriften und menschlicher Sprache ist ein relativ junges Gebiet der Informatik und wurde vor allem durch das Aufkommen von Multimedia zunehmend interessanter. Primäres Ziel ist eine perfekte Kommunikation zwischen Mensch und Maschine, wobei vor allem auf eine hohe Genauigkeit und Echtzeitverarbeitung großen Wert gelegt wird.

2 Phasen der Handschriftenerkennung

Das Erkennen von menschlichen Handschriften kann grob in folgende Schritte zerlegt werden:

  • Trennen der Schrift vom Hintergrund
    • Zuerst muss die reine Handschrift vom Hintergrund getrennt werden. Hierbei muss berücksichtigt werden, dass sowohl der Hintergrund (das Papier) Störmerkmale enthält (Kästchen,Linien,Farben), als auch der Mensch durch seine Schreibweise (Unterschiedliche Aufsdrückstärke, Kursives Schreiben) Störeinflüsse erzeugt.
    • Für einen Algorithmus ist diese Trennung sehr schwer, für einen Menschen dagegen einfach. Daher versucht man derartige Probleme mit neuronalen Netzen zu lösen.
  • Ausrichtung / Zeilen
    • Es muss erkannt werden, in welchem Winkel die Schrift geschrieben wurde.
    • Texte werden normalerweise in Zeilen geschrieben, doch verlaufen diese nur mehr oder weniger gerade. Der Text muss also in Zeilen aufgespalten werden.
  • Schriftgröße vereinheitlichen
    • Jeder Buchstabe gleicht nicht dem anderen, manche werden größer, manche kleiner geschrieben. Außerdem werden auch gleiche Buchstaben immer wieder etwas unterschiedlich von der Größe her geschrieben.
    • Diese Buchstaben müssen alle in eine einheitliche Größe transformiert werden, damit sie verglichen und später auch erkannt werden können.
  • Schräglage erkennen und beseitigen
    • Buchstaben werden bei geschriebener Handschrift meist in eine Richtung schräg angeordnet.
    • Diese Schräglage muss erkannt werden und die Buchstabend müssen senkrecht aufgerichtet werden.
  • Trennen von Wörtern, Sonder- und Leerzeichen
    • Ähnlich wie bei der Erkennung von Zeilen muss nun erkannt werden, welche Bereiche ein komplettes Wort darstellen.
    • Leerzeichen müssen als solche richtig erkannt werden.
    • Insbesondere weitere Abstände zwischen einzelnen Buchstaben von Wörtern dürfen nicht als Leerzeichen erkannt werden. Stattdessen sollte das Wort an sich erkannt werden.
  • Auftrennen der Wörter in Buchstaben
    • Wurden Wörter als Einheit erkannt, müssen diese in einzelne Buchstaben zerlegt werden.
    • Diese Buchstaben können dann sowohl untereinander, als auch mit vordefinierten Mustern verglichen werden
  • Einordnen der Buchstaben
    • Sind Buchstaben identifiziert worden, müsse diese nun eindeutig zugeordnet werden. (Handelt es sich um ein a?)
    • Hierzu ist der Lerneffekt sinnvoll, der besonders ausgeprägte Handschriftenelemente durch einen Lernprozess besser erkennt.

3 Weiterführende Links

Ein sehr interessanter Bericht zum Thema Handschriftenerkennung im Bereich der Uni Magdeburg