Erfassung
Die Erfassung der Daten – in unserem Fall ist das eine WebCam. Das dynamische Bild (Muster) wird hier aufgenommen und im Signal umgewandelt.
Vorverarbeitung
Um Muster besser erkennen zu können und um Datenqualität zu verbessern, findet in der Regel eine
Vorverarbeitung statt. Die Entfernung bzw. Verringerung unerwünschter oder irrelevanter Signalbestandteile führt nicht zu einer Reduktion der zu verarbeitenden Daten, dies geschieht erst bei der Merkmalsgewinnung. Mögliche Verfahren der Vorverarbeitung sind unter Anderem:
die
Signalmittelung - Verfahren, mit dem das Rauschen in sich wiederholenden Signalen vermindert werden kann. Durch additive Überlagerung wird dabei das Nutzsignal verstärkt, während die Überlagerung des zufälligen Rauschens zu keiner Verstärkung führt;Anwendung eines Schwellwertes und Normierung:
Als Schwellenwert (engl. threshold) bezeichnet man in der Signal- und Bildverarbeitung einen Wert, der als Grenze für die Verarbeitung eines Signales verwendet wird – bei Unterschreitung des Schwellenwertes wird der aus dem Eingabewert auf einen Ausgabewert Null und bei Überschreiten auf einen konstanten Ausgabewert (meist 1) abgebildet. Dadurch wird eine Trennung des Signales in Binärwerte erreicht (Binarisierung). Mathematisch lässt sich die Anwendung eines Schwellenwertes als Schwellenwertfunktion von einem Eingangssignal f auf ein Ausgangssignal h mit einem Schwellenwert θ definieren.
Gewünschte Ergebnisse der Vorverarbeitung sind die Verringerung von Rauschen und die Abbildung auf einen einheitlichen Wertebereich.
Merkmalsgewinnung
Nach der Verbesserung des Musters durch Vorverarbeitung lassen sich aus seinem Signal verschiedene Merkmale gewinnen. Dies geschieht in der Regel empirisch nach durch Intuition und Erfahrung gewonnenen Verfahren, da es wenige rein analytische Verfahren (z.B. die Automatische Merkmalsynthese) gibt. Welche Merkmale wesentlich sind, hängt von der jeweiligen Anwendung ab. Merkmale können aus Symbolen beziehungsweise Symbolketten bestehen oder mit statistischen Verfahren aus verschiedenen Skalenniveaus gewonnen werden.
Das Skalenniveau oder Messniveau - ist in der Statistik und Empirie eine wichtige Eigenschaft von
Merkmalen bzw. von Variablen. Je nach der Art eines Merkmals bzw. je nachdem, welche Vorschriften bei seiner Messung eingehalten werden können, lassen sich verschiedene Stufen der Skalierbarkeit unterscheiden [Fig.1]:
Bei den numerischen Verfahren unterscheidet man Verfahren im Originalbereich und Verfahren im Spektralbereich. Mögliche Merkmale sind beispielsweise:
Kennzahlen der Verteilungsfunktion
Momente wie Erwartungswert und
VarianzKorrelation und Faltung
Mittels Transformationen wie der diskreten Fourier-Transformation (DFT) und diskreten Kosinustransformation (DCT) können die ursprünglichen Signalwerte in einen handlicheren Merkmalsraum gebracht werden. Die Grenzen zwischen Verfahren der Merkmalsgewinnung und Merkmalsreduktion sind fließend. Da es wünschenswert ist, möglichst wenige aber dafür umso aussagekräftigere Merkmale zu gewinnen, können Beziehungen wie die Kovarianz und der Korrelationskoeffizient zwischen mehreren Merkmalen berücksichtigt werden. Mit der Karhunen-Loève-Transformation (Hauptachsentransformation) lassen sich Merkmale dekorrelieren.
Merkmalsreduktion
Zur Reduktion der Merkmale auf die für die Klassifikation wesentlichen wird geprüft, welche Merkmale für die Klassentrennung relevant sind und welche weggelassen werden können. Verfahren der Merkmalsreduktion sind die Varianzanalyse, bei der geprüft wird, ob ein oder mehrere Merkmale Trennfähigkeit besitzen, und die Diskriminanzanalyse, bei der durch Kombination von elementaren Merkmalen eine möglichst geringe Zahl trennfähiger nichtelementarer Merkmale gebildet wird.
Klassifikation
Der letzte und wesentlichste Schritt der Mustererkennung ist die Klassifikation der Merkmale in Klassen. Dazu existieren verschiedene Klassifikationsverfahren. Lebewesen benutzen zur Mustererkennung in den Signalen unserer Sinne meist Neuronale Netze. Diese Herangehensweise wird in der Bionik analysiert und imitiert. Die Neuroinformatik hat gezeigt, dass durch künstliche neuronale Netze Lernen und Erkennung komplexer Muster möglich sind, auch ohne dass vorher eine Regelabstraktion in oben gezeigter Art erfolgt. Im Anschluss an die Klassifikation des Musters kann versucht werden, das Muster zu interpretieren. Dies ist Gegenstand der Musteranalyse. In der Bildverarbeitung kann auf die Klassifikation von Bildern eine sogenannte Bilderkennung folgen, also die bloße Erkennung von Objekten in einem Bild ohne Interpretation oder Analyse von Zusammenhängen zwischen diesen Objekten.
Klassifikationsverfahren sind Methoden und Kriterien zur Einteilung von Objekten oder Situationen in Klassen, das heißt zur Klassifizierung.
Ein solches Verfahren wird auch als Klassifikator bezeichnet. Viele Verfahren lassen sich als Algorithmus implementieren; man spricht dabei auch von maschineller oder automatischer Klassifikation. Klassifikationsverfahren sind immer anwendungsbezogen, so dass viele verschiedene Methoden existieren.Klassifikationsverfahren spielen bei der Mustererkennung und in der Künstlichen Intelligenz beziehungsweise dem Informationsbeschaffung eine Rolle. Zur Beurteilung eines Klassifikators können verschiedene Kenngrößen (z.B.: bestimmte nummerische Eigenschaften) ermittelt werden.