ILMSImage Classification
Inhaltsverzeichnis |
ILMSImage Classification
Einleitung
ILMSImage Classification ist ein Teil des ILMSImage-Plugins für QuantumGIS und führt in diesem Rahmen die zweistufige thematische Auswertung, bestehend aus unüberwachter und überwachter Klassifikation durch.
Wie eine Reihe anderer ILMSImage-Panels besteht auch dieses aus zwei Bestandteilen, der ILMSImage Project Information oben und dem eigentlichen Werkzeugbereich im unteren Teil.
Thematische Klassifikation
Hintergrund
Der Prozess der thematischen Klassifikation innerhalb von ILMSImage ist aus drei Teilarbeitsschritten zusammengesetzt, einer (1) unüberwachten Klassifikation der bestehenden Zellen und ihrer Eigenschaften in Zelltypenklassen, (2) der Definition von Referenz- bzw. Trainingsgebieten anhand eines Vektordatenlayers und (3) der eigentlichen thematischen Klassifikation, die auf den Ergebnissen der beiden vorangegangenen Arbeitsschritten aufbaut. In der Folge wird jeder Schritt ausführlich vorgestellt und beschrieben.
Unüberwachte Klassifikation in Zelltypenklassen
Die unüberwachte Klassifikation zieht die während der Zellbildung erzeugten Geometrien und die für diese Geometrien berechneten Attribute heran, um aus beiden Komponenten Zelltypenklassen abzuleiten. Bei diesen handelt es sich um Gruppen von Zellen, die - unabhängig von ihrer geographischen Lage im Bild bzw. ihrer Lage zueinander - ähnliche Eigenschaften besitzen. Einfach formuliert werden in diesem Arbeitsschritt also beispielsweise langgestreckte und dunkle Zellen von solchen getrennt, die eher rund und hell sind - nur dass sich die entsprechende Entscheidung in der Realität nicht auf die genannten Eigenschaften beschränkt, sondern auf allen im Zuge der Attributberechnung erzeugten Merkmale basiert. Das Grundkonzept dieses Arbeitsschritts ist entspricht somit der partitionierenden Clusteranalyse (Partitional clustering).
ILMSImage implementiert zwei Methoden der Clusteranalyse:
- Einen k-Means-Algorithmus, der eine häufig verwendetete Methode zum Auffinden von Strukturen in großen Datenmengen darstellt. Dabei wird die Anzahl der zu findenden Cluster vorher festgelegt. Nach einer zufälligen Initialisierung wird jede Zelle dem Cluster zugeordnet, dessen zentraler Merkmalsvektor dem der Zelle am nächsten kommt. Ist diese erste Zuordnung abgeschlossen, werden die Clusterzentren neu berechnet und erneut jede Zelle mit den bestehenden Clustern verglichen. Diese Schritte werden wiederholt, bis sich keine der Zuordnungen mehr ändern - dann ist die Clusteranalyse abgeschlossen.
- Eine weitere Methode zur partitionierenden Clusterung stellt der Algorithmus der Self-organizing maps dar, der ursprünglich von Teuvu Kohonen entwickelt wurde. Dabei handelt es sich um ein künstliches neuronales Netz, das in der Lage ist, einen als Datenquelle fungierenden multidimensionalen Merkmalsraum auf einen zweidimensionalen Wertebereich zu projizieren. Aus dieser Eigenschaft erklärt sich der Bezug zur Karte bzw. Map. Die detaillierte Funktionsweise dieses Algorithmus ist anderer Stelle gut dokumentiert.
Die von ILMSImage erzeugten Zellen und ihre abgeleiteten Eigenschaften stellen ebenfalls einen mehrdimensionalen Merkmalsraum dar. Soll dieser nun unüberwacht klassifiziert, d.h. geclustert werden, so muss diese Option im entsprechenden Teil des ILMSImage-Klassifikationspanels aktiviert werden. Über Type lässt sich eine der beiden oben genannten Methoden auswählen, der Parameter Tolerance (Wertebereich zwischen 0,01 und 0,50) steuert die Sensitivität des Prozesses. Ein höherer Wert entspricht dabei einer einer höheren erlaubten Merkmalsvariabilität innerhalb der zu erzeugenden Cluster - ihre Anzahl nimmt dann also ab. Ein geringer Wert für die Toleranz erzeugt eine höhere Zahl von Klassen, da die erlaubte Variabilität der Merkmale innerhalb dieser dann geringer ist.
Die andauernde Prozessierung wird durch ein entsprechendes Fenster angezeigt. Je nach Anzahl der ausgewählten Attribute und der eingestellten Sensitivität kann die Berechnungsdauer stark variieren. Nach erfolgreichem Abschluss des Prozesses wird der Benutzer über die Anzahl der erzeugten Zelltypenklassen informiert:
Bleibt die Auswahlbox Unsupervised classification aktiviert, kann mit einem Klick auf Visualize results das Ergebnis der unüberwachten Klassifikation in die aktuelle Kartenansicht geladen werden. Die zur Darstellung verwendeten Farben sind Zufallsfarben, das heißt sie besitzen keinerlei semantische Aussagekraft über die thematische Klasse einer Zelle. Sie verdeutlichen lediglich ihre gemeinsame Zugehörigkeit zu einer Zelltypenklasse. In der Legende erscheint der Rasterdatenlayer in der Gruppe ILMSImage Exports unter der Bezeichnung <projektname>_sample
.
Es ist zu beachten, dass immer nur ein Ergebnis dieses Arbeitsschritts existiert, das für die weitere thematischen Klassifikation verwendet wird. Wurde ein solches Ergebnis nach seiner Erzeugung nicht wie oben beschrieben visualisiert, so entspricht der in der Kartenansicht angezeigte Rasterlayer mit hoher Wahrscheinlichkeit nicht dieser Datengrundlage.
Definition von Referenzgebieten
Referenz- oder Trainingsgebiete erlauben es dem Benutzer, das für sein Arbeitsziel zweckmäßige Klassifikationsschema zu definieren und an ILMSImage zu übermitteln. Die abgegrenzten Gebiete und deren Attribute werden dabei aus einem Vektordatenlayer, speziell einer Shapedatei übernommen. Die Attributtabelle dieser Datei muss - um einen korrekten Import zu gewährleisten - einem bestimmten Format entsprechen, das in der Folge beschrieben ist.
Attributtyp | Attribut | GUI-Label | Interne Bezeichnung | Beschreibung |
---|---|---|---|---|
Basis | Durchschnittswert pro Band | Average value per input band | <layer_id>[_<zähler> ] |
Für jedes Eingangsband wird der Durchschnittswert aller innerhalb einer Zelle zusammengefassten Bildpixel berechnet. Die interne Bezeichnung entspricht dem für das entsprechende Band gewählten Bezeichner (in der Beispielanwendung: panchromatisch ), im Falle von mehrkanaligen Eingangsdaten ergänzt um eine Kanalnummer (in der Beispielanwendung: multispektral_1 , multispektral_2 , usw.).
|
Struktur | Lineare Textur | Linear texture | linear |
Die Aktivierung dieses Maßes erzeugt die Textur 1. Grades in einem 3x3-Kernel. Der Algorithmus berechnet die Textur für jede Zelle einzeln und ignoriert alle Bildpixel, die außerhalb der aktuellen Zelle liegen. Wie alle Strukturmaße verwendet auch die lineare Textur den ersten in der Projektinformation dargestellten Kanal als Grundlage für die Berechnung. |