ILMSImage Classification
Contents |
50px| ILMSImage Classification
Introduction
ILMSImage Classification is part of the ILMSImage plug-in for QuantumGIS and in this context it carries out a two-step thematic analysis, comprising unsupervised and supervised classification. u
Like various ILMSImage panels it consists of two components, the ILMSImage Project Information in the upper section and the actual tools in the lower section.
Das ILMSImage-Panel zur thematischen Klassifikation
Thematische Klassifikation
Hintergrund
Der Prozess der thematischen Klassifikation innerhalb von ILMSImage ist aus drei Teilarbeitsschritten zusammengesetzt, einer (1) unüberwachten Klassifikation der bestehenden Zellen und ihrer Eigenschaften in Zelltypenklassen, (2) der Definition von Referenz- bzw. Trainingsgebieten anhand eines Vektordatenlayers und (3) der eigentlichen thematischen Klassifikation, die auf den Ergebnissen der beiden vorangegangenen Arbeitsschritten aufbaut. In der Folge wird jeder Schritt ausführlich vorgestellt und beschrieben.
Unüberwachte Klassifikation in Zelltypenklassen
Die unüberwachte Klassifikation zieht die während der Zellbildung erzeugten Geometrien und die für diese Geometrien berechneten Attribute heran, um aus beiden Komponenten Zelltypenklassen abzuleiten. Bei diesen handelt es sich um Gruppen von Zellen, die - unabhängig von ihrer geographischen Lage im Bild bzw. ihrer Lage zueinander - ähnliche Eigenschaften besitzen. Einfach formuliert werden in diesem Arbeitsschritt also beispielsweise langgestreckte und dunkle Zellen von solchen getrennt, die eher rund und hell sind - nur dass sich die entsprechende Entscheidung in der Realität nicht auf die genannten Eigenschaften beschränkt, sondern auf allen im Zuge der Attributberechnung erzeugten Merkmale basiert. Das Grundkonzept dieses Arbeitsschritts ist entspricht somit der partitionierenden Clusteranalyse (Partitional clustering).
ILMSImage implementiert zwei Methoden der Clusteranalyse:
- Einen k-Means-Algorithmus, der eine häufig verwendetete Methode zum Auffinden von Strukturen in großen Datenmengen darstellt. Dabei wird die Anzahl der zu findenden Cluster vorher festgelegt. Nach einer zufälligen Initialisierung wird jede Zelle dem Cluster zugeordnet, dessen zentraler Merkmalsvektor dem der Zelle am nächsten kommt. Ist diese erste Zuordnung abgeschlossen, werden die Clusterzentren neu berechnet und erneut jede Zelle mit den bestehenden Clustern verglichen. Diese Schritte werden wiederholt, bis sich keine der Zuordnungen mehr ändern - dann ist die Clusteranalyse abgeschlossen.
- Eine weitere Methode zur partitionierenden Clusterung stellt der Algorithmus der Self-organizing maps dar, der ursprünglich von Teuvu Kohonen entwickelt wurde. Dabei handelt es sich um ein künstliches neuronales Netz, das in der Lage ist, einen als Datenquelle fungierenden multidimensionalen Merkmalsraum auf einen zweidimensionalen Wertebereich zu projizieren. Aus dieser Eigenschaft erklärt sich der Bezug zur Karte bzw. Map. Die detaillierte Funktionsweise dieses Algorithmus ist anderer Stelle gut dokumentiert.
Die von ILMSImage erzeugten Zellen und ihre abgeleiteten Eigenschaften stellen ebenfalls einen mehrdimensionalen Merkmalsraum dar. Soll dieser nun unüberwacht klassifiziert, d.h. geclustert werden, so muss diese Option im entsprechenden Teil des ILMSImage-Klassifikationspanels aktiviert werden. Über Type lässt sich eine der beiden oben genannten Methoden auswählen, der Parameter Tolerance (Wertebereich zwischen 0,01 und 0,50) steuert die Sensitivität des Prozesses. Ein höherer Wert entspricht dabei einer einer höheren erlaubten Merkmalsvariabilität innerhalb der zu erzeugenden Cluster - ihre Anzahl nimmt dann also ab. Ein geringer Wert für die Toleranz erzeugt eine höhere Zahl von Klassen, da die erlaubte Variabilität der Merkmale innerhalb dieser dann geringer ist.
Die andauernde Prozessierung wird durch ein entsprechendes Fenster angezeigt. Je nach Anzahl der ausgewählten Attribute und der eingestellten Sensitivität kann die Berechnungsdauer stark variieren. Nach erfolgreichem Abschluss des Prozesses wird der Benutzer über die Anzahl der erzeugten Zelltypenklassen informiert:
Benachrichtigungsfenster nach Abschluss der unüberwachten Klassifikation
Bleibt die Auswahlbox Unsupervised classification aktiviert, kann mit einem Klick auf Visualize results das Ergebnis der unüberwachten Klassifikation in die aktuelle Kartenansicht geladen werden. Die zur Darstellung verwendeten Farben sind Zufallsfarben, das heißt sie besitzen keinerlei semantische Aussagekraft über die thematische Klasse einer Zelle. Sie verdeutlichen lediglich ihre gemeinsame Zugehörigkeit zu einer Zelltypenklasse. In der Legende erscheint der Rasterdatenlayer in der Gruppe ILMSImage Exports unter der Bezeichnung <projektname>_sample
.
800px|Im aktuellen QuantumGIS-Projekt visualisiertes Ergebnis der unüberwachten Klassifkation
Es ist zu beachten, dass immer nur ein Ergebnis dieses Arbeitsschritts existiert, das für die weitere thematischen Klassifikation verwendet wird. Wurde ein solches Ergebnis nach seiner Erzeugung nicht wie oben beschrieben visualisiert, so entspricht der in der Kartenansicht angezeigte Rasterlayer mit hoher Wahrscheinlichkeit nicht dieser Datengrundlage.
Definition von Referenzgebieten
Referenz- oder Trainingsgebiete erlauben es dem Benutzer, das für sein Arbeitsziel zweckmäßige Klassifikationsschema zu definieren und an ILMSImage zu übermitteln. Die abgegrenzten Gebiete und deren Attribute werden dabei aus einem Vektordatenlayer, speziell einer Shapedatei, übernommen. Die Attributtabelle dieser Datei muss - um einen korrekten Import zu gewährleisten - einem bestimmten Format entsprechen, das in der Folge beschrieben ist.
Feldname | Felddatentyp | Beschreibung |
---|---|---|
thema |
Ganzzahl / Integer | Nummer zur eindeutigen Identifizierung der verschiedenen Referenzklassen. Dabei ist es wichtig, dass die Zählung mit eins beginnt und fortlaufend ist. |
desc |
Text / String | Verbale Beschreibung der Referenzklasse. Im Grunde handelt es sich bei diesem Feld um eine optionale Angabe, es kann jedoch als gute Praxis angesehen werden, den sonst nur mit Nummer bestimmten Referenzklassen auch einen Namen zu geben. |
Die Shapedatei kann weitere Felder besitzen - um sie zu einem gültigen Referenzdatensatz zu machen genügt es, dass die beiden oben genannten Felder in der Attributtabelle zu finden sind. Auf diese Art und Weise kann grundsätzlich jede Flächenshapedatei - mit den entsprechenden Anpassungen - als Referenz für ILMSImage verwendet werden.
Um dem Nutzer die Erstellung eines neuen Referenzdatensatzes zu erleichtern, stellt das QuantumGIS-Plugin optional eine passende Shapedatei mit der richtigen Struktur bereit, die im weiteren Verlauf mit den Gebietsgrenzen und deren Attributierung vervollständigt werden kann. Um diese Funktion zu nutzen genügt - nach erstmaliger Aktivierung des gesamten Abschnitts Reference data import mittels der entsprechenden Auswahlbox - ein Klick auf Create reference layer template. Der folgende Dialog erfragt den Namen der zu erstellenden Datei, standardmäßig ist die Kombination <projektname>_ref
voreingestellt und bittet den Nutzer die voraussichtliche Anzahl der thematischen Klassen festzulegen. Diese Angabe ist nicht endgültig, es können im Nachhinein noch Klassen hinzugefügt oder weggelassen werden - sie sorgt allein dafür, dass für die Definition der Referenzgebiete bereits die festgelegte Anzahl von Klassen (mit unterschiedlich farblicher Darstellung) bereitgestellt wird.
Auswahldialog zur Erzeugung eines neuen Referenzdatensatzes mit voraussichtlicher Klassenanzahl
Für den Fall, dass der zu erzeugenden Referenzdatensatz bereits existiert, wird der der Nutzer darüber informiert und um eine entsprechende Entscheidung gebeten:
Benachrichtigung im Falle, dass der zu erzeugende Referenzdatensatz bereits existiert
Wurde der Layer erzeugt, erscheint er in der Ebenenübersicht des aktuellen QuantumGIS-Projekts. Dort kann er auch mittels eines Rechtsklicks und der Auswahl von Bearbeitungsmodus umschalten in einen editierfähigen Zustand versetzt werden. Das ist notwendig, um in der Folge die Geometrien der Trainingsgebiete und ihre Attributierung in den Referenzdatensatz einzutragen.
Umschalten in den Bearbeitungsmodus
Nun lassen sich mittels des Werkzeugs Polygon digitaliseren neue Referenzgebiete erzeugen. Dies geschieht i.d.R. am besten im Rückgriff auf die originalen Bilddaten, je nach Arbeitsziel und Klassifikationsschema können jedoch auch andere Visualisierungen gute Anhaltspunkte für die Trainingsgebietsabgrenzung liefern. In der folgenden Darstellung ist an einem Detail die Erzeugung eines Referenzgebiets für die Klasse Settlement/Siedlung illustriert.
- Zunächst werden die Stützpunkte des Polygons durch Linksklicks an den entsprechenden Koordinaten erzeugt. Es ist dabei nicht unbedingt notwendig, sehr genau vorzugehen, ILMSImage ist in der Lage, eventuelle Randbereiche durch statistische Kriterien von den Kernarealen eines Referenzgebiets zu trennen. Statt Genauigkeit ist eine Vergrößerung der Stichprobe - durch Erstellung vieler Referenzgebiete für eine thematische Klasse - oft sinnvoller.
400px|Digitalisieren eines Referenzpolygons - Sind alle Stützpunkte gesetzt, wird durch einen Rechtsklick die Digitalisierung des Polygons abgeschlossen. In der folgenden Eingabemaske erfolgt die Angabe der Klassen-ID sowie der entsprechenden Beschreibung. Es sei daran erinnert, dass die Nummerierung der Klassen bei eins beginnen und fortlaufend sein muss.
400px|Maske zur Eingabe der Attribute - Nach Bestätigung der Eingabemaske wird das Polygon in der für diese ID zufällig erzeugten Farbe angezeigt.
400px|Vollständiges Referenzgebiet in Zufallsfarbendarstellung - Es ist hilfreich, die Farbe der Darstellung dem dargestellten Sachverhalt so anzupassen, dass entweder Autoplausibilität entsteht (Wald = grün, Wasser = blau) oder auf gängige Anwendung bestimmter Farben (Siedlung = rötlich, Landwirtschaft = erdfarben) zurückgegriffen wird. Durch Verwendung der oben beschriebenen Vorlage muss dazu nicht mehr die ganze Darstellung des Layers, sondern nur noch die Farbe der einzelnen thematischen Klasse angepasst werden. Das dazu benötigte Fenster ist durch einen Linksklick auf die zu ändernde Farbe erreichbar. Dort kann auch die Beschriftung (von reference class 1 auf Settlement) aktualisiert werden.
400px|Fenster zur Änderung von Darstellungsfarbe und Beschreibung - Das Ergebnis ist ein erstes Referenzgebiet einer bestimmten thematischen Klasse, im illustrierten Fall für die Klasse Siedlung.
400px|Vollständiges Referenzgebiet in dem Sachverhalt angepasster Darstellung
Das beschriebene Vorgehen wird wiederholt, bis ausreichend Referenzgebiete definiert wurden. Das wiederholten Umschalten und die Bestätigung des folgenden Dialogfensters sichern den Referenzdatensatz. Werden auch die Farben und die Beschriftungen der Klassen angepasst, ergibt sich dann für das Beispiel der Rot u.U. folgendes Bild:
800px|Vollständig definierter Referenzdatenlayer überlagert über der Grenze des Untersuchungsgebiets
Import von Referenzgebieten
Um im Zuge der thematischen Klassifikation verwendet werden zu können, muss der definierte Referenzdatensatz in das ILMSImage-Projekt importiert werden. Er muss dazu zunächst einmal im aktuellen QuantumGIS-Projekt geladen sein - egal auf welchem Wege er erstellt wurde. In der Auswahlliste Reference data layer sind alle geladenen Vektorebenen aufgelistet, welche die oben beschriebene Struktur besitzen und damit von ILMSImage als importierbar betrachtet werden. Nach dem der gewünschte Layer selektiert wurde, startet ein Klick auf Conduct classification den eigentlichen Referenzdatenimport. Dabei wird der Vektordatensatz ins Rasterformat umgewandelt und der Attributliste der Zellen hinzugefügt. Das sollte i.d.R. sehr schnell passieren. Das fertige Ergebnis lässt sich durch einen Klick auf Visualize results in der aktuellen Kartenansicht darstellen. Für den oben beispielhaft gezeigten Referenzdatensatz könnte das Ergebnis - abhängig von den zu Grunde liegenden Zellgeometrien - so aussehen:
800px|Importierter und visualisierter Referenzdatensatz
Die für die Visualisierung verwendeten Farben übernimmt der Prozess direkt aus der Darstellung des entsprechenden Vektordatenlayers. Um die Themenklassen auseinander halten zu können, ist es daher empfehlenswert, schon bei der Definition unterschiedliche Farben für sie zu verwenden. Wenn diese dabei autoplausibel bzw. entsprechend gängiger Assoziationen folgend (siehe oben) eingesetzt werden, ist die rasche Erkennbarkeit des Referenzdatensatzes im Rasterformat - und später des eigentlichen Klassifikationsergebnisses - gewährleistet.
Endgültige Klassifikation
Die Auswahlbox Supervised classification aktiviert den letzten Arbeitsschritt im Rahmen des ILMSImage-Panels für die thematische Klassifikation. Dazu werden die Ergebnisse der Clusteranalyse und des Referenzdatenimports miteinander verknüpft.
Das endgültige Klassifikationsergebnis liegt im Rasterformat als GeoTIFF-Datei vor, um größtmögliche Kompatibilität zu gewährleisten.
800px|Endgültige thematische Klassifikation des Untersuchungsgebiets