Ausgangspunkt
und Untersuchungen der Gestaltpsychologie
Die Gestaltgesetze:
1.Das Gesetz der Nähe
2. Das Gesetz der Ähnlichkeit
3. Das Prägnanzgesetz
4.Das Gesetz der guten Fortsetzung
5.Das Gesetz der Geschlossenheit
6. Das Gesetz des gemeinsamen Schicksals
Überblick
über DAVID MARRs Theorie:
1. Die primäre Rohskizze ( raw primal sketch, full primal
sketch)
2. Die 2 1/2 -D-Skizze (2 1/2 - D-sketch)
3. Die 3-D-Skizze (3-D-model representation)
4. Abschließende Bemerkungen
Definition und Probleme der Objekterkennung, Fragestellungen
Unter Objektwahrnehmung versteht man die Wahrnehmung von Gegenständen, wie sie einem im täglichen Leben begegnen und deren richtige Einordnung in die jeweilige Szene bzw. das Umfeld.
Dieser Vorgang erscheint dem Menschen als selbstverständlich und bereitet ihm meistens keinerlei Schwierigkeiten, denke man etwa an die Leichtigkeit, mit der man die sich beim Blick aus dem Fenster darbietende Szene wahrnimmt: Eine Straße mit Autos, Bäumen, passierenden Menschen usw. .
Es wird jedoch deutlich, daß es sich bei der Objektwahrnehmung um einen komplexen und vielschichtigen und nicht immer so einfachen Prozeß handelt, wenn man sich seine Ausgangsbedingungen und die damit verbundenen Probleme für das Wahrnehmungssystem vor Augen führt: Der Mensch erhält die visuelle Information über die Objekte in Form von zweidimensionalen Abbildern auf der Netzhaut und muß sie im Falle der Objekterkennung in dreidimensionale Gegenstände aus der Umwelt umwandeln. Sein Wahrnehmungssystem steht dabei vor folgenden Problemen:
Als Beispiel für ein mehrdeutiges Reizmuster wären die sogenannten Rätselbilder zu nennen, d. h. Bilder, in denen das gleiche Reizmuster zwei voneinander verschiedene, nicht gleichzeitig erfolgende Wahrnehmungen erzeugt. Abbildung 1 zeigt ein solches Rätselbild, in dem man entweder eine Vase oder zwei einander zugewandte Gesichter wahrnimmt, nie aber beides gleichzeitig.
Abbildung 1: Rubins Kippbild als Beispiel für
ein Rätselbild
Sich mit der Identifikation von Objekten zu beschäftigen heißt folglich auch, die visuellen Reizstrukturen und die damit verbundene Wahrnehmung zu untersuchen. Ausgangspunkt hierbei ist, daß sich die visuellen Reizwirkungen stets auf vielfache Weise gliedern lassen und das Wahrnehmungssystem in der Regel immer nur eine realisiert.
Abbildung 2 zeigt ein einfaches Beispiel:
Abbildung 2: Beispiel
für verschiedene Gliederungsmöglichkeiten a - d eines gegebenen
Reizmusters: a - Ausgangsfigur : die meisten Menschen sehen hier zwei aufeinander
liegende Quadrate; weitere Gliederungsmöglichkeiten: b - acht Dreiecke,
c - ein Achteck, d - unregelmäßiges Vieleck
Die Fragen, die sich hier aufdrängen, sind zum einen Fragen nach denjenigen Zusammenhängen, welche die Gliederung der Reizstrukturen bestimmen, die also die Einheiten der Wahrnehmung ausmachen. ( Auf das Eingangsbeispiel bezogen wäre dies die Frage, warum man ausgerechnet Bäume, Autos und Menschen als Einheiten der Wahrnehmung erkennt und die gegebenen Reizstrukturen nicht irgendwie anders gliedert).
Zum anderen ist aber das Phänomen, daß die Erkennbarkeit von Objekten bzw. deren Einheiten von der jeweiligen Erscheinungsform unberührt bleibt, eine weitere Überlegung in diesem Zusammenhang wert. Die Erscheinungsform, in der sich die Objekte der Wahrnehmung präsentieren, sind oftmals sehr vielfältig und variieren je nach Form, Größe, Typ oder aber auch der Betrachtungsperspektive. Hier eignet sich das Problem der Gesichtererkennung als Beispiel: Gesichter zweier verschiedener Personen in der Frontalansicht sind sich oft ähnlicher als das gleiche Gesicht einmal von vorne und einmal von der Seite aus betrachtet, dennoch werden die beiden unähnlicheren Ansichten als zu der gleichen Person gehörend erkannt.
Verschiedene Theorien versuchen, für die eben erwähnten Fragen und Überlegungen Erklärungen zu liefern; es werden aber im folgenden nur diejenigen näher betrachtet, die sich mit der Erkennung dreidimensionaler Gegenstände beschäftigen.
Der gestalttheoretische Erklärungsansatz
Zur Geschichte der Gestaltpsychologie
Die Gestaltpsychologie ist ein Teilgebiet der Psychologie, welches sich mit dem Aufbau der Welt der Wahrnehmung beschäftigt. Als ihr Begründer gilt vor allem Max Wertheimer (1887-1943).
Sie entstand in der 20-er Jahren als Gegenbewegung auf die Elementenpsychologie, eine damals vorherrschende theoretische Richtung, und wandte sich gegen die darin verbreitete Auffassung, daß sich Wahrnehmung aus der Addition einzelner Elementen, den elementaren Empfindungen, aufbaue.
Max Wertheimer widerlegte diese Ansicht durch Experimente zur Scheinbewegung:
Wenn in einer Versuchsanordnung auf der linken Seite eines Feldes ein
Lichtstreifen kurz auftritt, dann eine Dunkelpause für 50 Millisekunden
erfolgt, bevor der Streifen auf der rechten Seite des Feldes wieder auftaucht,
so nimmt unsere Wahrnehmung im gesamten Versuchsaufbau eine Bewegung von
links nach rechts wahr , obwohl während der Dunkelpause keinerlei
physikalische Lichtreize vorhanden waren (= Scheinbewegung).
Die Vorstellung der Elementenpsychologie, daß man die Einzelelemente addiert, um zur Wahrnehmung zu gelangen, scheiterte daran, diese Phänomen zu erklären und veranlaßte die Gestaltpsychologen zur Aufstellung einer ihrer wichtigsten Grundregel, welche besagt, daß DAS GANZE MEHR ALS DIE SUMME SEINER TEILE IST, d.h. daß eine Erscheinung in der Wahrnehmung als Ganzes andere Qualitäten aufweist als seine einzelnen Teilelemente, da die Teilelemente miteinander in Beziehung stehen und dadurch die Wahrnehmung des Ganzen beeinflussen.
Grundsätzliche Erkenntnisse der Gestaltpsychologie
In der Gestaltpsychologie findet sich das Psychische immer als Ganzes vor, ebenso wie Objekte bzw. die Reizkonfigurationen, die diesen zugrunde liegen, als ganzheitliche Gebilde wahrgenommen werden. Diese ganzheitlichen Gebilde setzen sich aus zueinander in Beziehung stehenden Teilen zusammen, wobei die Teile durch ihren inneren Zusammenhalt als auch durch ihre Beziehungen zum Ganzen festgelegt sind. Dies bedeutet im Fall der Objekterkennung, daß der Wahrnehmungsprozeß in der gesamten Reizkonfiguration, die von einem Objekt ausgeht, bestimmte Reizstrukturen nach irgendwelchen Kriterien als enger zusammengehörig als andere organisiert, so daß ein aus Teilen bestehendes, bedeutungshaltiges Objekt wahrgenommen wird.
Die Gestaltpsychologie versucht, diese Gesetzmäßigkeiten zu finden, die die Organisation von Teilen zu einem Ganzen erklären; sie beschäftigt sich also mit der eingangs formulierten Frage nach den Einheiten der Wahrnehmung. Die Ergebnisse dieser Untersuchungen sind in den Gestaltgesetzen manifestiert.
Die Gestaltgesetze sind Regeln der Wahrnehmung, die erklären sollen,
nach welchen Gesetzmäßigkeiten bestimmte Reizelemente innerhalb
einer Reizkonfiguration mit großer Wahrscheinlichkeit als zusammengehörige
Teile innerhalb eines Ganzen wahrgenommen werden.
Das Gesetz der Nähe besagt, daß Elemente (eines Reizmerkmals)
mit geringen Abständen zueinander als zusammengehörig wahrgenommen
werden.
Abbildung 3 illustriert das Gesetz der Nähe.
a
b
Abbildung 3: Gesetz
der Nähe : In a wird eine Anordnung der Punkte (Reize) in vertikalen
Spalten wahrgenommen, da der Abstand der Punkte zueinander vertikal kleiner
ist als horizontal; in b ist es genau umgekehrt.
Das Gesetz der Ähnlichkeit besagt, daß einander ähnlich
sehende Elemente eher als zusammengehörig erlebt werden als einander
unähnlich sehende. Die Ähnlichkeit kann hierbei auf Helligkeit,
Farbe, Orientierung, Größe und/ oder Form bezogen sein.
Abbildung 4 zeigt das Gesetz der Ähnlichkeit anhand eines Beispiels.
Abbildung 4: Beispiel
für das Gesetz der Ähnlichkeit: die Kreise erscheinen aufgrund
ihrer Ähnlichkeit bezüglich der Farbe in Spalten angeordnet.
Abbildung 4 illustriert aber des weiteren noch ein Phänomen der Gestaltgesetze, nämlich daß in der gleichen Reizvorlage mehrere Gestaltgesetze ihre Anwendung finden können. Wirken sie dabei in die gleiche Richtung, so verstärken sie sich gegenseitig, wirken sie jedoch entgegengesetzt, d.h. sie widersprechen sich, so setzt meist eins, das "stärkere", gegenüber dem/ den anderen durch. Letzteres ist auch in Abbildung 4 der Fall, wo sich das Gesetz der Ähnlichkeit - bezogen auf die Farbe der Reize- gegenüber dem Gesetz der Nähe durchsetzt (die Reizelemente sind horizontal näher angeordnet als vertikal, also müßte man bei Alleingültigkeit des Gesetzes der Nähe eine Anordnung in Reihen empfinden) und man so zur oben beschriebenen Wahrnehmung als in Spalten gruppiert gelangt.
3.Das Prägnanzgesetz - Gesetz der guten Gestalt - Gesetz der Einfachheit
Dem Prägnanzgesetz zufolge bilden sich "gestalthafte" Wahrnehmungseinheiten stets so aus, daß das Ergebnis eine möglichst einfache und einprägsame Gestalt darstellt, d.h. daß jedes Reizmuster so gesehen wird, daß die dabei entstehende Figur so einfach wie möglich ist.
Dies könnte als Erklärung dafür dienen, warum man in Abbildung 2 in den meisten Fällen zwei aufeinander liegende Quadrate sieht und nicht irgendeine Ansammlung beliebig vieler Vielecke.
4.Gesetz der fortgesetzt durchgehenden Linie/ Gesetz der guten Fortsetzung
Laut dem Gesetz der guten Fortsetzung neigt man dazu, Reizelemente,
z. B. Punkte, die im Falle ihrer Verbindung in einer geraden oder sanft
geschwungenen Kurve angeordnet sind, in einem Zusammenhang zu sehen, beziehungsweise
daß Linien an Schnittpunkten bevorzugt im Sinne einer Fortführung
ihrer bisherigen Linienführung gesehen werden.
In Abbildung 5 wird dieses Gesetz verdeutlicht:
Abbildung 5: Diese
Figur wird eher als zwei sanft geschwungene Linien, die sich in x kreuzen,
wahrgenommen, als zwei v - ähnliche Figuren, welche sich in x berühren.
5. Das Gesetz der Geschlossenheit
Das Gesetz der Geschlossenheit verweist auf die Tendenz, in geometrischen Gebilden diejenigen Strukturen als Figur wahrzunehmen, die eher geschlossen wirken als offen. Diese Geschlossenheit kann durch tatsächlich vorhandene geschlossene Linienzüge, aber auch nur durch die Vorstellung derselben bewirkt werden.
Abbildung 6: Diese Muster erscheinen als in einem Quadrat angeordnet, da diese Figur geschlossen wirkt, im Gegensatz zur Figur eines Kreuzes, welches hier offen wirkt und daher nicht in Betracht gezogen wird.
6. Das Gesetz des gemeinsamen Schicksals
Gemäß dem Gesetz des gemeinsamen Schicksals werden Elemente
einer Reizvorlage, die eine Bewegung oder Veränderung, beispielsweise
durch Drehung oder Verschiebung, in die gleiche Richtung erfahren, als
Einheit wahrgenommen.
Auf dieses Gesetz ist als Beispiel die Vorstellung einer Ballettgruppe
zurückzuführen, die durch gemeinsame Bewegungsabläufe den
Eindruck einer zusammengehörenden Gruppe vermittelt.
Abschließende Bemerkungen zu den Gestaltgesetzen
Einer der Hauptkritikpunkte an den Gestaltgesetzen ist die Tatsache, daß sie die Entstehung von Wahrnehmungseindrücken bei verschiedenen Reizvorlagen nur beschreiben anstatt zu erklären beziehungsweise im Nachhinein erklären statt vorauszusagen. Zwar ist die Bedeutsamkeit der Einflußfaktoren Ähnlichkeit, Nähe, Kontinuität und Verbundenheit der Reizelemente für deren Gruppierung unbestritten, dennoch vermag der gestalttheoretische Erklärungsansatz nicht zu erklären, warum ausgerechnet diese Relationen eine Vorhersage von Wahrnehmungseindrücken erlauben sollen. Ebenso sind die Gestaltgesetze so konzipiert, daß ihre Deutung eine subjektive, nicht allgemeingültige Interpretation darstellt, vergleicht man beispielsweise die Deutung von "einfach" im Kontext des Prägnanzgesetzes, und ihre Überprüfbarkeit anhand von modernen, auf quantitativen Methoden gestützten Experimenten erweist sich als äußerst schwierig.
Nichtsdestotrotz sind sie nach wie vor nützliche Werkzeuge zur
Beschreibung der Wahrnehmungsorganisation, vor allem auch im Hinblick auf
reale Objekte und Szenen in der Welt, und werden deshalb in vielen weiteren
Erklärungsansätzen der Objekterkennung angewandt, unter anderem
bei David Marr.
Die folgenden Erklärungsansätze der Objekterkennung gehören
den konstruktivistischen Erklärungstheorien an, die versuchen, Objektwahrnehmung
als ein Verarbeitungsprozeß zu beschreiben, an dessen Anfang das
zweidimensionale Netzhautabbild des betreffenden Objektes steht und dessen
Ende die Identifikation desselben darstellt. Wesentlich hierbei ist, daß
dieser Prozeß in Stufen abläuft.
Welche Stufen dabei im einzelnen zu unterscheiden sind, auf welchen
Ausgangspunkten die Theorien basieren und welche gemeinsamen Berührpunkte
es zwischen ihnen gibt, soll im einzelnen näher beleuchtet werden.
Überblick über DAVID MARRs Theorie
Bei den realen zu erkennenden Objekten handelt es sich um dreidimensionale Gegenstände, deren Reizkonfigurationen von der Perspektive, aus der die Objekte betrachtet werden, abhängen. Dies führt zu unterschiedlichen und oftmals auch unvergleichlichen Reizkonfigurationen des gleichen Objekts, die aber dessen Identifikation nicht zu beeinträchtigen scheinen ( vergleiche das Beispiel des Gesichtererkennens ). Offensichtlich leitet das menschliche Wahrnehmungssystem eine vom Blickwinkel unabhängige Objektrepräsentation aus den gegebenen Reizbedingungen ab.
Eine Idee, wie diese Transformation von statten geht, liefert die Theorie
von DAVID MARR.
David Marr (1945- 1980), ein Wahrnehmungsforscher, der sich hauptsächlich
mit dem Erkennen von Gegenständen beschäftigte, gilt als der
Pionier des algorithmischen Ansatzes zur Erklärung der Objektwahrnehmung.
Seine Grundgedanken finden sich in zahlreichen Schriften ( vor allem Marr
1976, Marr und Nishihara 1978) und in seinem 1982 erschienen Werk "Vision"
wieder. Darin erklärt er den Wahrnehmungsprozeß von Objekten
als stufenförmigen Vorgang, welcher sich in drei Abschnitte gliedern
läßt ( Rohskizze, 2 1/2 -D-Skizze und 3-D-Modell); jede Stufe
wird dabei auf der nächsthöheren weiterverarbeitet. Abbildung
7 gibt einen Überblick über die unterschiedlichen Stufen der
Objekterkennung.
|
|
|
|
||||
|
|
Þ |
|
Þ |
|
Þ |
|
1.Die Rohskizze (primal sketch)
Die Rohskizze läßt sich laut Marr in zwei Unterabschnitte gliedern, die er als raw primal sketch (primäre Rohskizze) und full primal sketch bezeichnet. Sie hat als Input das zweidimensionale Abbild des betrachteten Objektes auf der Retina, Ziel dieser ersten Verarbeitungsstufe ist die Identifikation der Elementarmerkmale wie Konturen, Kanten und Flächen des zugrundeliegenden Gegenstandes, welche durch die Analyse des zugehörigen Netzhautabbildes nach Intensitäts- beziehungsweise Helligkeitsunterschieden erreicht werden kann.
Raw primal sketch
Das Netzhautabbild wird hier in verschiedene Helligkeitsgrade, Farben, Flecken und Linien zerlegt. Dies erfolgt mittels der Analyse der Intensitätsunterschiede: Laut Marr ist dabei die Intensitätsänderung auf dem Netzhautabbild, welche von einem Übergang einer Fläche in eine andere auf dem Objekt herrührt, sprich eine Kontur darstellt, abrupt, während sich die auf Licht und Schatten beruhende Änderung eher allmählich vollzieht. Da Marrs Forschungsinteresse der Untersuchung von naturalistischen Szenen und Objekten, so wie sie in der realen Welt vorkommen, galt, muß das visuelle System diese allmählichen Intensitätsveränderungen einkalkulieren, sie aber bei der Identifikation von Grenzen oder Kanten des Objektes unberücksichtigt lassen. Marr zufolge gehen nämlich nur diese scharfen Intensitätsveränderungen mit den Konturen des betrachteten Objektes einher. Die raw primal sketch enthält also eine Beschreibung der Elementarmerkmale, welche allerdings noch in ungeordneter Form vorliegen.
Full primal sketch:
Auf der dieser Stufe werden die ungeordneten Elementarmerkmale zueinander
in Beziehung gesetzt beziehungsweise gruppiert.
Dies erfolgt mit Hilfe der Gestaltgesetze, so daß die Globalstrukturen,
d.h. die größeren Flächen, die dieses Objekt ausmachen,
ersichtlich werden.
2. Die 2 1/2-D-Skizze (2 1/2 -D-sketch)
Auf der zweiten Stufe des Objekterkennungsprozesses werden die globalen
Flächen aus der Rohskizze unter den Gesichtspunkten der Tiefe und
Orientierung verarbeitet. Dabei entstehen orientierte (Ober-) Flächen
mit Richtungszuweisungen.
Das hierbei zustande kommende Ergebnis der 2 1/2-D-Skizze ist also
eine subjektzentrierte Reizstruktur, d.h. eine Reizstruktur, welche vom
Blickwinkel des Beobachters abhängig ist.
3. Die 3-D-Skizze ( 3-D-model representation)
Das Ziel dieser 3-D-Skizze, welche als wichtigster Schritt bei der Erkennung dreidimensionaler Gegenstände betrachtet werden kann, ist die Umwandlung der subjektzentrierten Reizstruktur in eine von der Betrachtungsperspektive unabhängige Objektrepräsentation (= objektzentriert).
Dies erfolgt mittels der Ableitung eines objektzentrierten Koordinatensystems aus der gegebenen Reizstruktur: Ausgehend von der Ausrichtung (elongation) und den Symmetrien der vom Objekt erzeugten Reizstruktur werden Hauptachsen für die Gesamtkonfiguration als Ganzes und zunehmend für einzelne ihrer Teile bestimmt. Die Lage dieser Achsen zueinander ergibt eine Struktur, die als dreidimensionales Gerüst der räumlichen Anordnung von elementaren Körpern ( cones) interpretiert wird. Auf diese Weise erhält man ein objektzentriertes dreidimensionales Modell des zu erkennenden Gegenstandes, welches unabhängig vom Blickwinkel des Betrachters ist, da diese Hauptachsen eines Objekts über alle möglichen Betrachtungsperspektiven invariant bleiben.
Zur Identifikation des Gegenstandes schließlich muß das
abgeleitete dreidimensionale Modell mit im Gedächtnis gespeicherten
Objektmodellen verglichen werden; findet hierbei irgendwo eine Übereinstimmung
statt, wird er als solcher erkannt. Erst das Ergebnis dieses Stadiums,
die Wahrnehmung des Objektes also, ist dem Betrachter bewußt, alle
vorhergehenden Schritte entziehen sich seinem Bewußtsein.
Abbildung 8 zeigt einen menschlichen Körper als Beispiel für
ein abgeleitetes dreidimensionales Objektmodell im Sinn von Marr. Es ist
aus fünf elementaren zylinderförmigen Körpern ( cones) aufgebaut,
die in ihrer relativen Länge dem Kopf, dem Rumpf, zwei Armen und zwei
Beinen entsprechen, wobei jeder Elementarkörper dabei eine Hauptachse
besitzt. Abbildung 8 illustriert auch das Prinzip der Hierarchie der 3-D-Objektrepräsentationen:
Ausgehend vom Ganzen werden zunehmend die Einzelheiten beziehungsweise
-teile erfaßt (hier: Arm in Ober- und Unterarm eingeteilt, Hand als
Teil des Unterarms).
Abbildung 8: Beispiel
für ein dreidimensionales Objektmodell nach Marr
Die Identifikation eines Objektes ist in der Theorie von David Marr
unabhängig von der gegebenen Betrachtungsperspektive, weil sich bei
unterschiedlichen Blickwinkeln als Resultat des Verarbeitungsprozesses
immer das gleiche dreidimensionale Modell des Objekts ergibt. Dennoch ist
sie insofern abhängig von Blickwinkel des Betrachters, als daß
unterschiedliche Perspektiven für ein Objekt einen erhöhten Aufwand
für die Ableitung seines dreidimensionalen Modells bedürfen können.
Dies erklärt auch die Tatsache, daß ein ungewöhnlicher
Betrachtungswinkel eines Objekts oftmals mehr Zeit für dessen Identifikation
benötigt und sich oftmals auch als schwierig gestaltet.
Bei David Marrs Theorie handelt es sich um eine sogenannte bottom-up
Verarbeitung, d.h. daß das Objekt erst in seine Einzelteile beziehungsweise
Elementarmerkmale zerlegt wird und diese anschließend verarbeitet
werden, ohne Vorwissen über die Bedeutung des Gegenstandes einzubeziehen.
Es gibt zahlreiche Weiterentwicklungen der Grundideen Marrs, so auch die Theorie des Erkennens dreidimensionaler Formen anhand elementarer Teilkörper ( recognition by components- theory) von IRVING BIEDERMAN.
1. Überblick über die Theorie Biedermans
Der Ausgangspunkt von Irving Biederman in seiner recognition by components- Theorie ist der, daß dreidimensionale Körper bei ihrer zweidimensionalen Abbildung auf der Retina Konturen beziehungsweise Kanten mit bestimmten Eigenschaften erzeugen, die bei der Rekonstruktion der Bestandteile und des Objekts als ganzes hilfreich sind. Dabei geht er von der Überlegung aus, daß diese bestimmten Eigenschaften der Konturen des Retinabildes entsprechende Verhältnisse innerhalb des Objekts widerspiegeln und nennt fünf solcher Eigenschaften:
Abbildung 9: Auswahl
einiger Geone aus Biedermans System und einige Beispiele an Objekten, die
sich aus diesen Geonen zusammensetzen lassen.
In Biedermans System lassen sich durch vielfältige Kombination von dieser relativ kleinen Anzahl an elementaren Teilkörpern bereits eine unendlich erscheinende Vielzahl an Objekten charakterisieren. Die Kombination der Geone untereinander erfolgt hierbei im wesentlichen nach den Gesichtspunkten der relativen Größe der Geone im Vergleich, ihrer Anordnung ( z.B. vertikal, horizontal etc.) und Art der Verbindung untereinander und nach dem relativen Ort ihrer Verbindung.( Vgl. das Objekt " Tasse" und "Eimer" in Abbildung 9, welche sich nur durch den Ort ihrer Verbindung unterscheiden).
Die Identifikation des Objektes erfolgt schließlich durch einen Vergleich seiner Komponenten mit im Gedächtnis gespeicherten Objektrepräsentationen.
Abbildung 10 faßt eben erwähnte Schritte bei der Objektidentifikation
in einer Übersicht zusammen.
Abbildung 10: Zusammenfassung
der Objektidentifikation nach Biederman
2.Experimentelle Untersuchungen
Biederman führte zahlreiche Versuche durch, um die Rolle der Geone
bei der Objektidentifikation zu überprüfen.
In einem Experiment hierzu bestand die den Probanden dargebotene Reizvorlage
aus jeweils einer stark vereinfachten Zeichnung eines Flugzeuges, welche
sich durch die Anzahl der sichtbaren Geone unterschieden ( wie in Abbildung
11 dargestellt), dabei bekam eine Versuchsperson jeweils nur eine der Zeichnungen
vorgelegt. Ihre Aufgabe bestand darin, den dargestellten Gegenstand so
schnell wie möglich zu benennen.
Das Ergebnis war, daß die meisten Gegenstände unabhängig von der Art der Reizvorlage in weniger als einer Sekunde erkannt wurden; die Versuchspersonen, welche die Reizvorlage mit 3 Geonen dargeboten bekamen, konnten zu 80 % das Flugzeug richtig benennen, die Probanden mit der Reizvorlage mit 4 Geonen bereits zu 90% und Probanden, auf deren Reizvorlage alle Geone des Flugzeuges sichtbar waren, erkannten es zu 100% als solches.
Daraus schloß Biederman, daß die Identifikation eines Objektes
auf der Erkennung der Geone beruht, sie beruht sogar nur auf der Wahrnehmung
einer weniger Komponenten in richtiger Relation zueinander. Das Weglassen
einiger Geone schien den Identifikationsprozeß nicht negativ zu beeinflussen.
Abbildung 11: Versuchsanordnung laut Biederman.
Die Versuchspersonen bekamen entweder die Reizvorlage a mit drei sichtbaren
Geonen, b mit vier oder c mit allen Bestandteilen des Flugzeuges dargeboten.
In anderen Experimenten ließ Biederman Teile der Kontur der zu
benennenden Gegenstände verdeckt. Dabei handelte es sich im wesentlichen
um Konturelemente, welche die Identifizierbarkeit der nicht- zufälligen
Merkmale betrafen ( z.B. der Schnittpunkt zweier Linien), so daß
diese nicht erkannt werden konnten und eine Bildung von Geonen nicht möglich
war. Die Probanden hatten folglich auch Schwierigkeiten, den dargestellten
Gegenstand zu benennen.
Dies wertete Biederman als Bestätigung für seine These, daß
es die Kontureigenschaften sind, welche über die Bildung von Geonen
die wesentlichen Elemente für die Objektidentifikation liefern.
Aus diesen und ähnlichen Experimenten leitete Biederman den zentralen
Leitsatz seiner Theorie ab, der besagt, daß bei genügend Information
zur Identifikation der elementaren Teilkörpern eines Objektes das
Objekt erkannt wird.
Beiden Theorien ist gemeinsam, daß sie versuchen, Objektidentifikation als ein von der Betrachtungsperspektive unabhängiger Prozeß zu erklären. Dabei erfolgt die Weiterverarbeitung in beiden Erklärungsansätzen vom gemeinsamen Ausgangspunkt der Kanten- beziehungsweise Konturenidentifikation auf unterschiedliche Art und Weise: Bei David Marr müssen die Hauptachsen des Objektes und seiner Teile bestimmt werden, um das entsprechende 3-D-Modell, welches aus gleichförmigen, zylinderähnlichen elementaren Teilkörpern, den cones, aufgebaut ist, abzuleiten, während Irving Biederman die nicht-zufälligen Merkmale der Konturen untersucht, aufgrund derer die verschiedenen elementaren Teilkörper, die Geone, identifiziert werden, welche die Bausteine der Objektwahrnehmung darstellen und aufgrund derer das Objekt schließlich wahrgenommen wird. In dieser Hinsicht kann die recognition by components- Theorie als Weiterentwicklung von David Marrs Theorie betrachtet werden.
In beiden Ansätzen endet die Objektidentifikation mit einem Vergleich der Resultate des visuellen Verarbeitungsprozesses ( Marr: dreidimensionales Modell, Biederman: erarbeitete Geone) mit im Gedächtnis gespeicherten Objektmodellen beziehungsweise -repräsentationen.
Abschließend sei noch zu erwähnen, daß beide Theorien
Beweise für ihre psychologische Gültigkeit entbehren, weil es
sich im wesentlichen um spekulative Vermutungen handelt, die viele Aspekte
zu unspezialisiert lassen ( beispielsweise die genaue Vorstellung über
den Vergleich mit den im Gedächtnis gespeicherten Objektmodellen beziehungsweise
-repräsentationen).
Goldstein, E. Bruce: Wahrnehmungspsychologie (1997), Spektrum Akademischer Verlag Kap. 5
Bruce, Vicki & Green, Patric R. : Visual perception , Physiology, Psychology and Ecology ( 2nd edition 1991)