Seminar : Visuelle Wahrnehmung, Prof. Hans Irtel
Sommersemester 98
Anita Brenndörfer
Objektwahrnehmung
 
 
Einleitung:   Fragestellungen Der gestalttheoretische Erklärungsansatz   Zur Geschichte der Gestaltpsychologie

  Ausgangspunkt und Untersuchungen der Gestaltpsychologie

  Die Gestaltgesetze:
                1.Das Gesetz der Nähe
                2. Das Gesetz der Ähnlichkeit
                3. Das Prägnanzgesetz
                4.Das Gesetz der guten Fortsetzung
                5.Das Gesetz der Geschlossenheit
                6. Das Gesetz des gemeinsamen Schicksals

  Abschließende Bemerkungen zu den Gestaltgesetzen

   Die konstruktivistischen Erklärungstheorien der Objektwahrnehmung

  Überblick über DAVID MARRs Theorie:
                        1. Die primäre Rohskizze ( raw primal sketch, full primal sketch)
                        2. Die 2 1/2 -D-Skizze (2 1/2 - D-sketch)
                        3. Die 3-D-Skizze (3-D-model representation)
                        4. Abschließende Bemerkungen

         
      Theorie des Erkennens dreidimensionaler Formen anhand von elementaren
           Teilkörpern ( recognition by components- theory) von IRVING BIEDERMAN
            1. Überblick über die Theorie Biedermans
            2. Experimentelle Untersuchungen und Ergebnisse
       
      Vergleich der Theorien Marrs und Biedermans
     
Literaturverzeichnis
 
Einleitung

Definition und Probleme der Objekterkennung, Fragestellungen

Unter Objektwahrnehmung versteht man die Wahrnehmung von Gegenständen, wie sie einem im täglichen Leben begegnen und deren richtige Einordnung in die jeweilige Szene bzw. das Umfeld.

Dieser Vorgang erscheint dem Menschen als selbstverständlich und bereitet ihm meistens keinerlei Schwierigkeiten, denke man etwa an die Leichtigkeit, mit der man die sich beim Blick aus dem Fenster darbietende Szene wahrnimmt: Eine Straße mit Autos, Bäumen, passierenden Menschen usw. .

Es wird jedoch deutlich, daß es sich bei der Objektwahrnehmung um einen komplexen und vielschichtigen und nicht immer so einfachen Prozeß handelt, wenn man sich seine Ausgangsbedingungen und die damit verbundenen Probleme für das Wahrnehmungssystem vor Augen führt: Der Mensch erhält die visuelle Information über die Objekte in Form von zweidimensionalen Abbildern auf der Netzhaut und muß sie im Falle der Objekterkennung in dreidimensionale Gegenstände aus der Umwelt umwandeln. Sein Wahrnehmungssystem steht dabei vor folgenden Problemen:

 
Schwierigkeiten der Erkennung ergeben sich auch, wenn die dargebotenen Reizmuster undeutlich oder mehrdeutig sind. Dies ist dann der Fall, wenn die Objekte teilweise verdeckt sind, z. B. durch andere, sich davor befindliche Gegenstände, die nur noch einen Teil des zu erkennenden Objektes zeigen, so daß dessen Identifikation erschwert wird.

Als Beispiel für ein mehrdeutiges Reizmuster wären die sogenannten Rätselbilder zu nennen, d. h. Bilder, in denen das gleiche Reizmuster zwei voneinander verschiedene, nicht gleichzeitig erfolgende Wahrnehmungen erzeugt. Abbildung 1 zeigt ein solches Rätselbild, in dem man entweder eine Vase oder zwei einander zugewandte Gesichter wahrnimmt, nie aber beides gleichzeitig.

 


Abbildung 1: Rubins Kippbild als Beispiel für ein Rätselbild

Sich mit der Identifikation von Objekten zu beschäftigen heißt folglich auch, die visuellen Reizstrukturen und die damit verbundene Wahrnehmung zu untersuchen. Ausgangspunkt hierbei ist, daß sich die visuellen Reizwirkungen stets auf vielfache Weise gliedern lassen und das Wahrnehmungssystem in der Regel immer nur eine realisiert.

Abbildung 2 zeigt ein einfaches Beispiel:


Abbildung 2: Beispiel für verschiedene Gliederungsmöglichkeiten a - d eines gegebenen Reizmusters: a - Ausgangsfigur : die meisten Menschen sehen hier zwei aufeinander liegende Quadrate; weitere Gliederungsmöglichkeiten: b - acht Dreiecke, c - ein Achteck, d - unregelmäßiges Vieleck

Die Fragen, die sich hier aufdrängen, sind zum einen Fragen nach denjenigen Zusammenhängen, welche die Gliederung der Reizstrukturen bestimmen, die also die Einheiten der Wahrnehmung ausmachen. ( Auf das Eingangsbeispiel bezogen wäre dies die Frage, warum man ausgerechnet Bäume, Autos und Menschen als Einheiten der Wahrnehmung erkennt und die gegebenen Reizstrukturen nicht irgendwie anders gliedert).

Zum anderen ist aber das Phänomen, daß die Erkennbarkeit von Objekten bzw. deren Einheiten von der jeweiligen Erscheinungsform unberührt bleibt, eine weitere Überlegung in diesem Zusammenhang wert. Die Erscheinungsform, in der sich die Objekte der Wahrnehmung präsentieren, sind oftmals sehr vielfältig und variieren je nach Form, Größe, Typ oder aber auch der Betrachtungsperspektive. Hier eignet sich das Problem der Gesichtererkennung als Beispiel: Gesichter zweier verschiedener Personen in der Frontalansicht sind sich oft ähnlicher als das gleiche Gesicht einmal von vorne und einmal von der Seite aus betrachtet, dennoch werden die beiden unähnlicheren Ansichten als zu der gleichen Person gehörend erkannt.

Verschiedene Theorien versuchen, für die eben erwähnten Fragen und Überlegungen Erklärungen zu liefern; es werden aber im folgenden nur diejenigen näher betrachtet, die sich mit der Erkennung dreidimensionaler Gegenstände beschäftigen.

 Der gestalttheoretische Erklärungsansatz

Zur Geschichte der Gestaltpsychologie

 Die Gestaltpsychologie ist ein Teilgebiet der Psychologie, welches sich mit dem Aufbau der Welt der Wahrnehmung beschäftigt. Als ihr Begründer gilt vor allem Max Wertheimer (1887-1943).

Sie entstand in der 20-er Jahren als Gegenbewegung auf die Elementenpsychologie, eine damals vorherrschende theoretische Richtung, und wandte sich gegen die darin verbreitete Auffassung, daß sich Wahrnehmung aus der Addition einzelner Elementen, den elementaren Empfindungen, aufbaue.

Max Wertheimer widerlegte diese Ansicht durch Experimente zur Scheinbewegung:
Wenn in einer Versuchsanordnung auf der linken Seite eines Feldes ein Lichtstreifen kurz auftritt, dann eine Dunkelpause für 50 Millisekunden erfolgt, bevor der Streifen auf der rechten Seite des Feldes wieder auftaucht, so nimmt unsere Wahrnehmung im gesamten Versuchsaufbau eine Bewegung von links nach rechts wahr , obwohl während der Dunkelpause keinerlei physikalische Lichtreize vorhanden waren (= Scheinbewegung).

Die Vorstellung der Elementenpsychologie, daß man die Einzelelemente addiert, um zur Wahrnehmung zu gelangen, scheiterte daran, diese Phänomen zu erklären und veranlaßte die Gestaltpsychologen zur Aufstellung einer ihrer wichtigsten Grundregel, welche besagt, daß DAS GANZE MEHR ALS DIE SUMME SEINER TEILE IST, d.h. daß eine Erscheinung in der Wahrnehmung als Ganzes andere Qualitäten aufweist als seine einzelnen Teilelemente, da die Teilelemente miteinander in Beziehung stehen und dadurch die Wahrnehmung des Ganzen beeinflussen.

Grundsätzliche Erkenntnisse der Gestaltpsychologie

In der Gestaltpsychologie findet sich das Psychische immer als Ganzes vor, ebenso wie Objekte bzw. die Reizkonfigurationen, die diesen zugrunde liegen, als ganzheitliche Gebilde wahrgenommen werden. Diese ganzheitlichen Gebilde setzen sich aus zueinander in Beziehung stehenden Teilen zusammen, wobei die Teile durch ihren inneren Zusammenhalt als auch durch ihre Beziehungen zum Ganzen festgelegt sind. Dies bedeutet im Fall der Objekterkennung, daß der Wahrnehmungsprozeß in der gesamten Reizkonfiguration, die von einem Objekt ausgeht, bestimmte Reizstrukturen nach irgendwelchen Kriterien als enger zusammengehörig als andere organisiert, so daß ein aus Teilen bestehendes, bedeutungshaltiges Objekt wahrgenommen wird.

Die Gestaltpsychologie versucht, diese Gesetzmäßigkeiten zu finden, die die Organisation von Teilen zu einem Ganzen erklären; sie beschäftigt sich also mit der eingangs formulierten Frage nach den Einheiten der Wahrnehmung. Die Ergebnisse dieser Untersuchungen sind in den Gestaltgesetzen manifestiert.

Die Gestaltgesetze

Die Gestaltgesetze sind Regeln der Wahrnehmung, die erklären sollen, nach welchen Gesetzmäßigkeiten bestimmte Reizelemente innerhalb einer Reizkonfiguration mit großer Wahrscheinlichkeit als zusammengehörige Teile innerhalb eines Ganzen wahrgenommen werden.
 

1.Das Gesetz der Nähe

Das Gesetz der Nähe besagt, daß Elemente (eines Reizmerkmals) mit geringen Abständen zueinander als zusammengehörig wahrgenommen werden.
Abbildung 3 illustriert das Gesetz der Nähe.

 


            a                                       b
 
Abbildung 3: Gesetz der Nähe : In a wird eine Anordnung der Punkte (Reize) in vertikalen Spalten wahrgenommen, da der Abstand der Punkte zueinander vertikal kleiner ist als horizontal; in b ist es genau umgekehrt.
 

2. Das Gesetz der Ähnlichkeit

Das Gesetz der Ähnlichkeit besagt, daß einander ähnlich sehende Elemente eher als zusammengehörig erlebt werden als einander unähnlich sehende. Die Ähnlichkeit kann hierbei auf Helligkeit, Farbe, Orientierung, Größe und/ oder Form bezogen sein.
Abbildung 4 zeigt das Gesetz der Ähnlichkeit anhand eines Beispiels.

 
Abbildung 4: Beispiel für das Gesetz der Ähnlichkeit: die Kreise erscheinen aufgrund ihrer Ähnlichkeit bezüglich der Farbe in Spalten angeordnet.

Abbildung 4 illustriert aber des weiteren noch ein Phänomen der Gestaltgesetze, nämlich daß in der gleichen Reizvorlage mehrere Gestaltgesetze ihre Anwendung finden können. Wirken sie dabei in die gleiche Richtung, so verstärken sie sich gegenseitig, wirken sie jedoch entgegengesetzt, d.h. sie widersprechen sich, so setzt meist eins, das "stärkere", gegenüber dem/ den anderen durch. Letzteres ist auch in Abbildung 4 der Fall, wo sich das Gesetz der Ähnlichkeit - bezogen auf die Farbe der Reize- gegenüber dem Gesetz der Nähe durchsetzt (die Reizelemente sind horizontal näher angeordnet als vertikal, also müßte man bei Alleingültigkeit des Gesetzes der Nähe eine Anordnung in Reihen empfinden) und man so zur oben beschriebenen Wahrnehmung als in Spalten gruppiert gelangt.

3.Das Prägnanzgesetz - Gesetz der guten Gestalt - Gesetz der Einfachheit

Dem Prägnanzgesetz zufolge bilden sich "gestalthafte" Wahrnehmungseinheiten stets so aus, daß das Ergebnis eine möglichst einfache und einprägsame Gestalt darstellt, d.h. daß jedes Reizmuster so gesehen wird, daß die dabei entstehende Figur so einfach wie möglich ist.

Dies könnte als Erklärung dafür dienen, warum man in Abbildung 2 in den meisten Fällen zwei aufeinander liegende Quadrate sieht und nicht irgendeine Ansammlung beliebig vieler Vielecke.

4.Gesetz der fortgesetzt durchgehenden Linie/ Gesetz der guten Fortsetzung

Laut dem Gesetz der guten Fortsetzung neigt man dazu, Reizelemente, z. B. Punkte, die im Falle ihrer Verbindung in einer geraden oder sanft geschwungenen Kurve angeordnet sind, in einem Zusammenhang zu sehen, beziehungsweise daß Linien an Schnittpunkten bevorzugt im Sinne einer Fortführung ihrer bisherigen Linienführung gesehen werden.
In Abbildung 5 wird dieses Gesetz verdeutlicht:
 

Abbildung 5: Diese Figur wird eher als zwei sanft geschwungene Linien, die sich in x kreuzen, wahrgenommen, als zwei v - ähnliche Figuren, welche sich in x berühren.
 

5. Das Gesetz der Geschlossenheit

Das Gesetz der Geschlossenheit verweist auf die Tendenz, in geometrischen Gebilden diejenigen Strukturen als Figur wahrzunehmen, die eher geschlossen wirken als offen. Diese Geschlossenheit kann durch tatsächlich vorhandene geschlossene Linienzüge, aber auch nur durch die Vorstellung derselben bewirkt werden.

 

Abbildung 6: Diese Muster erscheinen als in einem Quadrat angeordnet, da diese Figur geschlossen wirkt, im Gegensatz zur Figur eines Kreuzes, welches hier offen wirkt und daher nicht in Betracht gezogen wird.

6. Das Gesetz des gemeinsamen Schicksals

Gemäß dem Gesetz des gemeinsamen Schicksals werden Elemente einer Reizvorlage, die eine Bewegung oder Veränderung, beispielsweise durch Drehung oder Verschiebung, in die gleiche Richtung erfahren, als Einheit wahrgenommen.
Auf dieses Gesetz ist als Beispiel die Vorstellung einer Ballettgruppe zurückzuführen, die durch gemeinsame Bewegungsabläufe den Eindruck einer zusammengehörenden Gruppe vermittelt.

Abschließende Bemerkungen zu den Gestaltgesetzen

Einer der Hauptkritikpunkte an den Gestaltgesetzen ist die Tatsache, daß sie die Entstehung von Wahrnehmungseindrücken bei verschiedenen Reizvorlagen nur beschreiben anstatt zu erklären beziehungsweise im Nachhinein erklären statt vorauszusagen. Zwar ist die Bedeutsamkeit der Einflußfaktoren Ähnlichkeit, Nähe, Kontinuität und Verbundenheit der Reizelemente für deren Gruppierung unbestritten, dennoch vermag der gestalttheoretische Erklärungsansatz nicht zu erklären, warum ausgerechnet diese Relationen eine Vorhersage von Wahrnehmungseindrücken erlauben sollen. Ebenso sind die Gestaltgesetze so konzipiert, daß ihre Deutung eine subjektive, nicht allgemeingültige Interpretation darstellt, vergleicht man beispielsweise die Deutung von "einfach" im Kontext des Prägnanzgesetzes, und ihre Überprüfbarkeit anhand von modernen, auf quantitativen Methoden gestützten Experimenten erweist sich als äußerst schwierig.

Nichtsdestotrotz sind sie nach wie vor nützliche Werkzeuge zur Beschreibung der Wahrnehmungsorganisation, vor allem auch im Hinblick auf reale Objekte und Szenen in der Welt, und werden deshalb in vielen weiteren Erklärungsansätzen der Objekterkennung angewandt, unter anderem bei David Marr.
 

Die konstruktivistischen Erklärungstheorien der Objektwahrnehmung

 

Die folgenden Erklärungsansätze der Objekterkennung gehören den konstruktivistischen Erklärungstheorien an, die versuchen, Objektwahrnehmung als ein Verarbeitungsprozeß zu beschreiben, an dessen Anfang das zweidimensionale Netzhautabbild des betreffenden Objektes steht und dessen Ende die Identifikation desselben darstellt. Wesentlich hierbei ist, daß dieser Prozeß in Stufen abläuft.
Welche Stufen dabei im einzelnen zu unterscheiden sind, auf welchen Ausgangspunkten die Theorien basieren und welche gemeinsamen Berührpunkte es zwischen ihnen gibt, soll im einzelnen näher beleuchtet werden.
 

Überblick über DAVID MARRs Theorie

Bei den realen zu erkennenden Objekten handelt es sich um dreidimensionale Gegenstände, deren Reizkonfigurationen von der Perspektive, aus der die Objekte betrachtet werden, abhängen. Dies führt zu unterschiedlichen und oftmals auch unvergleichlichen Reizkonfigurationen des gleichen Objekts, die aber dessen Identifikation nicht zu beeinträchtigen scheinen ( vergleiche das Beispiel des Gesichtererkennens ). Offensichtlich leitet das menschliche Wahrnehmungssystem eine vom Blickwinkel unabhängige Objektrepräsentation aus den gegebenen Reizbedingungen ab.

Eine Idee, wie diese Transformation von statten geht, liefert die Theorie von DAVID MARR.
David Marr (1945- 1980), ein Wahrnehmungsforscher, der sich hauptsächlich mit dem Erkennen von Gegenständen beschäftigte, gilt als der Pionier des algorithmischen Ansatzes zur Erklärung der Objektwahrnehmung. Seine Grundgedanken finden sich in zahlreichen Schriften ( vor allem Marr 1976, Marr und Nishihara 1978) und in seinem 1982 erschienen Werk "Vision" wieder. Darin erklärt er den Wahrnehmungsprozeß von Objekten als stufenförmigen Vorgang, welcher sich in drei Abschnitte gliedern läßt ( Rohskizze, 2 1/2 -D-Skizze und 3-D-Modell); jede Stufe wird dabei auf der nächsthöheren weiterverarbeitet. Abbildung 7 gibt einen Überblick über die unterschiedlichen Stufen der Objekterkennung.

 
 
primäre Rohskizze
zweieinhalb dimensionale Skizze
Dreidimensionale Representation
Abbildung des Objekts auf der Netzhaut
 

Þ 

Kanten und Elementarmerkmale identifizieren
 

Þ 

Elementarmerkmale gruppieren und verarbeiten
 

Þ 

Dreidimensionales Objekt wahrnehmen
 Abbildung 7

1.Die Rohskizze (primal sketch)

Die Rohskizze läßt sich laut Marr in zwei Unterabschnitte gliedern, die er als raw primal sketch (primäre Rohskizze) und full primal sketch bezeichnet. Sie hat als Input das zweidimensionale Abbild des betrachteten Objektes auf der Retina, Ziel dieser ersten Verarbeitungsstufe ist die Identifikation der Elementarmerkmale wie Konturen, Kanten und Flächen des zugrundeliegenden Gegenstandes, welche durch die Analyse des zugehörigen Netzhautabbildes nach Intensitäts- beziehungsweise Helligkeitsunterschieden erreicht werden kann.

Raw primal sketch

Das Netzhautabbild wird hier in verschiedene Helligkeitsgrade, Farben, Flecken und Linien zerlegt. Dies erfolgt mittels der Analyse der Intensitätsunterschiede: Laut Marr ist dabei die Intensitätsänderung auf dem Netzhautabbild, welche von einem Übergang einer Fläche in eine andere auf dem Objekt herrührt, sprich eine Kontur darstellt, abrupt, während sich die auf Licht und Schatten beruhende Änderung eher allmählich vollzieht. Da Marrs Forschungsinteresse der Untersuchung von naturalistischen Szenen und Objekten, so wie sie in der realen Welt vorkommen, galt, muß das visuelle System diese allmählichen Intensitätsveränderungen einkalkulieren, sie aber bei der Identifikation von Grenzen oder Kanten des Objektes unberücksichtigt lassen. Marr zufolge gehen nämlich nur diese scharfen Intensitätsveränderungen mit den Konturen des betrachteten Objektes einher. Die raw primal sketch enthält also eine Beschreibung der Elementarmerkmale, welche allerdings noch in ungeordneter Form vorliegen.

Full primal sketch:
Auf der dieser Stufe werden die ungeordneten Elementarmerkmale zueinander in Beziehung gesetzt beziehungsweise gruppiert.
Dies erfolgt mit Hilfe der Gestaltgesetze, so daß die Globalstrukturen, d.h. die größeren Flächen, die dieses Objekt ausmachen, ersichtlich werden.

2. Die 2 1/2-D-Skizze (2 1/2 -D-sketch)

Auf der zweiten Stufe des Objekterkennungsprozesses werden die globalen Flächen aus der Rohskizze unter den Gesichtspunkten der Tiefe und Orientierung verarbeitet. Dabei entstehen orientierte (Ober-) Flächen mit Richtungszuweisungen.
Das hierbei zustande kommende Ergebnis der 2 1/2-D-Skizze ist also eine subjektzentrierte Reizstruktur, d.h. eine Reizstruktur, welche vom Blickwinkel des Beobachters abhängig ist.

3. Die 3-D-Skizze ( 3-D-model representation)

Das Ziel dieser 3-D-Skizze, welche als wichtigster Schritt bei der Erkennung dreidimensionaler Gegenstände betrachtet werden kann, ist die Umwandlung der subjektzentrierten Reizstruktur in eine von der Betrachtungsperspektive unabhängige Objektrepräsentation (= objektzentriert).

Dies erfolgt mittels der Ableitung eines objektzentrierten Koordinatensystems aus der gegebenen Reizstruktur: Ausgehend von der Ausrichtung (elongation) und den Symmetrien der vom Objekt erzeugten Reizstruktur werden Hauptachsen für die Gesamtkonfiguration als Ganzes und zunehmend für einzelne ihrer Teile bestimmt. Die Lage dieser Achsen zueinander ergibt eine Struktur, die als dreidimensionales Gerüst der räumlichen Anordnung von elementaren Körpern ( cones) interpretiert wird. Auf diese Weise erhält man ein objektzentriertes dreidimensionales Modell des zu erkennenden Gegenstandes, welches unabhängig vom Blickwinkel des Betrachters ist, da diese Hauptachsen eines Objekts über alle möglichen Betrachtungsperspektiven invariant bleiben.

Zur Identifikation des Gegenstandes schließlich muß das abgeleitete dreidimensionale Modell mit im Gedächtnis gespeicherten Objektmodellen verglichen werden; findet hierbei irgendwo eine Übereinstimmung statt, wird er als solcher erkannt. Erst das Ergebnis dieses Stadiums, die Wahrnehmung des Objektes also, ist dem Betrachter bewußt, alle vorhergehenden Schritte entziehen sich seinem Bewußtsein.
Abbildung 8 zeigt einen menschlichen Körper als Beispiel für ein abgeleitetes dreidimensionales Objektmodell im Sinn von Marr. Es ist aus fünf elementaren zylinderförmigen Körpern ( cones) aufgebaut, die in ihrer relativen Länge dem Kopf, dem Rumpf, zwei Armen und zwei Beinen entsprechen, wobei jeder Elementarkörper dabei eine Hauptachse besitzt. Abbildung 8 illustriert auch das Prinzip der Hierarchie der 3-D-Objektrepräsentationen: Ausgehend vom Ganzen werden zunehmend die Einzelheiten beziehungsweise -teile erfaßt (hier: Arm in Ober- und Unterarm eingeteilt, Hand als Teil des Unterarms).

 
Abbildung 8: Beispiel für ein dreidimensionales Objektmodell nach Marr
 

4.Abschließende Bemerkungen

Die Identifikation eines Objektes ist in der Theorie von David Marr unabhängig von der gegebenen Betrachtungsperspektive, weil sich bei unterschiedlichen Blickwinkeln als Resultat des Verarbeitungsprozesses immer das gleiche dreidimensionale Modell des Objekts ergibt. Dennoch ist sie insofern abhängig von Blickwinkel des Betrachters, als daß unterschiedliche Perspektiven für ein Objekt einen erhöhten Aufwand für die Ableitung seines dreidimensionalen Modells bedürfen können. Dies erklärt auch die Tatsache, daß ein ungewöhnlicher Betrachtungswinkel eines Objekts oftmals mehr Zeit für dessen Identifikation benötigt und sich oftmals auch als schwierig gestaltet.
Bei David Marrs Theorie handelt es sich um eine sogenannte bottom-up Verarbeitung, d.h. daß das Objekt erst in seine Einzelteile beziehungsweise Elementarmerkmale zerlegt wird und diese anschließend verarbeitet werden, ohne Vorwissen über die Bedeutung des Gegenstandes einzubeziehen.

Es gibt zahlreiche Weiterentwicklungen der Grundideen Marrs, so auch die Theorie des Erkennens dreidimensionaler Formen anhand elementarer Teilkörper ( recognition by components- theory) von IRVING BIEDERMAN.

 
Die Theorie des Erkennens dreidimensionaler Formen anhand elementarer Teilkörper (recognition by components) von Irving Biederman

 
1. Überblick über die Theorie Biedermans

Der Ausgangspunkt von Irving Biederman in seiner recognition by components- Theorie ist der, daß dreidimensionale Körper bei ihrer zweidimensionalen Abbildung auf der Retina Konturen beziehungsweise Kanten mit bestimmten Eigenschaften erzeugen, die bei der Rekonstruktion der Bestandteile und des Objekts als ganzes hilfreich sind. Dabei geht er von der Überlegung aus, daß diese bestimmten Eigenschaften der Konturen des Retinabildes entsprechende Verhältnisse innerhalb des Objekts widerspiegeln und nennt fünf solcher Eigenschaften:

Diese Eigenschaften werden als nicht-zufällige (non-accidental) Merkmale zusammengefaßt; nicht-zufällig sind sie deshalb, weil es Merkmale sind, welche durch die zweidimensionale Abbildung des dreidimensionalen Körpers von dessen Form systematisch erzeugt weden und somit unabhängig von der Betrachtungsperspektive des Gegenstands sind. Sie werden laut Biederman schnell ausfindig gemacht und durch Kombination der Konturen mit diesen Eigenschaften entstehen die elementaren Teilkörper, welche die Komponenten darstellen, aus denen jedes Objekt zusammengesetzt ist. Sie werden von Biederman als Geone ( von geometric ion) bezeichnet.
Biederman unterscheidet 36 verschiedene Geone wie beispielsweise Kegel, Kugel, Zylinder etc., von denen einige in Abbildung 9 dargestellt sind.


Abbildung 9: Auswahl einiger Geone aus Biedermans System und einige Beispiele an Objekten, die sich aus diesen Geonen zusammensetzen lassen.

In Biedermans System lassen sich durch vielfältige Kombination von dieser relativ kleinen Anzahl an elementaren Teilkörpern bereits eine unendlich erscheinende Vielzahl an Objekten charakterisieren. Die Kombination der Geone untereinander erfolgt hierbei im wesentlichen nach den Gesichtspunkten der relativen Größe der Geone im Vergleich, ihrer Anordnung ( z.B. vertikal, horizontal etc.) und Art der Verbindung untereinander und nach dem relativen Ort ihrer Verbindung.( Vgl. das Objekt " Tasse" und "Eimer" in Abbildung 9, welche sich nur durch den Ort ihrer Verbindung unterscheiden).

Die Identifikation des Objektes erfolgt schließlich durch einen Vergleich seiner Komponenten mit im Gedächtnis gespeicherten Objektrepräsentationen.

Abbildung 10 faßt eben erwähnte Schritte bei der Objektidentifikation in einer Übersicht zusammen.

Abbildung 10: Zusammenfassung der Objektidentifikation nach Biederman

 
2.Experimentelle Untersuchungen

Biederman führte zahlreiche Versuche durch, um die Rolle der Geone bei der Objektidentifikation zu überprüfen.
In einem Experiment hierzu bestand die den Probanden dargebotene Reizvorlage aus jeweils einer stark vereinfachten Zeichnung eines Flugzeuges, welche sich durch die Anzahl der sichtbaren Geone unterschieden ( wie in Abbildung 11 dargestellt), dabei bekam eine Versuchsperson jeweils nur eine der Zeichnungen vorgelegt. Ihre Aufgabe bestand darin, den dargestellten Gegenstand so schnell wie möglich zu benennen.

Das Ergebnis war, daß die meisten Gegenstände unabhängig von der Art der Reizvorlage in weniger als einer Sekunde erkannt wurden; die Versuchspersonen, welche die Reizvorlage mit 3 Geonen dargeboten bekamen, konnten zu 80 % das Flugzeug richtig benennen, die Probanden mit der Reizvorlage mit 4 Geonen bereits zu 90% und Probanden, auf deren Reizvorlage alle Geone des Flugzeuges sichtbar waren, erkannten es zu 100% als solches.

Daraus schloß Biederman, daß die Identifikation eines Objektes auf der Erkennung der Geone beruht, sie beruht sogar nur auf der Wahrnehmung einer weniger Komponenten in richtiger Relation zueinander. Das Weglassen einiger Geone schien den Identifikationsprozeß nicht negativ zu beeinflussen.
 

Abbildung 11: Versuchsanordnung laut Biederman. Die Versuchspersonen bekamen entweder die Reizvorlage a mit drei sichtbaren Geonen, b mit vier oder c mit allen Bestandteilen des Flugzeuges dargeboten. 
 

In anderen Experimenten ließ Biederman Teile der Kontur der zu benennenden Gegenstände verdeckt. Dabei handelte es sich im wesentlichen um Konturelemente, welche die Identifizierbarkeit der nicht- zufälligen Merkmale betrafen ( z.B. der Schnittpunkt zweier Linien), so daß diese nicht erkannt werden konnten und eine Bildung von Geonen nicht möglich war. Die Probanden hatten folglich auch Schwierigkeiten, den dargestellten Gegenstand zu benennen.
Dies wertete Biederman als Bestätigung für seine These, daß es die Kontureigenschaften sind, welche über die Bildung von Geonen die wesentlichen Elemente für die Objektidentifikation liefern.
Aus diesen und ähnlichen Experimenten leitete Biederman den zentralen Leitsatz seiner Theorie ab, der besagt, daß bei genügend Information zur Identifikation der elementaren Teilkörpern eines Objektes das Objekt erkannt wird.

 

Vergleich der Theorien Marrs und Biedermans

Beiden Theorien ist gemeinsam, daß sie versuchen, Objektidentifikation als ein von der Betrachtungsperspektive unabhängiger Prozeß zu erklären. Dabei erfolgt die Weiterverarbeitung in beiden Erklärungsansätzen vom gemeinsamen Ausgangspunkt der Kanten- beziehungsweise Konturenidentifikation auf unterschiedliche Art und Weise: Bei David Marr müssen die Hauptachsen des Objektes und seiner Teile bestimmt werden, um das entsprechende 3-D-Modell, welches aus gleichförmigen, zylinderähnlichen elementaren Teilkörpern, den cones, aufgebaut ist, abzuleiten, während Irving Biederman die nicht-zufälligen Merkmale der Konturen untersucht, aufgrund derer die verschiedenen elementaren Teilkörper, die Geone, identifiziert werden, welche die Bausteine der Objektwahrnehmung darstellen und aufgrund derer das Objekt schließlich wahrgenommen wird. In dieser Hinsicht kann die recognition by components- Theorie als Weiterentwicklung von David Marrs Theorie betrachtet werden.

In beiden Ansätzen endet die Objektidentifikation mit einem Vergleich der Resultate des visuellen Verarbeitungsprozesses ( Marr: dreidimensionales Modell, Biederman: erarbeitete Geone) mit im Gedächtnis gespeicherten Objektmodellen beziehungsweise -repräsentationen.

Abschließend sei noch zu erwähnen, daß beide Theorien Beweise für ihre psychologische Gültigkeit entbehren, weil es sich im wesentlichen um spekulative Vermutungen handelt, die viele Aspekte zu unspezialisiert lassen ( beispielsweise die genaue Vorstellung über den Vergleich mit den im Gedächtnis gespeicherten Objektmodellen beziehungsweise -repräsentationen).
 

Literaturverzeichnis

Goldstein, E. Bruce: Wahrnehmungspsychologie (1997), Spektrum Akademischer Verlag Kap. 5

Bruce, Vicki & Green, Patric R. : Visual perception , Physiology, Psychology and Ecology ( 2nd edition 1991)