Tiefenwahrnehmung durch binokulare Stereopsis

Liborio Ciccarello und Dirk Berger

Universität Mannheim Seminar: Ausgewählte Probleme der Wahrnehmungspsychologie, Wintersemester 1996/97




Inhalt



I. Einleitung


1. Das Phänomen Tiefenwahrnehmung


2. Systematisierung der Hinweisreize


2.1. Okulomotorische Hinweisreize


2.2. Visuelle Hinweisreize



II. Hauptteil: Tiefenwahrnehmung durch binokulare Stereopsis


1. Binokulare Fusion


2. Der Horopter


3. Querdisparation und Stereopsis


4. Neurophysiologische Voraussetzungen des stereoptischen Tiefensehens



III. Der Wahrnehmungsraum als internes Umweltmodell




I. Einleitung


1. Das Phänomen Tiefenwahrnehmung

Wie ist Tiefensehen möglich? Wie funktioniert Tiefensehen? Diese Fragen erhalten ihre volle Brisanz erst dann, wenn man sich die schlichte Tatsache vergegenwärtigt, daß die Umwelt auf unserer Retina zweidimensional abgebildet wird.

Das Abbild auf der Retina eines Menschen ist zwar zweidimensional, das gleiche Abbild aber enthält Hinweisreize, die dem Menschen Tiefensehen aufzwingen. Z.B. sehen wir ein Objekt, das ein anderes Objekt teilweise verdeckt. Dieses Bild ist auf unserer Retina zweidimensional abgebildet, aber wir schließen aus der Tatsache, daß ein Objekt ein anderes teilweise verdeckt, daß das verdeckte Objekt weiter hinten liegen muß.

Es gibt verschiedene Hinweisreize, die uns das Tiefensehen ermöglichen. Einer davon wird binokulare Disparität genannt; womit sich die vorliegende Arbeit vorwiegend beschäftigen wird.


2. Systematisierung der Hinweisreize

In diesem Kapitel werden die Hinweisreize, die Tiefensehen ermöglichen, klassifiziert und erläutert. Es wird ein vorläufiger Zugang für das Verständnis von Tiefensehen geschaffen, und vor allem das weitere Umfeld, in dem der Hinweisreiz Binokulare Disparität eingebettet ist, vorgestellt.

Hinweisreize des Tiefensehens
Okulomotorische Visuelle
Konvergenz Akkomodation Monokulare Binokulare
Bildhafte Bewegungsinduzierte
Verdeckung
Größe
Höhe
Lineare Perspektive
Bewegungsparallaxe
Verdeckung u. Aufdeckung
Binokulare Disparität


2.1. Okulomotorische Hinweisreize

Okulomotorische Hinweisreize beruhen auf unserer Fähigkeit, einerseits die Position unserer Augen und andererseits die Spannung unserer Augenmuskeln wahrnehmen zu können.

2.1.1. Konvergenz

Nähern wir unseren Finger unserer Nase, so konvergieren unsere Augen und wir spüren deshalb eine gewisse Spannung unserer Augenmuskulatur. Entfernen wir den Finger weiter von uns weg, so divergieren unsere Augen und die Spannung der Augenmuskulatur löst sich. Unser Gehirn ist in der Lage, diese Spannung als Nähe und eine Entspannung als Tiefe zu interpretieren.

2.1.2. Akkomodation

Es besteht auch ein Zusammenhang zwischen der Entfernung eines Gegenstandes vom Auge und der Wölbung der Augenlinsen; auch hieraus kann unser Gehirn seine nötigen Informationen entnehmen.

2.2. Visuelle Hinweise

Während die okulomotorischen Tiefenhinweise physiologischer Natur sind und auf einen Zusammenhang zwischen Entfernung eines gesehenen Gegenstandes und Veränderungen "rund ums Auge" beruhen, gründen visuelle Hinweise auf das von uns Gesehene.

2.2.1. Monokulare Hinweisreize

Es handelt sich hierbei um visuelle Hinweisreize. Im Gegensatz zu den binokularen Tiefenhinweisen, welche man nur durch das Sehen von beiden Augen erhalten kann, kann man monokulare Tiefenhinweise aus den Bildern, die auf der Retina eines einzelnen Auges abgebildet werden, entnehmen.

2.2.1.1. Bildhafte Hinweisreize

Bildhafte Hinweisreize gehören zu den visuellen Tiefenhinweisen und können aus einem ruhenden Bild entnommen werden. Die folgenden Erläuterungen und Beispiele werden diesen Sachverhalt besser veranschaulichen.

Aus der teilweisen Verdeckung eines Objekts durch ein anderes, erhalten wir den Hinweisreiz, daß das verdeckte Objekt hinter dem verdeckenden Objekt liegen muß; allerdings können wir aus diesem Hinweisreiz keine Informationen bezüglich der Entfernung, die zwischen beiden Objekten liegt, erhalten. Abb .1.1.

Abb. 1.1
Die wahrgenommene Größe eines Objekts stellt einen Hinweisreiz dar, denn je größer ein Objekt erscheint, desto eher nimmt man an, daß es näher zum Betrachter liegt, als ein kleiner erscheinendes Objekt gleicher Art.

Je höher ein Objekt auf unserem Blickfeld erscheint, desto weiter liegt es von uns entfernt und umgekehrt. Die Höhe eines Objekts auf unserem Blickfeld stellt also auch einen wichtigen Hinweisreiz dar.

Wenn wir ein Objekt sehen, so müssen wir durch die Luft und die Luftpartikel hindurchsehen, bevor wir das gesehene Objekt "erreichen". So erscheinen weiter entfernt liegende Objekte unschärfer als näher liegende. In diesem Falle liegt der Hinweisreiz Atmosphärischer Dunst vor.

Das Wissen über die Größe eines Objekts beeinträchtigt auch unsere Tiefenwahrnehmung.

Darüber hinaus gibt es das Phänomen der linearen Perspektive. Ein Betrachter, der auf einer Autobahnbrücke steht, nimmt Tiefe unter anderem deshalb wahr, weil die objektiv parallelen Seitenbegrenzungen der Autobahn, die unter ihm hindurch führt, auf der Netzhaut nicht parallel abgebildet werden und dadurch am Horizont zusammenzulaufen scheinen. Die Autobahn ercheint dem Betrachter mit.zunehmender Entfernung schmaler. Abb. 1.2 soll diesen Sachverhalt verdeutlichen.
Abb. 1.2.

2.2.1.2. Bewegungsinduzierte Hinweisreize


Diese Hinweisreize gründen auf Bewegungen des Betrachters oder der Umwelt.
Wenn wir laufen oder rennen, so verschwinden näher liegende Objekte schneller als weiter entfernte Objekte. Wenn wir aus einem Zugfenster eines fahrenden Zuges hinaus schauen, können wir dies beobachten: Weiter entfernte Objekte bewegen sich langsamer als näher liegende. Diesen Hinweisreiz nennt man Bewegungsparallaxe.
Letzlich gibt es den Hinweisreiz der Verdeckung und Aufdeckung, was im Grunde eine Variante des oben schon behandelten Hinweisreizes der Verdeckung darstellt.

2.2.2. Binokulare Disparität


Dieser Hinweisreizkomplex gründet auf der Tatsache, daß auf unseren beiden Augen leicht unterschiedliche Bilder der gleichen Gegebenheit abgebildet werden, aber letzlich ein einziges Bild hieraus entsteht. In Kapitel II wird dieser Themenkomplex ausführlich behandelt.
Um über die Tiefe eines Objekts zu "entscheiden" wird unser Gehirn nie nur ein Hinweisreiz heranziehen, es wird viele oder alle benutzen, um eine optimale Tiefeninformation zu bekommen.


II. Tiefenwahrnehmung durch binokulare Stereopsis


1. Binokulare Fusion

Da die Augen des Menschen frontal aufgestellt sind, sieht man den größten Teil des Gesichtsfeldes binokular, das heißt mit zwei Augen. Von der Umwelt, die wir visuell wahrnehmen, bestehen also stets zwei Bilder, nämlich das des linken und das des rechten Auges. Dies kann man sich leicht verdeutlichen, indem man einen fernen Punkt fixiert und dabei einen Finger vor das Gesicht hält, der Finger erscheint dann doppelt. Er wird vom linken wie vom rechten Auge gleichzeitig gesehen. Schließt man abwechselnd das linke und dann das rechte Auge, so stellt man fest, daß der Finger zuerst nach links und dann nach rechts springt. Dabei nimmt man die beiden einfachen monokularen Bilder war, aus denen das binokulare Doppelbild entsteht. Die beiden mokularen Bilder des Fingers sind nicht identisch, da die Augen nicht an der gleichen Stelle am Kopf angebracht sind, sondern in einem gewissen Abstand. Beim Fixieren des entfernten Punktes ist die Stellung der beiden Augen so ausgerichtet, daß der Punkt in der linken und rechten Fovea abgebildet wird. Natürlich bestehen auch von diesem Punkt zwei Netzhautbilder, diese liegen aber auf korrespondierenden Netzhautorten, das heißt auf der linken und rechten Retina an der gleichen Stelle. In diesem Fall "verschmelzen" die Beiträge des linken und rechten Auges und der Punkt wird nicht doppelt, sondern einfach gesehen. Diesen Vorgang nennt man binokulare Fusion, Abb.2.1.
Abb. 2.1 Versuchen Sie so zu schielen, daß aus den beiden Punkten genau drei werden, wie darunter angezeigt, dann werden beide Punkte in den Sehgruben abgebildet (und damit auf korrespondierenden Netzhautstellen).


2. Der Horopter

Es lassen sich allerdings noch mehr Raumpunkte ausmachen, die ebenfalls nur einfach gesehen werden und die nicht in den beiden Sehgruben abgebildet werden. Alle diese ebenfalls auf korrespondierenden Netzhautorten liegenden Punkte befinden sich in der horizontalen Ebene auf dem Horopter. Der Horopter ist definiert als der geometrische Ort für alle einfach gesehenen Raumpunkte, Abb.2.2.
Abb. 2.2 Der grüne Punkt wird in den beiden Sehgruben abgebildet und damit auf korrespodierenden Netzhautorten, daher wird er einfach gesehen. Das gleiche gilt für den blauen Punkt, da auch er auf dem Horoptor (in diesem Falle durch den sogn.Vieth-Müller-Kreis dargestellt),also ebenfalls auf korrespondierenden Netzhautorten, liegt. Der rote Punkt dagegen würde doppelt gesehen werden.

Die empirisch ermittelten Horoptoren weichen von der theoretischen Vorhersage des hier dargestellten Vieth-Müller-Kreises etwas ab. Dieser beruht auf der Annahme, daß Punkte in Richtungen, die für beide Augen um den gleichen Winkel von den Sehachsen abweichen, auf korrespodierenden Netzhautorten abgebildet und einfach gesehen werden. Darüber hinaus korrespodiert jeder Punkt eines Auges nicht einfach nur mit einem einzigen Punkt im anderen Auge, sondern mit einer Fläche, dem Panumschen Fusionsareal. Abweichungen vom Horopter innerhalb eines solchen Areals zerstören nicht den Eindruck des einfachen Bildes, führen aber zu einer veränderten Tiefenwahrnemung. Allerdings gelang es, unter der Bedingung des stabilisierten Netzhautbildes Punkte um den 20fachen Abstand des Panumschen Areals zu verschieben, ohne die binokulare Fusion zu zerstören. In anderen Untersuchungen gelang es dagegen, die Fusion noch innerhalb des Panumschen Areals zu stören. Ein Beispiel dafür ist das Experiment zum Panumschen Grenzfall, bei dem die Fusion einer vertikal stehenden Nadel durch eine zusätzlich angebrachte parallele Nadel innerhalb des Fusionsareals nicht mehr gelingt.


3. Querdisparation und Stereopsis

Das visuell wahrgenommene "Bild der Umwelt" ist eine Fusion aus den Bildern des linken und des rechten Auges. Wie aber entsteht dadurch ein Tiefeneindruck ? Die Antwort auf diese Frage liegt in der Tatsache, daß, wie oben schon erwähnt, diese beiden Bilder nicht identisch sind. Wenn wir einen entfernten Punkt fixieren, liegen die beiden Abbilder dieses Punktes in den Sehgruben des linken und rechten Auges, also auf korrespondiereden Netzhautorten, was auch auf alle anderen Punkte zutrifft, die auf dem Horopter liegen.Was geschieht aber mit Abbildern von Punkten, die nicht auf dem Horpter liegen ? Solche Punkte werden nicht auf korrespodierenden Netzhautorten abgebildet. Abb. 2.3 zeigt, wie ein zweiter Punkt (rot), der sich zwischen dem Betrachter und dem von ihm fixierten Punkt (blau) liegt, auf der Retina abgebildet wird.
Abb. 2.3

Das Abbild dieses Punktes befindet sich auf der linken Netzhaut links der Sehachse und der Fovea, auf der rechten Netzhaut hingegen wird der Punkt (b) rechts der Sehachse abgebildet. In Abb. 2.4 liegen die Abbilder von Punkt (b) zwar beide rechts der Sehgrube, in diesem Falle differieren aber ihre Abstände zu den Sehachsen. Auch hier wird Punkt (b) also nicht auf korrespondierenden Netzhautorten abgebildet.
Abb. 2.4

Diese Abstandsunterschiede sind wichtige Hinweisreize für das binokulare Tiefensehen und werden Querdisparation genannt. Das menschliche visuelle System ist in der Lage, die verschiedenen Beträge der Querdisparation als räumliche Tiefe zu interpretieren. So leuchtet ein, wie aus den beiden zweidimensionalen Netzhautbildern ein dreidimesionaler Eindruck unserer Umwelt entsteht. Besonders deutlich wird dies mit Hilfe von Abb.5, bei der durch Schielen das linke und rechte Quadrat binokular zu fusionieren ist. Es entstehen dann drei Quadrate, von denen das mittlere fixiert werden soll.
Abb. 2.5

Da die Abstände zwischen den Kugeln jeweils gleicher Farbe differieren, werden sie auf der linken Netzhaut an anderer Stelle abgebildet, als in der rechten. Die dadurch hervorgerufenen Querdisparationen führen zu einer räumlichen Wahrnehmung der Kugeln. Große Abstandsunterschiede zwischen den Bildern im linken und rechten Auge zu der jeweiligen Sehachse werden von unserem optischen System als großer Abstand zum Horopter interpretiert. Nach diesem Prinzip funktionieren Stereogramme, die sich alle die Möglichkeit des visuellen Systems Querdisparationen als räumliche Tiefe zu interprtieren zu Nutze machen, Abb.6
Abb. 2.6 Durch Schielen aus einem bequemen Bildschirmabstand gewinnt man den Eindruck, die Abbildung habe dreidimensionale Qualitäten. Bei einem ungeübten Betrachter stellt sich der Tiefeneindruck nach ca. 5-15 min. ein.


4. Neurophysiologische Voraussetzungen des stereoptischen Tiefensehens

Die frontale Augenaufstellung des Menschen, die ihm ein binokolares Gesichtsfeld ermöglicht, ist eine der Voraussetzungen des stereoptischen Tiefensehens. Die Gesichtsfelder des linken, sowie des rechten Auges lassen sich in jeweils einen monokularen und einen gemeinsamen binokularen Teil, an dem beide Augen partizipieren, gliedern. Die beiden monokularen Teile des Gesichtsfeldes werden temporäre Halbmonde genannt und haben auf das stereoptische Tiefensehen keinen Einfluß. Gegenstände, die innerhalb des binokularen Gesichtsfeldes liegen und nicht auf korrespondierenden Netzhautarealen abgebildet werden, müßten eigentlich doppelt gesehen werden, da sie ja von den beiden Augen auf unterschiedliche Weise gesehen werden. Unter normalen Umständen haben wir jedoch nicht den Eindruck, Gegenstände, die nicht auf dem Horopter liegen, doppelt zu sehen. Das oben genannte Beispiel mit dem doppelt wahrgenommenen Finger ist eine der wenigen Ausnahmen. Für dieses Phänomen gibt es verschiedene Erklärungsansätze. Zum einen mag die geringe Sehschärfe außerhalb der Fovea eine Rolle für die Vermeidung der Wahrnehmung von Doppelbildern spielen, zum anderen vermutet man einen binokularen Hemmungsmechanismus. David H. Hubel und Thorsten N. Wiesel endeckten 1959 im Großhirn einer Katze binokular erregbare Neuronen, die auf unterschiedliche Disparitäten spezialisiert sind (d.h. die bei einer bestimmten Abweichung von den korrespondierenden Netzhautarealen, z.B. 15° Winkelminuten, besonders stark feuern). Diese Zellen könnten der Grund sein, warum wir Gegenstände normalerweise nicht doppelt sehen.


III. Der Wahrnehmungsraum als internes Umweltmodell

Wie wir gesehen haben, sind bei der räumlichen Wahrnehmung interne Vorgaben genauso wirksam, wie die Reize aus unserer Umwelt; sonst könnte das zweidimensionale Netzhautbild keinen räumlichen Eindruck in uns hervorrufen. Das ist der Grund, warum wir zweidimensionale Muster als Raum auffassen können,wie es bei Stereogrammen der Fall ist, oder den schiefwinkligen Ames-Raum rechtwinklig sehen. So wie wir den Farbraum als Modell benutzen um Farbphänomene zu erklären (obwohl Farben in unserem Kopf nicht Räumen entsprechen), scheint unser Gehirn über ein internes Umweltmodell zu verfügen, das man Wahrnehmungsraum nennt. Mit Experimenten aus der Psychophysik versucht man mehr über die Eigenschaften dieses Wahrnehmungsraums zu erfahren. So hat man bemerkt, daß die subjektive Horizontale auf Augenhöhe von der objektiv meßbaren abweicht. Sie ist ab einer Entfernug von 2,5m (von der Vp) nach außen gekrümmt, bis 2,5m dagegen nach innen. Dieser und ähnliche Befunde legen die Vermutung nahe, der Wahrnehmungsraum habe hyperbolische Eigenschaften. F.K. Lüneburg versuchte eine allgemeine mathematische Beschreibung dieses Konzepts zu erarbeiten.

Ein aufmeksamer Beobachter wird bemerken, daß das stereoptische Tiefensehen bei größeren Distanzen als Hinweisreiz nicht mehr zur Verfügung steht. Mit Hilfe psychophysikalischer Messungen fand man heraus, daß sein Wirkungsbereich bei ca. 6m Entfernung endet, es ist also auf den unmittelbaren Handlungsbereich des Menschen beschränkt. Es hilft uns sicher einen Ball zu fangen ,die Entfernung abzuschätzen, wenn wir über einen Bach springen, oder auch nur um gezielt nach einem Glas Wasser zu greifen. Stellen Sie einmal ein Glas vor sich auf einen Tisch und versuchen, es zu greifen, während Sie ein Auge geschlossen halten, so daß kein binokulares Tiefensehen mehr möglich ist. Sie werden merken, wie viel leichter diese Übung ist, wenn Sie beide Augen geöffnet haben. Das stereoptische Tiefensehen dient also in erster Linie der Handlungsregulation. Dies ist insofern eine wichtige Erkenntnis, da sie uns verdeutlicht, daß unsere Sinne und unsere internen Vorgaben uns kein genaues Abbild der Wirklichkeit liefern sollen, sondern Instrumente sind, die unser tägliches Überleben sichern sollen.

Literaturverzeichnis

Campenhausen, Christoph von. (1993). Die Sinne des Menschen. (2. Aufl.) Stuttgart; New York: Georg Thieme Verlag.

Goldstein, E. Bruce. (1996). Sensation and Perception (4th ed.) Pacific Grove, CA: Brooks / Cole Puplishing Company

Kandel, Eric R., Schwartz, James H. (Hrsg.). (1995). Neurowissenschaften : eine Einführung. Heidelberg: Spektrum, Akademischer Verlag.

Schmidt, Robert. (1985). Grundriß der Sinnesphysiologie. Berlin: Springer-Verlag