Die Unterscheidbarkeit einfacher Reize

Fragestellungen der Psychophysik

Der Gegenstand der Psychophysik ist die Vorhersage von Empfindungen und Verhaltensweisen aufgrund physikalischer Reizbeschreibungen. Die folgenden Fragestellungen umreißen die thematischen Bereiche der Psychophysik.

1.    Was ist der für eine bestimmte Empfindung spezifische Reiz? Eine Vorhersage reizbezogener Verhaltensweisen oder Empfindungen ist nur möglich, wenn bekannt ist, was der Reiz für die Empfindung ist. In einigen Bereichen der Wahrnehmungspsychologie sind die spezifischen Reize für eine große Zahl von Empfindungsgrößen bekannt. Elektromagnetische Strahlung einer bestimmten Wellenlänge ist der Reiz für Farbempfindung, Schalldruck der Reiz für Lautheit. In anderen Bereichen der Wahrnehmungspsychologie sind die eine bestimmte Empfindung auslösenden Reize weitgehend unbekannt, wie etwa für Schönheit, die Ähnlichkeit von Gesichtern oder für verschiedene Geschmacksqualitäten.

2.    Was ist die minimale Reizintensität, die notwendig ist, damit eine bestimmte Empfindung auftritt, und wie stark müssen sich 2 Reize mindestens unterscheiden, damit sie als verschieden wahrgenommen werden? Auch wenn der spezifische Reiz für eine bestimmte Empfindung bekannt ist, kann nicht durch jede Reizausprägung eine Empfindung ausgelöst werden. Für die meisten Reizarten, die bei hinreichend großer Intensität eine bestimmte Empfindung auslösen, gibt es einen Intensitätsbereich, in dem die Reize noch nicht wahrgenommen werden. Auch für die Erkennbarkeit von Reizunterschieden gibt es Grenzen. Selbst unter optimalen Bedingungen gibt es in allen Wahrnehmungsbereichen physikalisch meßbare Reizunterschiede, die nicht mehr direkt wahrnehmbar sind.

3.    Wie hängt die Ausprägung einer bestimmten Empfindungsgröße von der Ausprägung des Reizes ab? Empfindungsgrößen haben häufig quantitativen Charakter, der in der Sprache durch Steigerungsreihen wie "hell", "heller", "am hellsten" ausgedrückt wird. Die Psychophysik versucht Verhaltensweisen zu erklären, bei denen Urteile über die quantitativen Eigenschaften von Empfindungsrößen zum Ausdruck kommen. Für psychophysische Untersuchungen kommen dabei nur solche Empfindungsgrößen in Betracht, die aufgrund physikalischer Reizbeschreibungen erklärt werden können. Das Ziel ist, die Ausprägung von Empfindungsgrößen aufgrund der physikalischen Reizbeschreibung vorherzusagen. Von besonderem Interesse sind solche Empfindungsgrößen, die in einen einfachen funktionalen Zusammenhang mit Reizeigenschaften gebracht werden können. Die Konstruktion solcher Zusammenhänge ist das wichtigste methodische Problem der Psychophysik. Der erste fundierte Vorschlag einer Methode zur Konstruktion quantitativer Empfindungsmaße wurde von Gustav Theodor Fechner in dem Buch "Elemente der Psychophysik (Fechner, 1860) entwickelt. Die Methoden Fechners haben die Entwicklung der Psychophysik bis in die 30er Jahre dieses Jahrhunderts bestimmt. In dieser Zeit entstanden die direkten Skalierungsmethoden von Stevens (zusammenfassend dargestellt in Stevens, 1975), die zu einer großen Zahl von empirischen Untersuchungen über psychophysische Zusammenhänge führten. Die Entwicklung der Meßtheorie und das tiefere Eindringen mathematischer Überlegungen in die Psychologie seit den 60er Jahren führte auch bei den Methoden der Psychophysik zu bedeutenden Fortschritten. Die Monographie von Falmagne (Falmagne, 1985) repräsentiert in umfassender Weise den gegenwärtigen Stand der formalen Methoden der Psychophysik.

Psychometrische Funktionen

Bei der experimentellen Untersuchung der Unterscheidbarkeit von Reizen versucht man, Reize so zu konstruieren, daß sie sich in möglichst wenig physikalischen Merkmalen voneinander unterscheiden, um nachher genau angeben zu können, aufgrund welcher Merkmale die Reize unterscheidbar sind. Die Reizsituationen, die bei der Konstanzmethode benutzt werden, enthalten immer einen Standardreiz s und einen Vergleichsreiz xj. Soll etwa untersucht werden, wie stark sich 2 Objekte in ihrer Masse unterscheiden müssen, damit sie als unterschiedlich schwer wahrgenommen werden, dann werden als Reize Objekte benutzt, die sich möglichst nur durch ihre Masse unterscheiden. Die Versuchsperson erhält bei jeder Beurteilung zuerst das Objekt s, den Standardreiz, danach das Objekt xj, den Vergleichsreiz. Die Frage an die Versuchsperson ist, ob das 2. Objekt schwerer ist als das erste. Als Antwort wird nur "ja" oder "nein" zugelassen. Eine solche Reizsituation kann mit (s,xj) bezeichnet werden, womit angedeutet ist, daß die Versuchsperson zuerst den Standardreiz mit der Masse s und danach den Vergleichsreiz mit der Masse xj vorgelegt bekommt. Ihr Urteil "ja" oder "nein" wird dann als Reaktion auf die Reizsituation (s,xj) aufgefaßt.Falls die Versuchsperson nun die Reizsituation (s,x1) anders beurteilt als die Reizsituation (s,x2), dann werden die Reize x1 und x2 als bezüglich s unterscheidbar betrachtet. Dieses etwas komplizierte Vorgehen wird deshalb angewandt, weil es eine sehr gute Kontrolle der Randbedingungen erlaubt. Würde man keinen Standardreiz verwenden, sondern x1 und x2 direkt vergleichen lassen, dann ergäbe sich ein Reihenfolgeeffekt: das Objekt, das zuerst angehoben wird, beeinflußt die Beurteilung des 2. Objekts. Durch die Darbietung des konstanten Standardreizes wird zwar auch die Beurteilung des folgenden Objekts beeinflußt, allerdings geschieht dies für x1 und x2 in der gleichen Weise.

Die Urteile der Versuchsperson hängen auch vom Standardreiz ab. Dabei kann man beobachten, daß bei sehr geringen physikalischen Unterschieden zwischen Standard- und Vergleichsreiz die Versuchsperson zufällig urteilt. Sie gibt bei wiederholter Darbietung derselben Reizsituation (s,xj) nicht immer das gleiche Urteil ab. Man nimmt deshalb an, daß für jede Reizsituation (s,xj) eine Wahrscheinlichkeit Ps(xj) existiert, mit der die Versuchsperson bei der Darbietung von (s,xj) auf die Frage, ob das 2. Objekt schwerer ist als das erste, mit "ja" antwortet. Falls die Massen von s und xj genügend ähnlich sind, dann hat diese Wahrscheinlichkeit einen Wert, der sowohl von 0, als auch von 1 verschieden ist. Der Wert von Ps(xj) ändert sich mit der Ausprägung von xj. Je größer die Masse xj ist, desto größer sollte auch die Wahrscheinlichkeit Ps(xj) sein.

Mit Hilfe der Wahrscheinlichkeiten Ps(xj) kann die Unterscheidbarkeit von Reizen definiert werden. Dazu müssen hinreichend viele, fein abstufbare Vergleichsreize xj existieren, so daß es möglich ist, zu jeder Wahrscheinlichkeit π einen Reiz xπ zu finden, (Die Bezeichnung xπ müßte eigentlich mit dem Index s versehen werden, da die Definition auf den Standardreiz Bezug nimmt. Der Einfachheit halber unterschlagen wir diesen Index.) so daß die Antwortwahrscheinlichkeit bei der Darbietung von (s,xπ) genau den Wert π annimmt. Es gilt also Ps(xπ) = π. Der Reiz x1/2 wird als Punkt der subjektiven Gleichheit bezeichnet, da die Versuchsperson diesen Reiz in der Hälfte der Fälle als schwerer als den Standardreiz einstuft und in der anderen Hälfte der Fälle nicht. Als Maß für die Unterscheidbarkeit von Reizen wird in der Psychophysik häufig der ebenmerkliche Unterschied EU, benutzt. Das ist diejenige Reizintensität, um die der Punkt der subjektiven Gleichheit x1/2 nach unten oder nach oben verändert werden muß, damit sich eine Antwortwahrscheinlichkeit von 1/4 oder 3/4 ergibt. Da die Änderungen nach unten und oben nicht gleich sein müssen, nimmt man als Wert für den ebenmerklichen Unterschied das arithmetische Mittel. Es gilt also

Der Reihenfolgeeffekt, der beim direkten Vergleich von Standard- und Vergleichsreiz auftritt, wird durch den konstanten Fehler KF beschrieben. Dies ist die Differenz zwischen dem Standardreiz und dem Punkt der subjektiven Gleichheit:

Sollen die Parameter EUs und KFs aus empirischen Daten geschätzt werden, dann müssen dazu die Werte für x1/4, x1/2 und x3/4 bekannt sein. Diese sind aber über die Wahrscheinlichkeiten Ps(xj) definiert, so daß die Formeln für EUs und KFs nur dann anwendbar sind, wenn im Experiment die Reize x1/4, x1/2 und x3/4 tatsächlich auch als Vergleichsreize benutzt werden. Da dies ohne vorherige Kenntnis der Ergebnisse des Experiments sehr unwahrscheinlich ist, benutzt man für die praktische Anwendung andere Methoden, um die Parameter zu schätzen. Es wird angenommen, daß die Antwortwahrscheinlichkeiten Ps(x) in einer ganz bestimmten Weise von den Reizintensitäten x abhängen, d.h. es soll eine Funktion Fs(x) geben, die für jede Reizausprägung x angibt, welchen Wert die Antwortwahrscheinlichkeit Ps(x) hat. Eine solche Funktion wird psychometrische Funktion genannt. Als Funktionsgleichung für Fs(x) wird heute meist die logistische Funktion in der Form

                                                                                               (2.1)

angenommen (vgl. Abb. 2.1). Die Parameter dieser Funktion können direkt als Maßzahlen für den Punkt der subjektiven Gleichheit und den ebenmerklichen Unterschied benutzt werden, da gilt: cs = x1/2 und as = x0.73 - x1/2. Da die logistische Funktion symmetrisch ist, kann deshalb der Parameter a als ebenmerklicher Unterschied und c als Punkt der subjektiven Gleichheit betrachtet werden.

Abb. 2.1. Psychometrische Funktion für einen Standardreiz von s = 440 Hz. Die offenen Punkte sind die Datenpunkte aus Tabelle 2.1. Die Kurve ist eine logistische Funktion nach der Gleichung (2.1) mit den Parameterwerten as = 0.815 und cs = 439.717. Die Parameterwerte können auch in der Graphik abgelesen werden, da cs = x0.5 und as = x0.73 - x0.5. Die Parameter wurden mit dem Minimum-Logit-Verfahren geschätzt.

Das Webersche Gesetz

Bei der Definition des ebenmerklichen Unterschiedes wurde darauf hingewiesen, daß die Größe von EUs vom Standardreiz abhängt. Die Art der Abhängigkeit vom Standardreiz war eine der ersten Fragestellungen der Psychophysik, die systematisch untersucht wurde. Durch Experimente zu verschiedenen Sinnesbereichen kam E. H. Weber (Weber, 1846) zu einer Hypothese über die Abhängigkeit des ebenmerklichen Unterschieds vom Standardreiz, die heute Webersches Gesetz genannt wird. Er nahm an, daß der ebenmerkliche Unterschied proportional zum Standardreiz ist:

 

 

Die Proportionalitätskonstante k ist spezifisch für den jeweiligen Sinnesbereich. Weber (1846) gibt für das Heben von Gewichten den Wert k = 0.1 an. Spätere Untersuchungen konnten das Webersche Gesetz in zahlreichen Sinnesbereichen bestätigen, allerdings mit der Einschränkung, daß die Ausprägung des Standardreizes auf mittlere Intensitäten beschränkt wird. Für sehr Kleine Intensitäten des Standardreizes und in einigen Fällen auch bei sehr großen Intensitäten, wird für die Webersche Konstante ein größerer Wert gefunden als in den mittleren Bereichen (Luce & Galanter, 1963).

Fragestellung

In unserem Experiment wollen wir die Unterscheidbarkeit von Tönen aufgrund ihrer Grundfrequenz untersuchen. Wir werden für verschiedene Grundfrequenzen des Standardtones den ebenmerklichen Unterschied bestimmen und prüfen, ob in dem von uns untersuchten Bereich das Webersche Gesetz gilt. Die Reize sind Töne konstanter Lautheit und konstanter Wellenform, aber mit unterschiedlicher Grundfrequenz. Jede einzelne Darbietung besteht aus einem Paar (s,x), bei dem der Standardreiz s ein Ton mit der Grundfrequenz s Hz, und der Vergleichsreiz x ein Ton mit der Grundfrequenz x Hz ist. Die Darbietung erfolgt sequentiell. Zuerst erklingt der Standardton s, dann folgt eine kurze Pause, und danach erklingt der Vergleichston x. Die Aufgabe der Versuchsperson besteht darin anzugeben, ob der 2. Ton höher klingt als der erste. Als Reizmaterial werden von einem Rechner erzeugte Töne benutzt, deren Frequenz in einfacher Weise durch das Steuerprogramm kontrolliert werden kann. Im Gegensatz zu den Arbeiten von Harris (1952) und Wier, Jesteadt und Green (1977) muß auf die Verwendung rein sinusförmiger Schalldruckverläufe verzichtet werden, da diese durch einfache Rechner nicht herzustellen sind. Es zeigt sich aber, daß die in der Literatur publizierten Ergebnisse zumindest in mittleren Frequenzbereichen auch mit anderen Schwingungsformen reproduziert werden können.

Die Fragestellung ist, ob sich die Antworten der Versuchspersonen für jeden Standardreiz durch eine logistische psychometrische Funktion beschreiben lassen. Ist dies der Fall, dann werden mit Hilfe der Parameter der logistischen Funktionen ebenmerkliche Unterschiede für die verschiedenen Standardreize bestimmt und geprüft, ob in dem verwendeten Frequenzbereich das Webersche Gesetz gilt. Wir benötigen für diese Fragestellung also mehrere psychometrische Funktionen bezüglich mehrerer Standardreize. Als ebenmerklicher Unterschied wird der Parameter as der logistischen Funktion benutzt. Eine exakte Formulierung der Hypothese ist:

Die Wahrscheinlichkeit einer "Ja"-Antwort auf die Frage, ob beim Reizpaar (s,x) der 2. Reiz höher klingt als der erste, läßt sich durch die Funktion

                                                                                                          (2.2)

mit as > 0 aus der Frequenz x berechnen. Die Parameter as und cs sind reelle Zahlen, die für verschiedene Versuchspersonen und Standardreize unterschiedlich sein können.

Methoden

Versuchsaufbau

Ist in den Rechner ein spezieller Tongenerator eingebaut, dann werden Sinustöne als Reize verwendet und die Darbietung erfolgt über einen Kopfhörer, der direkt an den Tongenerator angeschlossen wird (vgl. Abschn. \ref{sec:Adlib} auf Seite \pageref{sec:Adlib}). Ist kein Tongenerator vorhanden, dann sind die Reize Rechteckschwingungen, die über den eingebauten Lautsprecher des Rechners wiedergegeben werden. Wenn möglich wird die Lautstärke so eingestellt, daß der Ton zwar deutlich zu hören, aber nicht als laut empfunden wird. (Besonders laute Signalgeber, die über keine Lautstärkeregelung verfügen, sollten durch eine Abdeckung gedämpft werden). Die Versuchsperson sitzt in einem schallarmen Raum, Störgeräusche werden weitgehend ausgeschaltet. Die Urteile werden über 2 Tasten der Rechnertastatur abgegeben. Bei dieser Methode der Reizgenerierung kann der Schalldruck der einzelnen Reize nicht individuell geregelt werden, wir beschränken daher den Reizbereich auf Werte zwischen 400 und 2000 Hz, da in diesem Bereich Schwingungen mit konstantem Schalldruck auch etwa gleich laut erscheinen (Fletcher & Munson 1933). Dies verhindert, daß die Versuchsperson ihr Urteil auf Lautheitsunterschiede stützt.

Es werden 3 verschiedene Standardreize mit den Grundfrequenzen 440 (entspricht dem Kammerton A, dem Ton einer Stimmgabel), 880 und 1760 Hz verwendet. Zu jedem Standardreiz werden 7 Vergleichsreize angeboten. Die Vergleichsreize liegen symmetrisch zum Standardreiz in Abständen von 0.5 Hz bei 440 Hz, von 0.8 Hz bei 880 Hz und von 1.5 Hz bei 1760 Hz. Beim Standardreiz von 440 Hz haben wir also die Vergleichsreize 438.5, 439.0, 439.5, 440.0, 440.5, 441.0 und 441.5 Hz.

Versuchsablauf

Eine Reizdarbietung besteht aus der Darbietung des Standardtones (300 ms), einer Pause (500 ms) und der Darbietung des Vergleichstones (300 ms). Danach gibt die Versuchsperson ihr Urteil ab. Empfindet sie den 2. Ton als heller, drückt sie die Taste mit dem Pfeil nach links, empfindet sie ihn nicht als heller, drückt sie die Taste mit dem Pfeil nach rechts.

Jeder Vergleichsreiz wird 30 mal dargeboten, so daß für jeden Standardreiz 210 Urteile abgegeben werden. Insgesamt sind 630 Darbietungen notwendig. Das Experiment wird in 6 Blöcken mit je 15 Wiederholungen der 7 Vergleichsreize eines Standardreizes durchgeführt. Jeder Block dauert etwa 10 min. Ein Block enthält nur Durchgänge zu einem Standardreiz. Die Reihenfolge der einzelnen Standardreize ist 440, 880, 1760, 1760, 880 und 440 Hz. Die Reihenfolge der Vergleichsreize innerhalb eines Blockes ist zufällig. Nach jedem Block werden mindestens 3 min Pause eingelegt, auf Wunsch der Versuchsperson auch mehr. Zur Übung werden vor jedem neuen Standardreiz jeweils alle 7 Vergleichsreize einmal dargeboten. Mit den Übungsdurchgängen eingerechnet sind also 672 Darbietungen zu bearbeiten.

Datenauswertung

Die Parameter der Psychometrischen Funktion

Die Ableitung einer Schätzfunktion für die Parameter der logistischen psychometrischen Funktion kann hier nicht in allen Einzelheiten dargestellt werden, sie ist bei Bock und Jones (1968) nachzulesen. Wir werden nur kurz eine auf Urban (1909) und Berkson (1955) zurückgehende, vereinfachte Schätzmethode beschreiben, da diese im wesentlichen nur die aus der linearen Regression bekannten Methoden benutzt. Das Optimalitätskriterium, das hier verwendet wird, ist eine Modifikation des χ2-Kriteriums. Es werden diejenigen Parameter a und c der psychometrischen Funktion F(xj) gesucht, für die die Summe der gewichteten, quadrierten Abweichungen zwischen den beobachteten Häufigkeiten nj und den erwarteten Häufigkeiten Nj F(xj) möglichst klein ist (Nj ist die Anzahl der Beobachtungen beim Reiz xj).

Eine Methode, die Parameter einer Funktion so zu schätzen, daß die Summe der quadrierten Abweichungen der beobachteten Werte einer Zufallsgröße möglichst wenig von den Vorhersagen abweichen, ist aus der linearen Regression bekannt. Überträgt man dieses Verfahren auf die psychometrische Funktion, dann heißt dies, daß die Parameter a und c der Funktion F(xj) so zu bestimmen sind, daß der Ausdruck

möglichst klein wird. Differenziert man den Ausdruck nach a und c und setzt die Ableitungen gleich 0, dann stellt sich jedoch heraus, daß die daraus entstehenden Gleichungen nicht explizit nach a und c aufgelöst werden können, da die Funktion F nicht linear ist. In der Psychophysik wird deshalb seit Fechner (1860) eine Modifikation dieses Verfahrens benutzt, das eine explizite Lösung der Schätzgleichungen erlaubt. Die Modifikation besteht darin, daß beim Schätzverfahren nicht die Abweichungen zwischen den beobachteten Häufigkeiten nj und den erwarteten Häufigkeiten NjF(xj) direkt minimiert werden, sondern es werden Transformationen von nj und von F(xj) benutzt, die den Effekt haben, daß das Minimierungsproblem zu einer gewichteten linearen Regression wird.

Die Transformation, die zur Linearisierung der psychometrischen Funktion führt, wird von Berkson (1955) Logit-Transformation genannt:

                                                       .                                           (2.3)

Den linearen Zusammenhang zwischen Yj und xj erkennt man, wenn Gleichung (2.2) mit Pj = F(xj) in (2.3) eingesetzt wird. Dazu ist es besser, (2.2) vorher umzuformen:

      .

Für die Gegenwahrscheinlichkeit (1-Pj) gilt dann

.

und für den Quotienten Pj/(1-Pj)

.

Dies kann in Gleichung (2.3) eingesetzt werden und wir erhalten dann

        ,

    

so dass

                                                                                                                                                               (2.4)

womit der lineare Zusammenhang von Yj und xj gezeigt ist. Die Logit-Transformation stellt also eine Linearisierung der psychometrischen Funktion dar. Als Schätzfunktion für Yj wird die logistische Transformation der relativen Antworthäufigkeiten benutzt:

Da yj nur von den Daten nj abhängt, können auch die yj als Daten betrachtet werden.

Bei der von Urban (1909) entwickelten Modifikation des Verfahrens der kleinsten Quadrate für die Parameterschätzung psychometrischer Funktionen wird nicht die Summe der quadrierten Abweichungen der erwarteten und beobachteten Häufigkeiten minimiert, sondern eine gewichtete Summe quadrierter Abweichungen der logistisch transformierten relativen Häufigkeiten bzw. Wahrscheinlichkeiten. Da diese logistisch transformierten Werte, wie oben gezeigt wurde, linear von den Reizgrößen abhängen, lassen sich die daraus entstehenden Schätzgleichungen explizit nach den Parametern der psychometrischen Funktion auflösen. Die Minimierung geht von der Zufallsgröße (NjWj)1/2(yj - Yj), mit Wj = Pj(1-Pj) aus. Man kann diese Zufallsgröße als gewichtete Abweichung des Datenpunktes yj von dem durch die (linearisierte) psychometrische Funktion vorhergesagten Wert Yj auffassen. Es läßt sich zeigen, daß diese gewichtete Abweichung approximativ standardnormalverteilt ist (Bock & Jones, 1968). Da eine Summe quadrierter, unabhängig standardnormalverteilter Zufallsgrößen χ2-verteilt ist, ist die Größe

              (2.5)

approximativ χ2-verteilt mit m Freiheitsgraden, wenn a und c bekannt sind. Setzt man nun für Yj Gleichung (2.4) in (2.5) ein, dann erhält man einen Ausdruck, der bei gegebenen Daten yj nur noch von den Parametern a und c abhängt. Der Ausdruck (2.5) selbst ist eine approximativ χ2-verteilte Summe quadrierter Abweichungen der beobachteten Werte yj von den vorhergesagten Werten Yj. Die Parameter a und c müssen so bestimmt werden, daß diese Summe möglichst klein wird. Der wesentliche Unterschied zur üblichen linearen Regression besteht hier in den Gewichtungsfaktoren NjWj, die als Müller-Urban-Gewichte bezeichnet werden.

Die Logit-Transformation führt in der Nähe von P=1 bzw. P=0 zu erheblich größeren Verzerrungen als in der Umgebung von P=0.5. Dadurch bekommen die Abweichungen von y_j und Y_j in den Randbereichen ein zu großes Gewicht bei der Schätzung. Dies wird durch den Faktor Wj korrigiert, der bei Pj = 0.5 maximal und bei Pj = 0 bzw. bei Pj = 1 minimal ist. Nicht alle relativen Häufigkeiten n_j/Nj und damit auch nicht alle y_j sind mit der gleichen Genauigkeit geschätzt. Die Varianz der Schätzfunktionen nj/Nj ist umgekehrt proportional zu Nj. Bei der Schätzung bekommen deshalb durch den Faktor Nj diejenigen Daten, die auf mehr Beobachtungen beruhen, auch einen größeren Einfluß.

Um die Parameterschätzungen  und  zu finden, die (2.5) minimieren, wird für Yj die Gleichung (2.4) eingesetzt und der Ausdruck (2.5) nach a und c abgeleitet. Daraus ergeben sich 2 Gleichungen, die nach Nullsetzen zu expliziten Lösungen für a und c führen (Berkson, 1955; Bock & Jones, 1968). Wir erhalten mit den gewichteten Mittelwerten

und den Summen

für die Schätzungen  und  das Ergebnis

                                                                                                         (2.6)

In diesen Gleichungen sind die Gewichte Wj enthalten, die bei der Schätzung noch unbekannt sind. Sie können jedoch nach Bock und Jones (1968) durch wj = nj(Nj-nj)/Nj2 ersetzt werden, ohne daß sich die approximative Verteilung von Gleichung (2.5) ändert. Für die Berechnungen von (2.6) vereinfacht sich damit der Faktor NjWj zu Njwj = nj(Nj-nj)/Nj.

Mit den Parameterschätzungen  und  können nun zusammen mit den bekannten Werten xj die Antwortwahrscheinlichkeiten Pj unter der Annahme, daß Hypothese H richtig ist, geschätzt werden. Für alle j = 1,...,m gilt dann

Bei der Minimum-Logit-Parameterschätzung muß die logistische Transformation von relativen Häufigkeiten berechnet werden. Sind in einem Experiment die Vergleichsreize ungünstig gewählt, dann kann es vorkommen, daß relative Häufigkeiten von 0 oder 1 auftreten, für die die logistische Transformation nicht definiert ist. Um dieses Problem zu vermeiden, wird von Bock und Jones (1968) als Schätzfunktion für Yj statt der logistischen Transformation (2.3) eine etwas modifizierte Transformation der relativen Antworthäufigkeiten empfohlen:

Diese Schätzfunktion hat außerdem gegenüber der einfachen logistischen Transformation den Vorteil, daß der Bias bei der Schätzung von Yj geringer ist. Sie sollte also in jedem Fall der Formel (2.3) vorgezogen werden.

Statistischer Test

Um die Korrektheit der Annahme einer logistischen psychometrischen Funktion zu prüfen, ist ein statistischer Test durchzuführen, in dem die beobachteten Häufigkeiten nj mit den aus der logistischen Funktion vorhergesagten Häufigkeiten NjPj verglichen werden. Die Zufallsgröße nj ist binomialverteilt. Ihr Erwartungswert ist NjPj und ihre Varianz ist NjPj(1-Pj). Wie bereits oben dargestellt, ist die Hypothese H eine Hypothese über den Parameter Pj der Binomialverteilung von nj. Als statistischen Test können wir deshalb einen χ2-Test benutzen. Die Prüfgröße

 

 

                                               

 

ist approximativ χ2-verteilt mit einem Freiheitsgrad, wobei NjPj nicht kleiner als 5 sein sollte. Auf diese Weise erhalten wir für jeden Vergleichsreiz xj genau eine Prüfgröße. Aus der Statistik ist bekannt, daß eine Summe unabhängiger, χ2-verteilter Zufallsgrößen selbst wieder χ2-verteilt ist, wobei die Freiheitsgrade der Summenverteilung gleich der Summe der Freiheitsgrade ist. Die Prüfgröße

 

 

in der die Daten für die gesamte psychometrische Funktion erfaßt werden, ist deshalb approximativ χ2-verteilt mit m Freiheitsgraden. Vorausgesetzt ist bisher, daß die Parameter Pj bekannt sind. Dies ist jedoch nicht der Fall, sondern die Pj werden über die Formel der psychometrischen Funktion und die Schätzfunktionen  und  aus den Häufigkeiten nj geschätzt. Ersetzt man die Pj im Ausdruck für χ2 durch die Schätzungen , die mit Hilfe der Schätzfunktionen  und  aus der Formel der psychometrischen Funktion F(xj) berechnet werden, dann ergibt sich eine Prüfgröße, die approximativ χ2-verteilt ist mit m-2 Freiheitsgraden. Die Nullhypothese des Tests lautet:

 

 

 

für alle j = 1,...,m, wobei a > 0 und j = 1,...,m. Die Prüfgröße

 

                                                                                                       (2.7)

 

ist approximativ χ2-verteilt mit m-2 Freiheitsgraden.

Damit ist die Hypothese einer logistischen Form der psychometrischen Funktion statistisch überprüfbar. Das Testverfahren liefert durch die Parameterschätzung auch Werte für den ebenmerklichen Unterschied und den konstanten Fehler, da hierfür direkt die Parameter der logistischen Funktion benutzt werden können.

Mehrere psychometrische Funktionen

Alle Überlegungen zur Prüfung der Hypothese H können unabhängig voneinander auch für mehrere Standardreize durchgeführt werden. Jeder Standardreiz ergibt dann eine eigene psychometrische Funktion mit eigenen Parametern. Für jede dieser psychometrischen Funktionen ist ein eigener statistischer Test durchzuführen. Dabei wird für jeden Standardreiz unabhängig von den anderen Standardreizen geprüft, ob die psychometrische Funktion logistisch ist.

Diese Unabhängigkeit der Tests ist allerdings in der Regel nicht erwünscht, da bei mehreren Standardreizen die Hypothese meist eine Aussage über alle psychometrischen Funktionen ist. Auch wir nehmen an, daß bei allen Standardreizen die psychometrische Funktion logistisch ist, wobei jedoch jede psychometrische Funktion eigene Parameter hat. Die hier vorgeschlagene Prüfgröße kann sehr einfach zur Prüfung dieser zusammengesetzten Hypothese benutzt werden, da sie approximativ χ2-verteilt ist. Bei mehreren Standardreizen können die zugehörigen Prüfgrößen addiert werden, und man erhält wieder eine approximativ χ2-verteilte Prüfgröße. Die Freiheitsgrade werden ebenfalls addiert.

Wir benutzen in unserem Experiment 3 Standardreize und wollen die Hypothese prüfen, daß alle psychometrischen Funktionen logistische Form haben. Für jeden Standardreiz wird zuerst die oben beschriebene Auswertung durchgeführt, durch die wir die Parameter as und cs jeder der 3 psychometrischen Funktionen für den entsprechenden Standardreiz s erhalten. Wir berechnen dann für jede psychometrische Funktion die Prüfgröße  nach Gleichung (2.7) und die zugehörige Anzahl von Freiheitsgraden ds. Als Prüfgröße für den zusammengesetzten Test über alle psychometrischen Funktionen wird die Summe aller einzelnen Prüfgrößen  benutzt. Sie ist approximativ χ2-verteilt und die Anzahl der Freiheitsgrade ist gleich der Summe der Freiheitsgrade der einzelnen Prüfgrößen .

Das Webersche Gesetz ist eine Aussage über den Parameter a der psychometrischen Funktion. Es sagt, daß a proportional zum Standardreiz s ist, d.h. es soll eine Konstante δ geben, so daß as = δs. Die Konstante δ ist die Webersche Konstante. Eine einfache Prüfung der Gültigkeit des Weberschen Gesetzes erhält man, wenn in einem Koordinatensystem der Quotient as/s gegen den Wert s abgetragen wird. Gilt das Webersche Gesetz, dann müssen die sich ergebenden Punkte auf einer horizontalen Linie liegen. Da wir diese Graphik nur mit den Schätzwerten  der Parameter as herstellen können, stellt sich auch hier das Problem einer zufallskritischen Prüfung der aufgestellten Hypothese. Eine solche statistische Prüfung wird von Bock und Jones (1968) dargestellt. Wir begnügen uns hier mit einer graphischen Darstellung wie in Abb. 2.2., da in unserem Experiment durch den engen Bereich der verwendeten Standardreize auch eine statistische Prüfung nicht wesentlich aussagekräftiger ist. In der Graphik tragen wir an der Abszisse die Ausprägungen der Standardreize s und an der Ordinate die Quotienten /s ab.

Auswertungsbeispiel

Tabelle 2.1. Rechenschema zur Parameterschätzung. Der Standardreiz ist s = 440 Hz. Die Tabelle enthält jeweils eine Zeile für die Nummer j des Vergleichsreizes, die Differenz xi - s zwischen der Grundfrequenz des Vergleichsreizes und dem Standardreiz, die Anzahl nj und die relativen Häufigkeiten pj der "Ja" - Antworten, verschiedene Zwischengrößen und die nach der Minimum-Logit-Methode geschätzten Antwortwahrscheinlichkeiten . Die Anzahl Nj von Beobachtungen pro Vergleichsreiz ist für jeden Vergleichsreiz 30. Als Parameter der logistischen psychometrischen Funktion ergeben sich =0.815 und =-0.283. Die vorletzte Zeile der Tabelle enthält die mit Hilfe der geschätzten Parameter vorhergesagten Häufigkeiten und die letzte Zeile die χ2-Werte, die sich daraus ergeben. Die Prüfgröße ist die Summe daraus und hat den Wert χ2 = 7.492 bei 5 Freiheitsgraden.

In Tabelle 2.1. sind mit den Daten zum Standardton s = 440 Hz alle Rechenschritte im einzelnen durchgeführt.(Die Frequenzen der Vergleichsreize in den Beispieltabellen sind nicht mit denen identisch, die in dem zu diesem Kapitel gehörenden Experiment verwendet werden.) Für die Berechnung der Parameter empfiehlt sich das Anlegen einer solchen Tabelle, in der jeweils die einzelnen Ausdrücke berechnet werden. Man erhält damit auch ein einfaches Rechenschema, das als Vorlage für ein Computerprogramm zur Datenauswertung dienen kann. Die Berechnungen müssen mit einer Genauigkeit von mindestens 4 Dezimalstellen durchgeführt werden, da sonst zu große Rundungsfehler auftreten. Abbildung 2.1. zeigt die Ergebnisse einer Versuchsperson beim Standardreiz 440 Hz. Neben den Daten ist die logistische Funktion mit den in Tabelle 2.1. berechneten Parametern eingezeichnet. Statt der Frequenz der Vergleichsreize ist in der Tabelle die Differenz xj-s eingetragen. Dies hat den Vorteil, daß die Zahlenwerte der unabhängigen Variablen erheblich kleiner werden und die Berechnungen bei der Parameterschätzung sich dadurch vereinfachen. Bei der Parameterschätzung ergibt sich somit für c nicht der Punkt der subjektiven Gleichheit als Ergebnis, sondern c ist dann der konstante Fehler. Alle anderen Ergebnisse sind davon nicht betroffen. In der Legende der Tabelle 2.1. ist auch der Summand für die Prüfgröße des χ2-Tests und die zugehörige Anzahl der Freiheitsgrade angegeben. Für die hier nicht tabellierten Daten zu den Standardreizen 880 und 1760 Hz ergeben sich die Werte χ2880 = 9.526 und χ21760 = 6.565. Für die Entscheidung, ob die Nullhypothese beibehalten oder abgelehnt wird, summieren wir die χ2-Summen aller Standardreize zu einer einzigen Prüfgröße. Für diese Prüfgröße ergibt sich der Wert χ2 = 23.583. Die Anzahl der Freiheitsgrade ist df = 15. Der kritische Wert des χ2-Tests für ein Signifikanzniveau von α = 0.10 bei 15 Freiheitsgraden ist χ2krit = 30.23. Da die Prüfgröße für die erhobenen Daten kleiner ist als dieser kritische Wert, wird die Nullhypothese beibehalten.

Abbildung 2.2. zeigt einen Vergleich der ebenmerklichen Unterschiede bei den verschiedenen Standardreizen. Die Weber-Brüche sind zwar nicht alle konstant, die Änderung in Abhängigkeit von der Frequenz des Standardreizes ist allerdings gering. Die vorliegenden Daten müssen daher nicht als Widerspruch zum Weberschen Gesetz betrachtet werden.

Abb. 2.2. Der Wert der Weberschen Konstanten bei wachsendem Standardreiz. Aufgetragen ist as/s, also der Quotient aus dem ebenmerklichen Unterschiede und dem Standardreiz. Gilt das Webersche Gesetz, dann müssen alle Punkte auf einer horizontalen Linie liegen. Die Abweichungen sind gering.

Praktikumsaufgabe

Führen Sie das Experiment mit einer Versuchsperson durch. Achten Sie darauf, daß die Lautstärke des Signaltons richtig eingestellt ist bzw. der Lautsprecher etwas abgedeckt ist, falls der Ton nicht einstellbar, aber zu laut ist. Der Signalton des Rechners ertönt kurz, wenn man eingibt

 
   echo Strg-G
 

Die Bezeichnung Strg-G bedeutet, daß man zuerst die Taste mit der Beschriftung Strg drückt, sie niederhält und dann die Taste G drückt. Auf dem Bildschirm erscheint Strg-G als . Achten Sie ferner darauf, daß der Versuchsraum ruhig ist, die Versuchsperson nicht durch Störgeräusche behindert wird und daß zwischen den Blöcken jeweils eine Pause von mindestens 3 min eingelegt wird.

Das Experiment wird durch das Kommando pmfk mit einem Versuchspersonenkode als Argument gestartet. Also

 
   pmfk rudi
 

startet das Experiment mit rudi als Versuchspersonenkode. Das Datenprotokoll in der Ergebnisdatei rudi.res enthält für jeden Vergleichsreiz die Frequenz des Standard- und Vergleichsreizes, die Anzahl der Darbietungen und die Anzahl der "ja"-Antworten, wie sie in der Tabelle 2.1. in der Zeile nj angegeben sind.

1.    Berechnen Sie aus den Daten die Parameter der 3 logistischen Funktionen für die 3 Standardreize. Fassen Sie für die Berechnungen die Durchgänge zum gleichen Standard- und Vergleichsreiz aus den beiden Blöcken, in denen sie vorkommen, zusammen.

2.    Stellen Sie wie in Abb. 2.1. jede der logistischen Funktionen in einer Graphik zusammen mit den empirischen relativen Häufigkeiten dar. Zeichnen Sie in die Graphiken auch die Parameter as und cs der logistischen Funktionen ein. Überprüfen Sie anhand der Graphik die Plausibilität Ihrer Parameterwerte. Die logistische Funktion ist streng monoton steigend und die empirischen relativen Häufigkeiten müssen zufällig so um die Kurvenlinie streuen, daß das arithmetische Mittel der quadrierten Abweichungen möglichst gering ist.

3.    Führen Sie den oben beschriebenen χ2-Test der Hypothese, daß sich die Antwortwahrscheinlichkeiten durch logistische Funktionen beschreiben lassen, durch.

4.    Fertigen Sie eine Graphik nach dem Vorbild von Abb. 2.2. an, in der die Weber-Brüche in Abhängigkeit von der Frequenz des Standardreizes dargestellt sind.

5.    Schreiben Sie einen Kurzbericht in dem in wenigen Sätzen die Fragestellung, die Methoden und die Ergebnisse dargestellt sind. Sprechen Sie darin auch die Ergebnisse der Überprüfung des Weberschen Gesetzes an.

Weiterführende Experimente

Die Herstellungsmethode zur Bestimmung des Punktes der subjektiven Gleichheit

Da bei der Konstanzmethode die Vergleichsreize vor dem Experiment festliegen und zur Parameterschätzung eine wiederholte Darbietung notwendig ist, kann der Zeitaufwand für die Bestimmung der psychometrischen Funktion mit dieser Methode recht groß werden. Dies gilt vor allem dann, wenn sie für verschiedene Standardreize bestimmt werden soll. Ist man nicht an der vollständigen psychometrischen Funktion, sondern nur am Punkt der subjektiven Gleichheit interessiert, wird daher häufig ein anderes Verfahren benutzt, bei dem die Versuchsperson die Reizwerte selbst herstellt, die Herstellungsmethode. In unserem Experiment würde das so aussehen, daß der Versuchsperson der Standardreiz s vorgegeben wird und sie dann die Möglichkeit hat, einen 2. Ton x mit Hilfe eines Reglers so einzustellen, daß er die gleiche Tonhöhe hat wie der Ton s. Bei visuellen Aufgaben sind s und x häufig gleichzeitig zu sehen (vgl. Kap Wahrnehmungstäuschungen). Bei auditiven Aufgaben wird der Standardreiz in der Regel vor dem variablen Reiz dargeboten, kann aber meist beliebig oft abgerufen werden. Die Einstellungen für einen Standardreiz werden in der Regel mehrmals durchgeführt, so daß man über die Streuung der eingestellten Werte auch den ebenmerklichen Unterschied abschätzen kann. Wir werden das Herstellungsverfahren im Kapitel "Wahrnehmungstäuschungen" benutzen, um den Täuschungsbetrag bei einer geometrisch-optischen Täuschung zu bestimmen.

Adaptive Verfahren

Sowohl die Herstellungs- als auch die Konstanzmethode werden heute zum Auffinden des Punktes der subjektiven Gleichheit nur noch selten angewandt. Die Herstellungsmethode hat mehrere Nachteile: Sie erzeugt sehr leicht sequentielle Verzerrungen, die Genauigkeit der Einstellungen hängt von der Motivation der Versuchsperson und von ihrem Anspruchsniveau ab, und die Darbietungszeit des Reizes ist mit ihr nur schwer zu kontrollieren. Gerade letzteres ist in der Wahrnehmungspsychologie ein gravierender Nachteil, da sich viele Effekte bei längerer Betrachtungsdauer verändern. Die Konstanzmethode hat den Nachteil, daß ein einzelner Durchgang verhältnismäßig wenig Information liefern kann, wenn der Bereich, in dem der Punkt der subjektiven Gleichheit liegt, unbekannt ist und daher die Vergleichsreize ungünstig liegen. Man benötigt zur Bestimmung eines einzigen Punktes der Subjektiven Gleichheit mehr als 200 Durchgänge, vorausgesetzt der Wertebereich, in dem das Endergebnis liegt, ist bereits bekannt. Ist dies nicht der Fall, dann können erheblich mehr Beobachtungen notwendig sein, um einen einzigen Punkt der subjektiven Gleichheit zu bestimmen.

In der Psychophysik werden deshalb heute zur Bestimmung des Punktes der subjektiven Gleichheit oder anderer Punkte einer psychometrischen Funktion fast ausschließlich adaptive Verfahren benutzt. Man bietet dabei der Versuchsperson ein Reizpaar (s, xt) an, wobei xt für den Vergleichsreiz im Durchgang t und s für den Standardreiz steht, und läßt sie angeben, ob der Vergleichsreiz xt oder der Standardreiz heller/länger/schwerer/...ist. "Gleich"-Urteile werden nicht zugelassen. Wählt die Versuchsperson s, dann wird der nächste Reiz xt+1 = xt + σt; um den Betrag σt; vergrößert. Wählt sie dagegen xt, dann wird dieser um den Betrag σt; verkleinert. Nach hinreichend vielen Durchgängen wird sich xt etwa um den Punkt der subjektiven Gleichheit einpendeln. Dieses Verfahren kombiniert die Vorteile der Konstanzmethode (einfache Aufgabe der Versuchsperson, exakte Kontrolle über die Darbietungszeit) mit denen der Herstellungsmethode (Vorgabe von Reizen, die viel Information liefern).

Die am häufigsten benutzten adaptiven Verfahren gehen auf Levitt (1971) zurück. Levitt gibt auch ein adaptives Verfahren zur Bestimmung des Punktes x0.707 der psychometrischen Funktion an. Es läßt sich nämlich zeigen, daß sich der Vergleichsreiz nicht bei x0.5, sondern bei x0.707 einpendelt, wenn er nur dann vermindert wird, wenn die Versuchsperson bei zwei Durchgängen mit "ja" antwortet, d.h. ihn in zwei aufeinander folgenden Durchgängen als heller/länger/schwerer/...als den Standardreiz bezeichnet. Bestimmt man nun in einem Experiment gleichzeitig den Punkt der subjektiven Gleichheit x0.5 und den Punkt x0.707, dann kann man daraus den ebenmerklichen Unterschied berechnen.

Das Experiment pmfa ist eine adaptive Version des Experiments pmfk für die gleichen 3 Standardreize. Da am Anfang eines adaptiven Verfahrens nicht bekannt ist, wie weit der Startwert x0 vom Punkt der subjektiven Gleichheit entfernt ist, wird die Schrittgröße σt; am Anfang groß gehalten. Im Laufe des Verfahrens kann die Schrittgröße verkleinert werden, so daß sich am Ende nur noch ein kleiner Unsicherheitsbereich ergibt. Die Änderung der Schrittgröße wird durch die Durchgangsnummer t bestimmt. Wir setzen σt =/t, wobei ; die Anfangsschrittgröße ist. Um einem systematischen Fehler durch die Lage des Anfangswertes vorzubeugen, werden für jeden zu bestimmenden Parameter 2 verschiedene Anfangswerte x0 gewählt, von denen einer sicher über dem Endwert, der andere sicher unter dem Endwert liegt. Dadurch ist am Anfang einer Sequenz die Aufgabe für die Versuchsperson leicht und sie kann sich besser auf diese einstellen.

Eine adaptive Darbietungsfolge wird beendet, wenn die Versuchsperson mindestens 10mal die Antwortrichtung geändert hat. Als Endwert für x benutzen wir das arithmetische Mittel der letzten 8 x-Werte, an denen die Antwortwechsel aufgetreten sind.

Die Datendatei des Experiments pmfa enthält in jeder Zeile folgende Werte: die Frequenz des Standardreizes, einen Indikator, ob es sich um einen x0.5-Wert (2) oder einen x0.707-Wert (3) handelt, einen Indikator, ob der Anfangswert der adaptiven Sequenz unter (1) oder über (2) dem erwarteten Endwert lag, einen Wiederholungszähler, da jeder Parameter in jeder Bedingung 2mal bestimmt wird, der Mittelwert und die Standardabweichung der letzten 8 Umkehrpunkte der adaptiven Sequenz. Eine Zeile aus der Ergebnisdatei könnte also folgendermaßen aussehen:

 
   880.0 2 1 1 877.996 0.805
 
Sie gehört zum Standardreiz 880 Hz, gibt eine Schätzung des Punktes der subjektiven Gleichheit an (2), der Anfangswert lag unter dem erwarteten Endwert (1), und es handelt sich um die erste von 2 Sequenzen zu dieser Bedingung. Der Mittelwert der letzten 8 Umkehrpunkte ist 877.996 Hz und deren Standardabweichung ist 0.805 Hz. Bei der Auswertung dieser Daten ist zu berücksichtigen, daß hier keine spezielle Funktionsform für die psychometrische Funktion angenommen werden muß. 

Literaturhinweise

Sehr gute und leicht verständliche Einführungen in die Methoden der Psychophysik geben Baird und Noma (1978) und Tack (1983). Eine Einordnung psychophysischer Methoden und Ergebnisse in die allgemeine Wahrnehmungspsychologie gibt Prinz (1990). Die statistischen Probleme bei der Schätzung psychometrischer Funktionen werden von Bock und Jones (1968) dargestellt. Diese Autoren benutzen als psychometrische Funktion die Verteilungsfunktion der Normalverteilung, wie das früher allgemein üblich war (Guilford, 1954). Die Vorteile der logistischen Funktion werden von Luce und Galanter (1963) dargestellt. Diese Arbeit ist die erste "moderne", mathematisch orientierte Darstellung der Psychophysik, wie sie von Falmagne (1985) weitergeführt wird.

Versuchsanweisung zur Unterscheidung von Tönen

In diesem Experiment wird untersucht, wie gut man Töne unterscheiden kann. In jedem Durchgang werden Ihnen 2 Töne dargeboten, die sich ganz geringfügig in der Tonhöhe unterscheiden. Den ersten der beiden Töne können Sie als Bezugspunkt benutzen, den zweiten sollen Sie beurteilen. Ihre Aufgabe ist anzugeben, ob der 2. der beiden Töne höher klingt als der erste. Wenn dies der Fall ist, dann drücken Sie bitte auf der Rechnertastatur die Taste mit dem Pfeil nach links, die "ja"-Taste. Klingt der 2. der beiden Töne nicht höher als der erste, dann drücken Sie bitte die Taste mit dem Pfeil nach rechts, die "nein"-Taste.

Sie müssen sich immer für eine der beiden Alternativen entscheiden. Im Zweifelsfall sollten Sie die Taste drücken, die Ihnen eher als richtig erscheint, auch wenn Sie sich nicht ganz sicher sind.

Da sich die beiden Töne immer sehr ähnlich sind, müssen Sie sehr genau auf die Tonhöhen achten. Um es für Sie nicht zu anstrengend werden zu lassen, machen wir jeweils nach etwa 10 min eine Pause von mindestens 3 min, wenn Sie wollen auch mehr. Das ganze Experiment besteht aus 6 Abschnitten dieser Art.

Die Tonpaare, die Sie bearbeiten müssen, stammen aus 3 Tonhöhenbereichen. In jedem Abschnitt werden allerdings nur Töne aus einem Bereich verwendet, so daß jeder Tonhöhenbereich 2mal vorkommt. Das ganze Experiment dauert zusammen mit den Pausen etwa 90 min.

Falls Sie noch Fragen haben, so stellen Sie sie bitte jetzt. Wenn nicht, dann können Sie das Experiment durch Drücken einer beliebigen Taste starten.