Dprime Analyse
1. Unter Berücksichtigung Antwort Bias
Das Modell der Unterscheidungsleistung in der vorherigen Datei diskutiert wird davon ausgegangen, dass, wenn die Zuhörer keinen Unterschied hören, oder sich nicht sicher sind, reagieren sie „gleich“ oder „anders“ zufällig, so dass die Leistung bei Chance. Aber es gibt keine Garantie, dass Zuhörer das tun werden.
Angenommen, Sie waren ein Thema in einer Unterscheidungsaufgabe und Sie wollten 100% Diskriminierung zeigen. Sie könnten „anders“ zu jedem Punkt beantworten. und Sie würden dann 100% richtig auf die verschiedenen Paare bekommen. Sie würden natürlich erhalten auch 0% richtig auf die gleichen Paare, weil man „anders“ zu allen von ihnen beantwortet. In vielen Studien werden die gleichen Paare überhaupt nicht analysiert, und diese Antwort Strategie gut funktionieren würde. Hat dieses Resultat, 100% richtig, bedeutet, dass Sie die Paare sehr gut diskriminiert? Offenbar nicht; Sie haben nicht einmal zu ihnen haben müssen angehört.
Der Punkt ist, dass% richtig auf die verschiedenen Paare allein ist nicht eine sehr sinnvolle Maßnahme der Diskriminierung. Es wird sinnvoll, wenn in Bezug auf den Zuhörer Antwort Bias interpretiert. oder Neigung „gleich“ oder „anders“ zu reagieren. Die Antworten auf die gleichen Paare können als eine Anzeige des Ansprechens Bias verwendet werden.
Dieses Schema wird auch die Reaktionen verwendet Themen zu organisieren und tabellarisch. Das heißt, die (Roh-) Anzahl der Ergebnisse usw., in die 4-Zellen eingegeben. Beachten Sie, dass, wenn die Anzahl des Signals (unterschiedlich) und Kein-Signal (gleiche) Stimuli das gleiche in dem Experiment ist, dann ist die Gesamtzahl der Antworten in der oberen Zeile wird die Gesamtzahl in der unteren Reihe gleich ist (oder, allgemeine, die Summe für jede Zeile wird im Voraus von der Gestaltung des Experiments) bekannt ist; Jedoch wird die Gesamtzahl der Antworten in dem JA-Antwortspalt nicht unbedingt das gleiche sein wie die Gesamtanzahl in der Reaktion NO Spalt und weder Nummer kann im Voraus bekannt sein. Aber, wenn Sie die Anzahl der YES und NO-Studien im Experiment kennen, wissen Sie den Wert in einer Spalte von dem Wert in dem anderes. Z.B. wenn es 20 verschiedene Studien sind, und ein Thema hat 5 Treffer, dann muss das Subjekt 15 Fehlschüsse haben. So werden nur 2 der 4 Zahlen in der Tabelle (1 pro Zeile) plus der Gesamtzahl der Versuche nötig sind, um die Leistung eines Subjekts zu charakterisieren. Dies sind üblicherweise die Hits und Fehlalarme, und diese werden dann als Anteile der Zeilensummen angegeben, die als Schätzungen von Wahrscheinlichkeiten der Antworten betrachtet wiederum sind:
Trefferquote H. Anteil der JA-Studien zu dem Thema reagierte JA = P ( „Ja“ | JA)
Fehlalarmrate F. Anteil von NO-Studien zu dem Thema geantwortet JA = P ( „Ja“ | NO)
Der Tisch kann mit diesen und die anderen 2 Raten neu geschrieben werden, wobei jede Reihe in Höhe von insgesamt bis 1,0; aber die Ergebnisse von Interesse sind, das Paar (H, F). (Vergleichen Sie diese auf den Gesamtanteil richtig, das ist (Hits + Correct Ablehnungen) / alle Antworten.)
Betrachten Sie dann, dass die Leistung der perfekten unterliegt (1,0), während eine zufällige Person hat H = F und unser Thema, die immer Antworten JA haben (1,1). Intuitiv der beste Gegenstand maximiert H (und damit minimiert die Miss-Rate) und minimiert F (und somit maximiert die Correct Rejection Rate); und damit je größer die Differenz zwischen H und F, desto besser ist die Empfindlichkeit des Subjekts. Die Statistik d‘(‚d-prime‘) ist ein Maß für diese Differenz; es ist der Abstand zwischen dem Signal und dem Signal + Rauschen. Jedoch d‘ist nicht nur H-F; es ist vielmehr die Differenz zwischen den z-Transformationen dieser 2 Bewertungen:
Sind weder H noch F kann 0 oder 1 sein kann (wenn ja, Einstellen leicht nach oben oder nach unten). Beachten Sie, dass Z-Scores kann positiv oder negativ sein, so dass Sie die Zeichen in der Subtraktion zu beobachten haben.
Natürlich, ob Sie die Originalproportionen oder die Transformationen verwenden, wenn H = F, dann d ‚= 0 wird die wahr sein, ob die‚Ja‘Rate in der Nähe von 1 oder in der Nähe von 0 ist die höchstmögliche d‘ (größte Empfindlichkeit) 6,93 ist, ist die effektive Grenze 4,65, sind typische Werte von bis zu 2,0 und 69% korrekt für beide verschieden sind und gleichen Prüfungen entspricht ad‘von 1,0 (.99 und .01 verwenden).
Es gibt noch andere Empfindlichkeit Maßnahmen - z eine Transformation anders als z (oder gar nicht überhaupt verwandeln) oder Differential Gewichtung von H und F, und auch alternativer Versionen von d‘(siehe unten) - aber das ist diejenige, die Sie in der Regel in der Sprachforschung sehen.
3. Wie d‘für Ihre Daten zu erhalten.
Sie könnten berechnen H und F, wandeln sie in die Z-Scores, und sie subtrahieren. M-C Tabelle A5.1 in Anhang 5 gibt das Z-Score Konvertierungen.
M-C erstes Beispiel für H und F erhalten:
So ist die Trefferquote H 20/25 oder 0,8
die Miss-Rate ist 5/25 oder .2 (diese 2 addieren sich zu 1,0)
die Fehlalarmrate ist 10/25, oder 0,4
Die korrekte Zurückweisungsrate ist 15/25, oder 0,6 (diese 2 addieren sich zu 1,0)
und (H, F) Paar (0,8, 0,4)
z (H) = 0,842 und z (f) = -0,253
d‘= 0,824 - (- 0,253) = 1 095
Colin Wilson hat bereitgestellt seine Excel-Formel: d‘= NORMINV (Hit-Rate, 0,1) - NORMINV (Falschalarmrate, 0,1)
„Gibt die Inverse der Normalverteilung für den angegebenen Mittelwert und Standardabweichung“, wo Excel NORMINV, wobei 0 die angegebene Mittelwert und 1 die angegebene SD zu sein.
Aber siehe 13 unten für verschiedene d‘Berechnungen für verschiedene experimentelle Designs, einschließlich unserer AX Diskriminierung.
4. Einige Verwendung von d‘in der Diskriminierung Literatur.


Manchmal H und CR werden hinzugefügt korrekten einen Anteil zu erhalten (für alle Paare, nicht nur für verschiedene Paare), die dann arcsin transformierten und in üblichen Weise analysiert. Siehe Sussman - Carney, Francis - Ciocca. Aber siehe M-C p.100ff über die Gefahren des Anteils korrekt ( „eine unerwartet theoriebeladen Statistik“).
Bias ist als die Neigung des Subjekts gemessen „yes“ (oder „nein“) zu sagen. Die Bias-Maßnahme c ist eine Funktion des H + F. Aber niemand in Rede Forschung scheint es zu berichten, so werden wir nicht decken, wie es zu berechnen.
6. Zwei Modelle der AX Diskriminationsleistung
Wie viel Unterschied wird diese machen in einem Experiment zu analysieren? Betrachten M-C ist beispielsweise in (11) oben, für das (0,8, 0,4) Paar: d‘war
1. 095. Dieses Paar auf S.. 347 von Tabelle A5.4, mit d‘von 2,35. Vergleichen Sie auch die Werte in der Datei „einig Beispiel dprime.xls“. (Einige Werte müssen noch nachgeschlagen werden - versuchen, diese selbst.) Die Unterschiede groß sein können, aber es könnte keine Rolle, wenn nach der gleichen Methode berechneten Werten verglichen werden.
7. Anwenden von Detektionstheorie Identifikationsdaten
In der Tat, indem wie folgt subtrahiert, die Antworten (sagen wir, die / l / Antworten) an einen Stimulus als die HITS behandelt, und die Reaktionen (mit der gleichen Antwortkategorie) zur nächsten Stimulus werden über als Fehlalarme behandelt.
Paarweisen Vergleich der Identifizierungsantworten wird durch M-C auf den Seiten beschrieben. 212-13. Es ist jedoch nicht klar, dass sie es direkt als Maß für Wahrnehmungsabstand verwenden würden.
9. Einige Begriffe und Modelle in M-C
"One-Intervall Diskriminierung": "one-Intervall" bezeichnet einen Stimulus in einem Versuch; „Diskriminierung“ bedeutet, zu sagen, die verschiedenen Reize des Experiments abgesehen von unterschiedlichen Antworten von der verfügbaren Menge Auswahl (nicht der Versuch!) - so, verwechselbar, dies bezieht sich auf das, was wir Identifizierung nennen. Diese sind von zwei Arten:
- „Ja-Nein“: nur 2 Antworten zur Verfügung stehen; z.B. für jeden der Reize, ist es eine Sie bisher gesehen haben (ja) oder nicht (nein, es ist neu); ist es ein Z (Ja) oder nicht (nein, es ist ein Y). d‘wird wie zuvor berechnet, obwohl dies setzt voraus, dass es eine bekannte, korrigiert, Antwort für jeden Stimulus, der aus einem Kontinuum gezogen nicht der Fall für die Identifizierung von Stimuli ist.
- „Bewertung“: mehr als 2 Antworten zur Verfügung stehen, auf einer Skala, z.B. 1 bis 5, wobei die 2-Endpunkt-Antworten hohe Sicherheit Siehe M-C pp. 61ff anzuzeigen. für wie H und FA in der Bewertung Experimente zu berechnen. Siehe auch S.. 79ff nach Alternativen zum Rating-Design, bei denen mehrere Bedingungen verwendet Vorspannung zu manipulieren.
„Zwei Intervall“: 2 Stimuli pro Versuch
„2AFC“: welche diese zwei Reize? (Beispielsweise das man Sie haben vor (gesehen Erkennung), die man kam zum ersten (zeitlichen Reihenfolge), die man bringt die Eingabeaufforderung (Identifikation))
M-C sagt, dass ein 2AFC Design ist besser als Ja-Nein-Erkennung, wenn von vornherein Vertrautheit ein wahrscheinliches confound ist; Sondern weil 2AFC einfacher für Themen ist, d‘wird um einen Faktor von etwa 0,7 gesenkt. Sie stellen ferner fest, dass, da diese Gestaltung Bias zu minimieren neigt (zumindest für die gleichzeitige optische Darstellung von Stimulus-Paare), Prozent korrekt ist kein schlechtes Maß für die Empfindlichkeit.