Die magische Nummer Sieben, plus oder minus zwei: Einige Grenzen über unsere Kapazität für Informationsbearbeitung

Die magische Nummer Sieben, plus oder minus zwei: Einige Grenzen über unsere Kapazität für Informationsbearbeitung
Copyright © musanim.com
For original English text, go to: http://www.musanim.com
Translated by A.Romanova

durch George A. Miller

ursprünglich veröffentlicht in The Psychological Review, 1956, vol. 63, Seiten 81-97
(wieder hervorgebracht hier, mit der Autorerlaubnis, durch Stephen Malinowski)

Inhaltverzeichnis

Mein Problem besteht darin, dass ich durch eine ganze Zahl verfolgt worden bin. Seit sieben Jahren ist diese Zahl mir ringsherum gefolgt, hat sich in meinen privaten Daten eingedrängt, und hat mich aus den Seiten unserer meisten öffentlichen Zeitschriften angegriffen. Diese Zahl nimmt eine Vielfalt von Verkleidungen an, manchmal ein wenig größer seiend und manchmal ein wenig kleiner als üblich, aber nie sich so viel ändernd, um nicht wiederzuerkennend zu sein. Die Beharrlichkeit, womit dieser Zahl mich plagt,  ist weit mehr als ein zufälliger Unfall. Es gibt da sich auf einen berühmten Senator zu berufen, ein Design dahinter, einige Muster regeln seine Erscheinung. Entweder dort wirklich etwas Ungewöhnliches über die Zahl gibt, oder ich unter Wahnvorstellungen der Verfolgung leide.

Ich soll meine Vorgeschichte beginnen, indem ich Ihnen über einige Experimente erzählen, die geprüft darüber sind, wie genau Leute Zahlen den Umfängen von verschiedenen Aspekten eines Stimulus zuteilen können. Auf der traditionellen Sprache der Psychologie würden diese Experimente im absoluten Urteil genannt. Historischer Unfall hat jedoch angeordnet, dass sie einen anderen Namen haben sollten. Wir nennen sie jetzt Experimente auf der Menschkapazität, damit Information zu übersenden. Seitdem diese Versuche ohne die Erscheinung der Informationstheorie über die psychologische Szene nicht angestellt worden sein würden, und da die Ergebnisse in Bezug auf die Konzepte der Informationstheorie analysiert werden, soll ich meine Diskussion zur Einleitung mit einigen Bemerkungen über diese Theorie führen.

Informationsmaß

Der “Informationsbetrag” ist genau dasselbe Konzept, darüber wir seit Jahren unter dem Namen “der Abweichung” gesprochen haben. Die Gleichungen sind verschieden, aber wenn wir uns dicht zur Idee halten, dass irgendetwas, was die Abweichung auch vergrößert, um den Informationsbetrag vergrößert, können wir nicht weit vom Weg abkommen.

Die Vorteile dieser neuen Sprechweise über die Abweichung sind einfach genug. Abweichung wird immer in Bezug auf die Maßeinheit – Zoll, Pfunden, Volt usw. festgesetzt – wohingegen der Informationsbetrag ist eine dimensionslose Kennzahl. Da die Information in einem getrennten statistischen Vertrieb von der Maßeinheit nicht abhängt, können wir das Konzept zu Situationen erweitern, wo wir keine Metrik haben und normalerweise würden wir nicht denken, die Abweichung zu verwenden. Und auch gibt uns die Möglichkeit die erhaltene Ergebnisse in ziemlich verschiedenen experimentellen Situationen zu vergleichen, wo es sinnlos wäre, um die gestützte Abweichungen auf der verschiedenen Metrik zu vergleichen. Also gibt es einige gute Gründe dafür, das neuere Konzept anzunehmen.

Die Ähnlichkeit der Abweichung und der Informationsbetrag könnten dadurch erklärt werden: Wenn wir eine große Abweichung haben, sind wir darüber sehr unwissend, was wird dabei geschehen. Wenn wir sehr unwissend darüber sind, dann wenn wir Beobachtungen machen, gibt uns viel Information. Andererseits, wenn die Abweichung sehr klein ist, wissen wir im Voraus, wie unsere Beobachtung herauskommen muss, so bekommen wir wenig Information davon, damit die Beobachtung zu machen.

Wenn Sie sich jetzt ein Kommunikationssystem vorstellen werden, werden Sie begreifen, dass es sehr viel Veränderlichkeit darüber gibt, was ins System gescheht und auch sehr viel Veränderlichkeit darüber, was herauskommt. Der Eingabe und die Ausgabe können deshalb in Bezug auf ihre Abweichung (oder ihre Information) beschrieben werden. Wenn es ein gutes Kommunikationssystem jedoch gibt, muss es etwas systematische Beziehung dazwischen geben, was hineingeht, und was herauskommt. Das heißt, wird die Ausgabe von der Eingabe abhängen, oder wird mit dem Eingabe aufeinander bezogen. Wenn wir diese Korrelation messen, dann können wir sagen, wie viel die Ausgabeabweichung der Eingabe zuzuschreibend ist, und wie viel wegen zufälliger Schwankungen oder “Geräusches” ist, das durch das System während der Übertragung eingeführt ist. So sehen wir, dass das Maß der übersandten Information einfach ein Maß der Ein-Ausgabekorrelation ist.

Es gibt zwei einfache Regeln dazu folgen. Wann auch immer ich mich auf den “der Informationsbetrag” beziehe, dann werden Sie “Abweichung” verstehen. Und wann auch immer ich mich auf den “Betrag der übersandten Informationsbetrag” beziehe, werden Sie “Kovarianz” oder “Korrelation” verstehen.

Die Situation kann grafisch durch zwei teilweise überlappende Kreise beschrieben werden. Dann kann der linke Kreis genommen werden, um die Abweichung der Eingabe, der richtige Kreis die Abweichung der Produktion und das Übergreifen die Ein-Ausgabekovarianz zu vertreten. Ich soll vom linken Kreis als der Betrag der Eingabeinformation, der richtige Kreis als der Betrag der Ausgabeinformation und das Übergreifen als der übersandte Informationsbetrag sprechen.

In den Experimenten auf dem absoluten Urteil, der Beobachter wird als ein Kommunikationskanal betrachtet. Dann würde der linke Kreis den Informationsbetrag in den Stimuli vertreten, der richtige Kreis vom Informationsbetrag in seinen Antworten und die Überschneidung die Korrelation der Stimulus-Antwort, wie gemessen, durch den Betrag der übersandten Information vertreten. Das experimentelle Problem besteht darin, den Betrag der Eingabeinformation zu vergrößern und den übersandten Informationsbetrag zu messen. Wenn die absoluten Urteile des Beobachters ziemlich genau sind, dann wird fast die ganze Eingabeinformation übersandt und wird von seinen Antworten wiederherstellbar sein.

Wenn er Fehler macht, kann die übersandte Information beträchtlich weniger sein als die Eingabe. Wir erwarten, als wir den Betrag der Eingabeinformation vergrößern, der Beobachter beginnt immer mehr Fehler zu machen; wir können die Grenzen der Genauigkeit seiner absoluten Urteilsfähigkeit prüfen. Wenn der menschliche Beobachter eine angemessene Art des Kommunikationssystems ist, dann wenn wir den Betrag der Eingabeinformation vergrößern, wird die übersandte Information zuerst zunehmen und wird sich schließlich bei einem asymptotischen Wert einpendeln. Dieser asymptotische Wert nehmen wir, um die Kanalkapazität des Beobachters zu sein: Es vertritt den größten Betrag der Information, die er uns über den Stimulus auf der Grundlage von einer absoluten Urteilsfähigkeit geben kann. Die Kanalkapazität ist die obere Grenze auf dem Ausmaß, in dem der Beobachter seine Antworten auf die Stimuli vergleichen kann, die wir ihm darstellen.

Jetzt nur kurz darauf Bit eingehen und können wir beginnen auf einigen Daten untersuchen. Ein Informationsbit ist der Informationsbetrag, damit wir eine Entscheidung zwischen zwei gleich häufig Alternativen treffen müssen. Wenn wir entscheiden müssen, ob ein Mann weniger als sechs Fuß hoch oder mehr als sechs Fuß hoch ist, und wenn wir wissen, dass die Chancen 50-50 sind, dann brauchen wir ein Informationsbit. Bemerken Sie, dass sich diese Einheit der Information in jedem Fall auf die Längeneinheit nicht bezieht, die wir – Fuß, Zoll, Zentimeter usw. verwenden. Jedoch messen Sie die Höhe des Mannes, wir brauchen noch gerade ein Informationsbit.

Es gibt zwei Weisen, wie wir den Betrag der Eingabeinformation vergrößern könnten. Wir konnten die Rate vergrößern, an der wir die Information dem Beobachter geben, so dass der Informationsbetrag pro Einheitszeit zunehmen würde. Oder wir konnten die Zeitvariable völlig ignorieren und den Betrag der Eingabeinformation vergrößern, indem wir die Zahl von alternativen Stimuli gesteigert haben. Im absoluten Urteil-Experiment interessieren wir uns für die zweite Alternative. Wir geben dem Beobachter so viel Zeit, wie er seine Antwort machen will; wir steigern einfach die Zahl von alternativen Stimuli, unter denen er muss sich unterscheiden und nachsuchen, wo Verwirrungen beginnen vorzukommen. Verwirrungen werden in der Nähe vom Punkt erscheinen, dass wir seine “Kanalkapazität” nennen.

Absolute Urteile von eindimensionalen Stimuli

Lassen Sie jetzt uns denken, was geschieht, wenn wir absolute Urteile von Tönen machen. Pollack [17]fragte Zuhörer, um Töne zu identifizieren durch Zuordnung von Ziffern zu ihnen. Die Töne waren verschieden bezüglich der Frequenz, und haben die Reihe von 100 bis 8000 Hz in gleichen logarithmischen Schritten bedeckt. Ein Ton wurde erklingen lassen, und der Zuhörer hat geantwortet, indem er eine Ziffer gegeben hat. Nachdem der Zuhörer seine Antwort gegeben hatte, wurde ihm die richtige Identifizierung des Tons gesagt.

Als nur zwei oder drei Töne verwendet wurden, haben die Zuhörer sie nie verwirrt. Mit vier verschiedenen Tönen waren Verwirrungen ziemlich selten, aber mit fünf oder mehr Tönen waren Verwirrungen häufig. Mit vierzehn verschiedenen Tönen haben die Zuhörer viele Fehler gemacht.

Abbildung 1. Daten aus Pollack [17, 18] auf dem Informationsbetrag, die von Zuhörern übersandt wird, die absolute Urteile des Gehörwurfs machen. Weil der Betrag der Eingabeinformation durch die Erhöhung von 2 bis 14 Zahl von verschiedenen Tonhöhe vergrößert wird, der Betrag von übersandten Informationsannäherungen als seine obere Grenze eine Kanalkapazität von ungefähr 2.5 Bit pro Urteil zu beurteilen sind.

Diese Daten werden in der Abb. 1 gezeichnet. Am Fuß entlang gibt es der Betrag der Eingabeinformation in Bit pro Stimulus. Weil die Zahl von alternativen Tönen von 2 bis 14, die Eingabeinformation gesteigert wurde, die von 1 bis 3.8 Bit vergrößert ist. Auf der Ordinate wird der Betrag der übersandten Information gegenzeichnet. Der Betrag der übersandten Information benimmt sich ziemlich wie wir annehmen würden, wie sich ein Kommunikationskanal benimmt; die übersandte Information nimmt geradlinig bis zu ungefähr 2 Bit zu und biegt sich dann von zu einer Asymptote an ungefähr 2.5 Bit. Dieser Wert, 2.5 Bit, deshalb ist was wir die Kanalkapazität des Zuhörers für absolute Urteile der Tonhöhe nennen.

So, jetzt haben wir die Zahl 2.5 Bit. Was bedeutet das? Zuerst bemerken Sie, 2.5 Bits entspricht ungefähr sechs gleich wie Alternativen. Das Ergebnis bedeutet, dass wir mehr als sechs verschiedene Tonhöhe nicht aufpicken können, die der Zuhörer nie verwechseln wird. Oder, etwas anderes angegeben, egal wie viele Alternative für Töne, die wir ihn zu urteilen bitten, das Bestes, darauf wir erwarten können, es das zu tun, ist sie zu ungefähr sechs verschiedenen Klassen ohne Fehler zuteilen. Oder, wieder, wenn wir wissen, dass es N alternative Stimuli gab, dann ermöglicht sein Urteil uns, den besonderen Stimulus zu einem aus N/6 zu beschränken.

Die meisten Menschen sind überrascht, dass die Zahl genauso klein wie sechs ist. Natürlich gibt es Beweise, dass eine musikalisch hoch entwickelte Person mit der absoluten Tonhöhe, kann genau irgendwelche von 50 oder 60 verschiedenen Tonhöhe identifizieren. Glücklicherweise habe ich keine Zeit, um diese bemerkenswerten Ausnahmen zu besprechen. Ich sage, dass es glücklich ist, weil ich nicht weiß, wie man ihre höhere Leistung erklärt. So soll ich bei mehreren Fußgängertatsache bleiben, dass die meisten von uns ungefähr einen aus nur fünf oder sechs Tonhöhe identifizieren können, bevor wir beginnen, verwirrt zu werden.

Es ist interessant zu betrachten, dass Psychologen Sieben-Punkte-Beurteilungsskalen seit langem auf der intuitiven Basis verwendet haben, versuchen das in feinere Kategorien zu bewerten, fügt nicht viel zur Nützlichkeit der Bewertungen hin. Die Pollacks Ergebnisse zeigen an, mindestens für Tonhöhe, diese Intuition ist ziemlich in Ordnung.

Als nächstes können Sie fragen, wie reproduzierbar dieses Ergebnis ist. Hängt es vom Abstand der Töne oder den verschiedenen Bedingungen des Urteils ab? Pollack hat diese Bedingungen auf mehrere Weisen geändert. Die Reihe von Frequenzen kann durch einen Faktor von ungefähr 20 geändert werden ohne den Informationsbetrag zu ändern, übergesandet als einen kleinen Prozentsatz. Verschiedene Gruppierungen von Tonhöhen haben die Übertragung vermindert, aber der Verlust war klein. Zum Beispiel, wenn Sie fünf hohe Töne in einer Reihe und fünf tiefe Töne in einer anderen Reihe unterscheiden können, ist es angemessen zu erwarten, dass Sie alle zehn in eine einzelne Reihe verbinden und ihnen allen noch einzeln ohne Fehler erzählen konnten. Wenn Sie es jedoch versuchen, funktioniert das nicht. Die Kanalkapazität für Tonhöhe scheint ungefähr sechs zu sein, und das ist das Beste, das Sie tun können.

Während wir uns auf Tönen befinden, wollen wir uns als nächstes an der Arbeitslautheit von Garners [7] schauen. Die Garners Daten für die Lautheit werden in der Abb. 2 zusammengefasst. Garner gab sich die Mühe, um den bestmöglichen Abstand seiner Töne über die Intensitätsreihe von 15 bis 110 DB zu bekommen. Er hat 4, 5, 6, 7, 10, und 20 verschiedene Stimulus-Intensitäten verwendet. Die gezeigten Ergebnisse in der Abb. 2 ziehen die Unterschiede unter Themen und dem folgenden Einfluss des sofort vorhergehenden Urteils in Betracht. Wieder finden wir es scheint eine Grenze damit zu geben. Die Kanalkapazität für absolute Urteile der Lautheit ist 2.3 Bit, oder ungefähr fünf vollkommen unterscheinbaren Alternativen.

Abbildung 2. Daten aus Garner [7] auf der Kanalkapazität für absolute Urteile der Gehörlautheit.

Seitdem diese zwei Studien in verschiedenen Laboratorien mit ein bisschen verschiedenen Techniken und Methoden der Analyse getan wurden, sind wir nicht in einer guten Position zu streiten, ob fünf Lautheiten von sechs Lautheiten sehr verschieden sind. Wahrscheinlich ist der Unterschied in der richtigen Richtung, und absolute Urteile der Lautheit sind ein bisschen genauer als absolute Urteile der Lautheit. Der wichtige Punkt ist jedoch, dass die zwei Antworten derselben Größenordnung sind.

Der Versuch ist auch für Geschmack-Intensitäten angestellt worden. In der Abb. 3 gibt es die Ergebnisse, die durch das Beebe-Zentrum, Rogers und O’Connell [1] für absolute Urteile der Konzentration von Salz-Lösungen erhalten sind. Die Konzentrationen eingeordnet aus 0.3 bis 34.7 gm. NaCl pro 100-Cc Leitungswasser in gleichen subjektiven Schritten. Sie haben 3, 5, 9, und 17 verschiedene Konzentrationen verwendet. Die Kanalkapazität ist 1.9 Bit, der ungefähr vier verschiedene Konzentrationen ist. So scheinen Geschmack-Intensitäten ein wenig weniger kennzeichnend als Gehörstimuli, aber wieder ist die Größenordnung nicht weit entfernt.

Abbildung 3. Daten aus Beebe-Zentrum, Rogers und O’Connell [1] über Kanalkapazität für absolute Urteile der Salzigkeit.

Abbildung 4. Daten aus Hake und Garner [8] über Kanalkapazität für absolute Urteile der Position eines Zeigestocks in einem geradlinigen Zwischenraum.

Andererseits, die Kanalkapazität für Urteile der optischen Stellung scheint bedeutsam größer zu sein. Hake und Garner [8] fragten die Beobachter visuell zwischen zwei Skala-Markierungen zu interpolieren. Ihre Ergebnisse werden in der Abb. 4 gezeigt. Sie haben den Versuch auf zwei Weisen angestellt. In einer Version lassen sie den Beobachter jede Zahl zwischen der Null und 100 verwenden, um die Position zu beschreiben, obwohl sie Stimuli nur an 5, 10, 20, oder 50 verschiedene Positionen präsentiert haben. Die Ergebnisse mit dieser unbegrenzten Ansprechtechnik werden durch die gefüllten Kreise auf dem Graphen gezeigt. In der anderen Version wurden die Beobachter in ihren Antworten auf das Melden gerade jener Stimulus-Werte beschränkt, die möglich waren. Das heißt, in der zweiten Version die Zahl von verschiedenen Antworten, die der Beobachter machen konnte, war genau dasselbe als die Zahl von verschiedenen Stimuli, die der Experimentator präsentieren könnte. Die Ergebnisse mit dieser beschränkten Ansprechtechnik werden durch die offenen Kreise auf dem Graphen gezeigt. Die zwei Funktionen sind so ähnlich, dass es schön scheint zu beschließen, dass die Zahl aus Antworten, verfügbaren für den Beobachter, hatte nichts mit der Kanalkapazität von 3.25 Bit zu tun.

Das Hake-Garner Experiment ist von Coonan und Klemmer wiederholt worden. Obwohl sie ihre Ergebnisse noch nicht veröffentlicht haben, haben sie mir Erlaubnis gegeben zu sagen, dass sie Kanalkapazitäten im Intervall von 3.2 Bit für sehr kurze Aussetzungen der Zeigestock-Position zu 3.9 Bit für längere Aussetzungen erhalten haben. Diese Werte sind ein bisschen höher als Hake und Ganers, so müssen wir beschließen, dass es zwischen 10 und 15 verschiedenen Positionen entlang einem geradlinigen Zwischenraum gibt. Das ist die größte Kanalkapazität, die für jede eindimensionale Variable gemessen worden ist.

Zurzeit, diese vier Experimente auf absoluten Urteilen von einfachen, eindimensionalen Stimuli vetreten alles, was in den psychologischen Zeitschriften erschienen sind. Jedoch sehr viel Arbeit an anderen Stimulus-Variablen in den Zeitschriften ist noch nicht erschienen. Zum Beispiel haben Eriksen und Hake [6] gefunden, dass die Kanalkapazität, für die Größen von Quadraten zu beurteilen, 2.2 Bit, oder ungefähr fünf Kategorien unter einer breiten Reihe von experimentellen Bedingungen ist. In einem getrennten Experiment Eriksen [5] hat 2.8 Bit für die Größe, 3.1 Bit für den Farbton und 2.3 Bit für die Helligkeit gefunden. Geldard hat die Kanalkapazität für die Haut gemessen, durch das Stellen von Vibratoren auf dem Brust-Gebiet. Ein guter Beobachter kann ungefähr vier Intensitäten, ungefähr fünf Dauern und ungefähr sieben Positionen identifizieren.

Eine der energischsten Gruppen in diesem Gebiet wurde die Air Force Operational Applications Laboratory gewesen. Pollack wurde so nett gewesen, mir die Ergebnisse von ihrer Maße für mehrere Aspekte von Sichtanzeigen mitzuteilen. Sie haben Maße für das Gebiet und für die Krümmung, Länge und Richtung von Linien gemacht. In einem Satz von Experimenten haben sie eine sehr kurze Aussetzung des Stimulus – 1/40 zweit verwendet – und dann haben sie die Maße mit einer 5 Sekunde Aussetzung wiederholt. Für das Gebiet haben sie 2.6 Bit mit der kurzen Aussetzung und 2.7 Bit mit der langen Aussetzung bekommen. Für die Länge einer Linie haben sie ungefähr 2.6 Bit mit der kurzen Aussetzung und ungefähr 3.0 Bit mit der langen Aussetzung bekommen. Richtung oder Neigungswinkel haben 2.8 Bit für die kurze Aussetzung und 3.3 Bit für die lange Aussetzung gegeben. Krümmung war anscheinend härter zu urteilen. Als die Bogenlänge unveränderlich war, war das Ergebnis an der kurzen Aussetzungsdauer 2.2 Bit, aber als die Länge des Akkords konstant war, war das Ergebnis nur 1.6 Bit. Dieser letzte Wert ist am niedrigsten, den jeder bis heute gemessen hat. Ich sollte jedoch hinzufügen, dass diese Werte passend sind, ein bisschen zu niedrig zu sein, weil die Daten aus allen Themen vereint wurden, bevor die übersandte Information geschätzt wurde.

Lassen Sie uns jetzt sehen, wo wir uns befinden. Erstens scheint die Kanalkapazität wirklich, ein gültiger Begriff zu sein, um menschliche Beobachter zu beschreiben. Zweitens haben die Kanalkapazitäten für diese eindimensionale Variablen reichen von 1.6 Bit für die Krümmung bis 3.9 Bit für Positionen in einem Zwischenraum gemessen. Obwohl es keine Frage gibt, dass die Unterschiede unter den Variablen echt und bedeutungsvoll sind, ist die eindrucksvollere Tatsache zu mir ihre beträchtliche Ähnlichkeit. Wenn ich die besten Schätzungen nehme, kann ich der Kanalkapazitäten für alle Stimulus-Variablen bekommen, die ich erwähnt habe, das heißt 2.6 Bit und die Standardabweichung ist nur 0.6 Bit. In Bezug auf unterscheidbare Alternativen diese Bedeutung entspricht ungefähr 6.5 Kategorien, eine Standardabweichung schließt von 4 bis 10 Kategorien ein, und die Gesamtreihe ist von 3 bis 15 Kategorien. In Anbetracht des großen Angebots an verschiedenen Variablen, die studiert worden sind, finde ich das eine ungewöhnlich kleine Reihe zu sein.

Es scheint, eine Beschränkung zu geben, die in uns entweder durch das Lernen oder durch das Design unserer Nervensysteme eingebaut ist, eine Grenze, die unsere Kanalkapazitäten in dieser allgemeinen Reihe behält. Auf der Grundlage von den gegenwärtigen Beweisen scheint es sicher zu sagen, dass wir eine begrenzte und ziemlich kleine Kapazität besitzen, um solche eindimensionale Urteile zu machen, und dass sich diese Kapazität viel von einem einfachem Sinnesattribut bis einen anderen nicht ändert.

Absolute Urteile von mehrdimensionalen Stimuli

Sie können bemerkt haben, dass ich darauf vorsichtig sahte, dass diese magische Nummer sieben für eindimensionale Urteile gilt. Tägliche Erfahrung lehrt uns, dass wir genau irgendwelche von mehreren hundert Gesichtern, irgendwelche von mehreren tausend Wörtern, irgendwelche von mehreren tausend Gegenständen usw. identifizieren können. Die Geschichte würde sicher nicht abgeschlossen sein, wenn wir an diesem Punkt anhalten würden. Wir müssen etwas Verstehen dessen haben, warum die eindimensionalen Variablen, die wir im Laboratorium beurteilen, Ergebnisse bis jetzt aus der Linie damit geben, was wir ständig in unserem Verhalten außerhalb des Laboratoriums tun. Eine mögliche Erklärung liegt in der Zahl unabhängig variabler Attribute der Stimuli, die beurteilt werden. Gegenstände, Gesichter, Wörter, unterscheiden sich und ähnlich von einander auf viele Weisen, wohingegen sich die einfachen Stimuli, die wir so weit gedacht haben, von einander in nur einer Rücksicht unterscheiden.

Glücklicherweise gibt es einige Daten darauf, darüber was geschieht, wenn wir absolute Urteile von Stimuli machen, die sich von einander auf mehrere Weisen unterscheiden. Lassen Sie uns erst auf die Ergebnisse aussehen, die Klemmer und Frick [13] wegen des absoluten Urteils der Position eines Punkts in einem Quadrat gemeldet haben. In der Abb. 5 sehen wir ihre Ergebnisse. Jetzt scheint die Kanalkapazität, zu 4.6 Bit zugenommen zu haben, was bedeutet, dass Leute genau irgendwelche von 24 Positionen im Quadrat identifizieren können.

Abbildung 5. Daten von Klemmer und Frick [13] auf der Kanalkapazität für absolute Urteile der Position eines Punkts in einem Quadrat.

Die Position eines Punkts in einem Quadrat ist klar ein zweidimensionaler Vorschlag. Sowohl sein horizontales als auch seine vertikale Position müssen identifiziert werden. So scheint es natürlich, die 4.6-Bit-Kapazität für ein Quadrat mit der 3.25-Bit-Kapazität für die Position eines Punkts in einem Zwischenraum zu vergleichen. Der Punkt im Quadrat verlangt zwei Urteile des Zwischenraum-Typs. Wenn wir eine Kapazität von 3.25 Bit haben, um Zwischenräume zu schätzen, und wir das zweimal tun, sollten wir 6.5 Bit als unsere Kapazität bekommen, um Punkte in einem Quadrat ausfindig zu machen. Das Hinzufügen der zweiten unabhängigen Dimension gibt uns eine Zunahme von 3.25 bis 4.6, aber es bleibt hinter der vollkommenen Hinzufügung zurück, die 6.5 Bit geben würde.

Ein anderes Beispiel wird durch das Beebe-Zentrum, Rogers und O’Connell [1] zur Verfügung gestellt. Als sie Leute gebeten haben, sowohl die Salzigkeit als auch die Süßigkeit von Lösungen zu identifizieren, die verschiedene Konzentrationen von Salz und Rohrzucker enthalten, haben sie gefunden, dass die Kanalkapazität 2.3 Bit war. Seitdem die Kapazität für Salz allein 1.9 war, könnten wir ungefähr 3.8 Bit erwarten, wenn die zwei Aspekte der zusammengesetzten Stimuli unabhängig beurteilt wurden. Als mit Raumpositionen fügt die zweite Dimension etwas zur Kapazität hinzu, aber nicht so viel wie es denkbar könnte.

Ein drittes Beispiel wird von Pollack [18] zur Verfügung gestellt, wer Zuhörer gebeten hat, sowohl die Lautheit als auch die Tonhöhe von reinen Tönen zu beurteilen. Da Stimmlage 2.5 Bit und Lautheit 2.3 Bit gibt, könnten wir hoffen, so viel wie 4.8 Bit für die Tonhöhe und die Lautheit zusammen zu bekommen. Pollack hat 3.1 Bit erhalten, der wieder anzeigt, dass die zweite Dimension die Kanalkapazität, aber nicht so viel vermehrt, wie es könnte.

Ein viertes Beispiel kann von der Arbeit von Halsey und Chapanis [9] auf Verwirrungen unter Farben der gleichen Klarheit gezogen werden. Obwohl sie ihre Ergebnisse in Informationsbegriffen nicht analysiert haben, schätzen sie ein, dass es ungefähr 11 bis 15 identifizierbare Farben, oder in unseren Begriffen, ungefähr 3.6 Bit gibt. Seitdem sich diese Farben sowohl im Farbton als auch in der Sättigung geändert haben, ist es wahrscheinlich richtig, um das als ein zweidimensionales Urteil zu betrachten. Wenn wir das mit 3.1 Bit von Eriksen für den Farbton vergleichen (der ein zweifelhafter Vergleich ist, um zu ziehen), haben wir wieder etwas weniger als vollkommene Hinzufügung, wenn eine zweite Dimension hinzugefügt wird.

Es ist noch ein langer Weg jedoch von diesen zweidimensionalen Beispielen bis die mehrdimensionalen Stimuli, die durch Gesichter, Wörter usw. zur Verfügung gestellt sind. Um diese Lücke zu schließen, haben wir nur ein Experiment, eine Gehörstudie, die von Pollack und Ficks [19] getan ist. Sie haben geschafft, sechs verschiedene akustische Variablen zu bekommen, die sie ändern konnten: Frequenz, Intensität, Rate der Unterbrechung, rechtzeitig Bruchteil, Gesamtdauer und Raumposition. Jede von dieser sechs Variablen konnte irgendwelche von fünf verschiedenen Werten annehmen, so zusammen gab es 56, oder 15,625 verschiedene Töne, dass sie präsentieren konnten. Die Zuhörer haben eine getrennte Schätzung für jede dieser sechs Dimensionen gemacht. Unter diesen Bedingungen war die übersandte Information von 7.2 Bit, der ungefähr 150 verschiedenen Kategorien entspricht, die ohne Fehler absolut identifiziert werden konnten. Jetzt beginnen wir in die Reihe aufzustehen, die gewöhnliche Erfahrung uns dazu bringen würde, das zu erwarten.

Nehmen Sie an, dass wir diese Daten fragmentarisch zeichnen, wie sie sind, und eine Annahme darüber machen, wie sich die Kanalkapazität mit der Dimensionalität der Stimuli ändert. Das Ergebnis wird in der Abb. 6 gegeben. In einem Moment der beträchtlichen Kühnheit habe ich die punktierte Linie skizziert, um grob die Tendenz anzuzeigen, so das die Daten geschienen zugenommen zu sein.

Abbildung 6. Die allgemeine Form der Beziehung zwischen der Kanalkapazität und der Zahl der unabhängigen variablen Attribute von Stimuli.

Klar, die Hinzufügung der unabhängigen variablen Attribute zum Stimulus vergrößert die Kanalkapazität, aber mit verlangsamtem Tempo. Es ist interessant zu bemerken, dass die Kanalkapazität vergrößert wird, selbst wenn die mehreren Variablen ziemlich abhängig sind. Eriksen [5] Berichte, dass, wenn Größe, Helligkeit und Farbton sich alle zusammen in der vollkommenen Korrelation ändern, die übersandte Information 4.1 Bit im Vergleich zu einem Durchschnitt von ungefähr 2.7 Bit ist, wenn diese Attribute einer nach dem anderen geändert werden. Indem er drei Attribute verwechselt hat, hat Eriksen den dimensionality des Eingangs vergrößert, ohne den Betrag der Eingangsinformation zu vergrößern; das Ergebnis war eine Zunahme in der Kanalkapazität ungefähr des Betrags, den die punktierte Funktion in der Abb. 6 uns dazu bringen, darauf zu erwarten.

Der Punkt scheint das zu sein, als wir mehr Variablen zur Anzeige hinzufügen, wir die Gesamtkapazität vergrößern, aber wir vermindern die Genauigkeit für jede besondere Variable. Mit anderen Worten können wir relativ grobe Urteile von mehreren Dingen gleichzeitig machen.

Wir könnten behaupten, dass im Laufe der Evolution jene Organismen am erfolgreichsten waren, die aufgeschlossen auf die breiteste Reihe von Stimulus-Energien in ihrer Umgebung waren. Um in einer ständig schwankenden Welt zu überleben, war es besser, ein bisschen Information über viele Dinge zu haben, als viel Information über ein kleines Segment der Umgebung zu haben. Wenn ein Kompromiss notwendig war, derjenige, den wir scheinen zu haben, ist klar anpassungsfähigere.

Pollack und Ficks Ergebnisse sind ein Argument sehr stark andeutend, dass Linguisten und Phonetiker für einige Zeit [19] gemacht haben. Gemäß der Sprachanalyse der Töne der menschlichen Rede gibt es ungefähr acht oder zehn Dimensionen – die Linguisten nennen sie unterscheidende Merkmale – die ein Phonem von einem anderen unterscheiden. Diese unterscheidenden Merkmale sind gewöhnlich binär, oder höchstens in der Natur dreifältig.

Zum Beispiel wird eine binäre Unterscheidung zwischen Vokalen und Konsonanten gemacht, eine binäre Entscheidung wird zwischen mündlichen und Nasenkonsonanten getroffen, eine dreifältige Entscheidung wird unter der Vorderseite, Mitte und Zurückphoneme usw. getroffen. Diese Annäherung gibt uns ganz ein verschiedenes Bild der Rede-Wahrnehmung, als wir von unseren Studien des Rede-Spektrums und der Fähigkeit des Ohrs sonst vorherrschen könnten, Verhältnisunterschiede unter reinen Tönen zu unterscheiden. Ich interessiere mich persönlich viel für diese neue Annäherung [15], und ich bedauere, dass es nicht Zeit gibt, um darüber hier zu besprechen.

Es war wahrscheinlich unter Beachtung von dieser Sprachtheorie, dass Pollack und Ficks einen Test auf einer Reihe von Tonstimuli geführt haben, die sich in acht Dimensionen geändert haben, aber nur eine binäre Entscheidung über jede Dimension verlangt haben. Mit diesen Tönen haben sie die übersandte Information an 6.9 Bit oder ungefähr 120 erkennbare Arten von Tönen gemessen. Es ist eine faszinierende Frage, bis jetzt unerforscht, ob man beim Hinzufügen von Dimensionen unbestimmt auf diese Weise gehen kann.

In der menschlichen Rede gibt es klar eine Grenze zur Zahl von Dimensionen, die wir verwenden. In diesem Beispiel, jedoch, ist es nicht bekannt, ob die Grenze durch die Natur der wahrnehmbaren Maschinerie festgesetzt wird, die die Töne oder durch die Natur der Rede-Maschinerie anerkennen muss, die sie erzeugen muss. Jemanden wird den Versuch anstellen müssen, um damit herauszufinden. Jedoch gibt es eine Grenze an ungefähr acht oder neun unterscheidenden Merkmalen auf jeder Sprache, die studiert worden ist, und so wenn wir darüber sprechen, müssen wir noch einen anderen Trick aufsuchen, um unsere Kanalkapazität zu vergrößern. Sprache verwendet Folgen von Phonemen, so machen wir mehrere Urteile nacheinander, wenn wir Wörtern und Sätzen zuhören. Das heißt, verwenden wir sowohl gleichzeitige als auch aufeinander folgende Urteilsvermögen, um die ziemlich starren Grenzen auszubreiten, die durch die Ungenauigkeit unserer absoluten Urteile von einfachen Umfängen festgesetzt sind.

Diese mehrdimensionalen Urteile sind an das Abstraktionsexperiment von Külpe [14] stark erinnernd. Wie Sie sich erinnern können, hat Külpe gezeigt, dass Beobachter genauer über ein Attribut berichten, für das sie gesetzt werden als auf Attributen, für die sie nicht gesetzt werden. Zum Beispiel hat Chapman [4] drei verschiedene Attribute verwendet und hat die erhaltenen Ergebnisse verglichen, als die Beobachter vor der tachistoskopischen Präsentation mit den erhaltenen Ergebnissen informiert wurden, als ihnen bis die Präsentation nicht erzählt wurde, welches der drei Attribute berichtet werden sollte.

Als die Instruktion im Voraus gegeben wurde, waren die Urteile genauer. Als die Instruktion später gegeben wurde, mussten die Themen vermutlich alle drei Attribute beurteilen, um über irgendwelche von ihnen zu berichten und die Genauigkeit entsprechend niedriger war. Das ist in der ganzen Übereinstimmung mit den Ergebnissen, die wir gerade gedacht haben, wo die Genauigkeit des Urteils auf jedem als mehr Dimensionen verminderten Attribut hinzugefügt wurde. Der Punkt ist wahrscheinlich offensichtlich, aber ich werde ihn irgendwie machen, dass die Abstraktionsexperimente nicht demonstriert haben, dass Leute nur ein Attribut auf einmal beurteilen können. Sie haben bloß gezeigt, was ziemlich angemessen scheint, dass Leute weniger genau sind, wenn sie mehr als ein Attribut gleichzeitig beurteilen müssen.

Simultanerfassung

Ich kann nicht dieses allgemeine Gebiet ohne das Erwähnen verlassen, jedoch kurz, die Experimente geführt in der Gestell Holyoke Universität auf dem Urteilsvermögen der Nummer [12]. In Experimenten durch Kaufman, Lord, Reese und Volkmann wurden zufällige Muster von Punkten auf einem Schirm für 1/5 einer Sekunde aufblitzen lassen. Überall von 1 zu mehr als 200 Punkten konnten im Muster erscheinen. Die Themasaufgabe war zu berichten, wie viel Punkte dort gab es.

Der erste Punkt dazu zu bemerken, ist auf Mustern, die bis zu fünf oder sechs Punkte enthalten, die Themen einfach haben keinen Fehler gemacht. Die Leistung auf diesen kleinen Zahlen von Punkten war von der Leistung mit mehr Punkten so verschieden, dass ihm ein spezieller Name gegeben wurde. Unten sieben wurden die Themen Simultanerfassung gesagt; oben sieben, wie man sagte, wurden sie geschätzt. Das ist, wie Sie anerkennen werden, was wir einmal optimistisch “die Spanne der Aufmerksamkeit genannt haben.”

Diese Diskontinuität an sieben ist natürlich andeutend. Ist das derselbe grundlegende Prozess der beschränkt unsere eindimensionalen Urteile auf ungefähr sieben Kategorien? Die Generalisation ist verführerisch, aber nach meiner Meinung nicht gesund. Die Daten auf Zahl-Schätzungen sind in Informationsbegriffen nicht analysiert worden; aber auf der Grundlage von den veröffentlichten Daten würde ich glauben, dass die Themen etwas mehr als vier Bit der Information über die Zahl von Punkten übersandt haben. Mit denselben Argumenten, wie zuvor erwähnt wurden, würden wir beschließen, dass es ungefähr 20 oder 30 unterscheidbare Kategorien der großen Anzahl gibt.

Das ist beträchtlich mehr Information, als wir annehmen würden, aus einer Eindimensional-Anzeige zu bekommen. Es ist eigentlich sehr viel wie eine zweidimensionale Anzeige. Obwohl der Dimensionalität der zufälligen Punktmuster nicht völlig klar ist, sind diese Ergebnisse in derselben Reihe wie Klemmer und Frick für ihre zweidimensionale Anzeige von Punkten in einem Quadrat. Vielleicht die zwei Dimensionen der großen Anzahl sind Gebiet und Dichte. Wenn das Thema kann simultanerfasst werden, Gebiet und Dichte können von keinen bedeutenden Variablen sein, aber wenn das Thema vielleicht schätzen muss, vielleicht  können sie bedeutend sein. Auf jeden Fall ist der Vergleich nicht so einfach, wie es am ersten Gedanken scheinen könnte.

Das ist einer der Möglichkeiten, darauf die magische Nummer sieben mich verfolgt hat. Hier haben wir zwei nah zusammenhängende Arten von Experimenten, von denen beide zur Bedeutung der Nummer sieben als eine Grenze auf unseren Kapazitäten hinweisen. Und noch wenn wir die Sache näher untersuchen, scheint es einen angemessenen Verdacht zu geben, dass es nichts anderes als ein Zufall ist.

Die Spanne der unmittelbaren Erinnerung

Lassen Sie mich die Situation auf diese Weise zusammenfassen. Es gibt eine klare und bestimmte Grenze zur Genauigkeit, mit der wir absolut den Umfang einer eindimensionalen Stimulus-Variable identifizieren können. Ich würde vorhaben, diese Grenze die Spanne des absoluten Urteils zu nennen, und ich behaupte, dass für eindimensionale Urteile diese Spanne gewöhnlich irgendwo in der Nachbarschaft sieben ist. Wir sind nicht völlig dieser beschränkten Spanne jedoch ausgeliefert, weil wir eine Vielfalt von Techniken haben, um darum herumzukommen und die Genauigkeit unserer Urteile zu vergrößern. Die unter diesen Geräten am wichtigsten drei sind (a), um relative aber nicht absolute Urteile zu machen; oder wenn das (b) nicht möglich ist, um die Zahl von Dimensionen zu steigern, entlang denen sich die Stimuli unterscheiden können; oder (c), um die Aufgabe auf solche Art und Weise einzuordnen, dass wir eine Folge von mehreren absoluten Urteilen hintereinander machen.

Die Studie von Verhältnisurteilen ist eines der ältesten Themen in der experimentellen Psychologie, und ich werde nicht Pause machen, um es jetzt nachzuprüfen. Das zweite Gerät, die Dimensionalität zu vergrößern, haben wir gerade in Betracht gezogen. Es sieht so aus, dass indem wir mehr Dimensionen hinzufügen, und verlangen grob, binär, Ja – Nein Urteile auf jedem Attribut, wir die Spanne des absoluten Urteils von sieben bis mindestens 150 erweitern können. Nach unserem täglichen Verhalten urteilend, ist die Grenze wahrscheinlich in den Tausenden, wenn tatsächlich es eine Grenze gibt. Nach meiner Meinung können wir nicht beim Zusammensetzen von Dimensionen unbestimmt gehen. Ich vermute, dass es auch eine Spanne von wahrnehmbaren Dimensionalität gibt, und dass diese Spanne irgendwo in der Nachbarschaft zehn ist, aber ich muss sofort hinzufügen, dass es keine objektiven Beweise gibt, um diesen Verdacht zu unterstützen. Das ist eine Frage, die traurig experimentelle Erforschung braucht.

Bezüglich des dritten Geräts, die Verwendung von nacheinanderen Urteilen, habe ich ganz wenig darüber zu sagen, weil dieses Gerät das Gedächtnis als Magd der Diskriminierung einführt. Und da mnemonische Prozesse mindestens so kompliziert sind, wie wahrnehmbaren Prozesse sind, können wir voraussehen, dass ihre Wechselwirkungen nicht leicht entwirrt werden.

Nehmen Sie an, dass wir anfangen, indem wir einfach ein bisschen das experimentelle Verfahren erweitern, das wir verwendet haben. Bis zu diesem Punkt haben wir einen einzelnen Stimulus präsentiert und den Beobachter gebeten, ihn sofort danach zu nennen. Wir können dieses Verfahren erweitern, indem wir der Beobachter verlangen, seiner Antwort vorzuenthalten, bis wir ihm mehrere Stimuli in der Folge gegeben haben. Am Ende der Folge von Stimuli macht er dann seine Antwort. Wir haben noch dieselbe Sorte der Eingangsproduktionssituation, die für das Maß der übersandten Information erforderlich ist. Aber jetzt sind wir von einem Experiment auf dem absoluten Urteil dazu gegangen, was ein Experiment auf dem unmittelbaren Gedächtnis traditionell genannt wird.

Bevor wir auf irgendwelche Daten auf diesem Thema schauen, finde ich, dass ich Ihnen ein Wort der Vorwarnung geben muss, Ihnen zu helfen, einige offensichtliche Vereinigungen zu vermeiden, die verwirrend sein können. Jeder weiß, dass es eine begrenzte Spanne des unmittelbaren Gedächtnisses gibt, und dass für viele verschiedene Arten von Testmaterialien diese Spanne ungefähr sieben Sachen in der Länge ist. Ich habe Ihnen gerade gezeigt, dass es eine Spanne des absoluten Urteils gibt, das ungefähr sieben Kategorien unterscheiden kann, und dass es eine Spanne der Aufmerksamkeit gibt, die ungefähr sechs Gegenstände mit einem flüchtigen Blick umfassen wird. Was ist natürlicher als zu denken, dass alle drei dieser Spannen verschiedene Aspekte eines einzelnen zu Grunde liegenden Prozesses sind? Und das ist ein grundsätzlicher Fehler, wie ich an einigen Schmerzen sein werde, um zu demonstrieren. Dieser Fehler ist eine der böswilligen Verfolgungen, denen die magische Nummer sieben mich unterworfen hat.

Mein Fehler wurde etwas wie das begonnen. Wir haben gesehen, dass die Invariant-Eigenschaft in der Spanne des absoluten Urteils der Informationsbetrag ist, die der Beobachter übersenden kann. Es gibt eine echte betriebliche Ähnlichkeit zwischen dem absoluten Urteil-Experiment und dem unmittelbaren Speicherexperiment. Wenn unmittelbares Gedächtnis mit dem absoluten Urteil ähnlich ist, dann sollte es dem folgen die Invariant-Eigenschaft in der Spanne des unmittelbaren Gedächtnisses ist auch der Betrag der Information, die ein Beobachter behalten kann. Wenn der Informationsbetrag in der Spanne des unmittelbaren Gedächtnisses eine Konstante ist, dann sollte die Spanne kurz sein, wenn die individuellen Sachen viel Information enthalten und die Spanne lang sein sollte, wenn die Sachen wenig Information enthalten. Zum Beispiel, dezimale Ziffern sind wert 3.3 Bit pro Kopf. Wir können ungefähr sieben von ihnen für insgesamt 23 Bit der Information zurückrufen. Isolierte englische Wörter kosten ungefähr 10 Bit pro Kopf. Wenn die Summe der Information unveränderlich an 23 Bit bleiben soll, dann sollten wir im Stande sein, sich an nur zwei oder drei Wörter gewählt aufs Geratewohl zu erinnern. Auf diese Weise habe ich eine Theorie darüber erzeugt, wie sich die Spanne des unmittelbaren Gedächtnisses als eine Funktion des Informationsbetrags pro Artikel in den Testmaterialien ändern sollte.

Die Maße der Speicherspanne in der Literatur sind auf dieser Frage andeutend, aber nicht endgültig. Und so es notwendig war, den Versuch anzustellen, um zu sehen. Hayes [10] hat es mit fünf verschiedenen Arten von Testmaterialien erprobt: binäre Ziffern, dezimale Ziffern, Buchstaben vom Alphabet, Briefe plus dezimale Ziffern, und mit 1,000 einsilbigen Wörtern. Die Listen wurden laut im Verhältnis von einem Artikel pro Sekunde gelesen, und die Themen hatten so viel Zeit, wie sie ihre Antworten geben mussten. Ein Verfahren, das von Woodworth [20] beschrieben ist, wurde verwendet, um die Antworten einzukerben.

Abbildung 7. Daten von Hayes [10] auf der Spanne des unmittelbaren Gedächtnisses haben sich als eine Funktion des Informationsbetrags pro Artikel in den Testmaterialien verschworen.

Abbildung 8. Daten von Pollack [16] auf dem Betrag der behaltenen Information nach einer Präsentation haben sich als eine Funktion des Informationsbetrags pro Artikel in den Testmaterialien verschworen.

Es gibt nichts Falsches mit dem Hayes Experiment, weil Pollack [16] das sehr ausführlich wiederholt hat und im Wesentlichen hat dasselbe Ergebnis bekommen. Pollack hat sich die Mühe gegeben, um den übersandten Informationsbetrag zu messen, und hat sich auf das traditionelle Verfahren nicht verlassen, für die Antworten einzukerben. Seine Ergebnisse werden in der Abb. 8 dargestellt. Hier ist es klar, dass der Betrag der übersandten Information nicht eine Konstante ist, aber fast geradlinig zunimmt, weil der Betrag der Information pro Artikel in der Eingabe vergrößert wird.

Und so das Ergebnis ist vollkommen klar. Trotz des Zufalls, dass die magische Nummer sieben in beiden Plätzen erscheint, sind die Spanne des absoluten Urteils und die Spanne des unmittelbaren Gedächtnisses ziemlich verschiedene Arten von Beschränkungen, die auf unserer Fähigkeit auferlegt werden, um die Information zu bearbeiten. Absolutes Urteil wird durch den Informationsbetrag beschränkt. Unmittelbares Gedächtnis wird durch die Zahl von Sachen beschränkt. Um diese Unterscheidung in etwas malerischen Begriffen zu gewinnen, bin ich in die Gewohnheit des Unterscheidens zwischen Bit der Information und Klötzen der Information gefallen. Dann kann ich sagen, dass die Zahl von Bit der Information für das absolute Urteil unveränderlich ist und die Zahl von Klötzen der Information für das unmittelbare Gedächtnis unveränderlich ist. Die Spanne des unmittelbaren Gedächtnisses scheint unabhängig von der Zahl des Bits pro Klotz zu sein, mindestens über die Reihe, die bis heute untersucht worden ist.

Der Kontrast der Begriffe Bit und Brocken dient auch dazu, um die Tatsache hervorzuheben, dass wir darüber nicht sehr bestimmt sind, was einen Informationsbrocken festsetzt. Zum Beispiel, die Gedächtnisspanne aus fünf Wörtern, die Hayes erhalten hat, als jedes Wort aufs Geratewohl von eine Reihe 1,000 englische einsilbige Wörter gezogen wurde, könnte so eine Speicherspanne von 15 Phonemen passend genannt worden sein, seitdem jedes Wort ungefähr drei Phoneme darin hatte. Intuitiv ist es klar, dass die Themen fünf Wörter wiederaufrufen wurden, nicht 15 Phoneme, aber die logische Unterscheidung ist nicht sofort offenbar. Wir befassen uns hier mit einem Prozess des Organisierens oder der Gruppierung der Eingabe in vertraute Einheiten oder Brocken, und sehr viel Lernen ist in die Bildung dieser vertrauten Einheiten eingetreten.

Umschlüsselung

Um genauer zu sprechen, müssen wir die Wichtigkeit von der Gruppierung oder dem Organisieren der Eingabefolge in Einheiten oder Brocken anerkennen. Da die Gedächtnisspanne eine festgelegte Zahl von Brocken ist, können wir die Zahl von Informationsbit steigern, die es einfach durch das Gebäude größerer und größerer Brocken enthält, jedes Brocken enthält mehr Information als vorher.

Ein Mann, der gerade beginnt, radiotelegrafischen Code zu erfahren, hört jedes Dit und Dah als ein getrennter Brocken. Bald ist er im Stande, diese Töne in Briefe zu organisieren, und dann kann er sich mit den Briefen als Brocken befassen. Dann organisieren die Briefe sich als Wörter, die noch größere Brocken sind, und er beginnt die ganzen Ausdrücke zu hören. Ich meine nicht, dass jeder Schritt ein getrennter Prozess ist, oder dass Plateaus in seinem Lernen erscheinen müssen, dass Kurve, für sicher die Niveaus der Organisation an verschiedenen Raten erreicht werden und auf einander während des Lernprozesses übergreifen. Ich weise einfach zur Gewissheit hin, dass Dits und Dahs durch das Lernen in Muster organisiert werden, und dass weil diese größeren Brocken der Betrag der Nachricht erscheinen, dass sich der Maschinenbediener an Zunahmen entsprechend erinnern kann. In den Begriffen schlage ich vor das zu verwenden, der Betreiber lernt die Bit pro Brocken zu vergrößern.

Im Jargon der Kommunikationstheorie würde dieser Prozess Umschlüsselung genannt. Die Eingabe wird in einem Code gegeben, der viele Brocken mit wenigen Bit pro Brock enthält. Der Betreiber umschlüsselt die Eingabe in einen anderen Code, der weniger Blocken mit mehr Bit pro Stück enthält. Es gibt viele Weisen, um dieses Wiedercodieren zu tun, aber wahrscheinlich soll das einfachste die Eingangsereignisse gruppieren, einen neuen Namen zur Gruppe anwenden, und sich dann an den neuen Namen aber nicht die ursprünglichen Eingabeereignisse erinnern.

Da ich überzeugt bin, dass dieser Prozess ein sehr allgemeiner und wichtiger für die Psychologie gilt, will ich Ihnen über ein Demonstrationsexperiment erzählen, das vollkommen ausführlich machen sollte, worüber ich spreche. Dieses Experiment wurde von Sidney Smith durchgeführt und wurde von ihm vor Eastern Psychological Association 1954 berichtet.

Beginnt man mit der beobachteten Tatsache, dass die Menschen acht dezimale Ziffern wiederholen können, aber nur neun binäre Ziffern. Da gibt es eine große Diskrepanz im Informationsbetrag, zurückgerufenen in diesen zwei Fällen, vermuten wir sofort, dass ein Umschlüsselungsverfahren verwendet werden konnte, um die Spanne des unmittelbaren Gedächtnisses für binäre Ziffern zu vergrößern. In der Tabelle 1 wird eine Methode für Gruppierung und Umbenennung illustriert. Die  Spitze entlang gibt es eine Folge von 18 binären Ziffern, weit mehr als jedes Thema, das im Stande gewesen wurde, nach einer einzelnen Präsentation zurückzurufen. In der folgenden Linie werden diese dieselben binären Ziffern von Paaren gruppiert. Vier mögliche Paare können vorkommen: 00 wird 0 umbenannt, 01 wird 1 umbenannt, 10 wird 2 umbenannt, und 11 wird 3 umbenannt.

Das heißt, wir codieren aus einer zwei-arithmetischen Basis zu einer vier-arithmetischen-Basis wieder. In der wiedercodierten Folge gibt es jetzt gerade neun Ziffern, um sich zu erinnern, und das ist fast innerhalb der Spanne des unmittelbaren Gedächtnisses. In der folgenden Linie wird dieselbe Folge von binären Ziffern in Brocken drei umgruppiert. Es gibt acht mögliche Folgen aus drei, so geben wir jeder Folge einen neuen Namen zwischen 0 und 7. Jetzt haben wir von einer Folge von 18 binären Ziffern in eine Folge von 6 Oktalziffern wiedercodiert, und das ist gut innerhalb der Spanne des unmittelbaren Gedächtnisses. In den letzten zwei Linien werden die binären Ziffern durch Vier und Fünf gruppiert und werden dezimal-stellige Namen von 0 bis 15 und von 0 bis 31 gegeben.

Tabelle I. Weisen von Umschlüsselung-Folgen der binären Ziffern

Es ist vernünftig offensichtlich, dass diese Art von Umschlüsselung die Bit pro Stück vergrößert, und die binäre Folge in eine Form verpackt, die innerhalb der Spanne des unmittelbaren Gedächtnisses behalten werden kann. So Smith hat 20 Themen gesammelt und hat ihre Spannen für binäre und Oktalziffern gemessen. Die Spannen waren 9 für Dualzahlen und 7 für Oktal. Dann hat er jedes Umschlüsselungschema zu fünf von der Themen gegeben. Sie haben das Wiedercodieren studiert, bis sie gesagt haben, dass sie es – seit ungefähr 5 oder 10 Minuten verstanden haben. Dann hat er ihre Spanne für binäre Ziffern wieder geprüft, während sie versucht haben, das Umschlüsselungschema zu verwenden, das sie studiert hatten.

Die Umschlüsselungschema haben ihre Spanne für binäre Ziffern in jedem Fall vergrößert. Aber die Zunahme war nicht so groß, wie wir auf der Grundlage von ihrer Spanne für Oktalziffern erwartet hatten. Seitdem die Diskrepanz als das vergrößerte Wiedercodierverhältnis zugenommen hat, haben wir geschlossen, dass einigen Minuten an der Themen verbrachten, damit das Umschlüsselungschema zu erfahren, war nicht genügend gewesen. Natürlich, die Übersetzung von einem Code bis zu anderen muss fast automatisch sein, oder das Thema wird einen Teil der folgenden Gruppe verlieren, während er versucht, sich an die Übersetzung der letzten Gruppe zu erinnern.

Seit 4:1 und 5:1 Verhältnisse verlangen beträchtliche Studien, Smith hat sich dafür entschieden, Ebbinghaus zu imitieren und den Versuch an sich anzustellen. Mit der germanischen Geduld hat er sich auf jedem Wiedercodieren nacheinander geübt, und hat die Ergebnisse erhalten, in der Abb. 9 gezeigten. Hier folgen die Daten vorwärts eher nett mit den Ergebnissen, die Sie auf der Grundlage von seiner Spanne für Oktalziffern voraussagen würden. Er konnte sich an 12 Oktalziffern erinnern. Mit 2:1 das Wiedercodieren galten diese 12 Brocken 24 binäre Ziffern. Mit 3:1 das Wiedercodieren galten sie 36 binäre Ziffern. Mit 4:1 und 5:1 Wiedercodieren galten sie ungefähr 40 binäre Ziffern.

Es ist ein bisschen dramatisch zusehen, wie eine Person 40 binäre Ziffern hintereinander bekommt und sie dann zurück ohne Fehler wiederholt. Jedoch, wenn Sie daran bloß als ein mnemonischer Trick denken, für die Gedächtnisspanne zu erweitern, werden Sie den wichtigeren Punkt verpassen, der in fast allen diesen mnemonischen Geräten implizit ist. Es ist nämlich so, dass das Wiedercodieren eine äußerst starke Waffe ist, für den Informationsbetrag zu vergrößern, mit der wir uns befassen können. In einer Form oder einem anderen verwenden wir das Wiedercodieren ständig in unserem täglichen Verhalten.

Abbildung 9. Die Spanne des unmittelbaren Gedächtnisses für binäre Ziffern wird als eine Funktion des verwendeten Wiedercodierverfahrens dargestellt. Die vorausgesagte Funktion wird durch das Multiplizieren der Spanne für Oktal durch 2, 3, und 3.3 erhalten, um in die Basis 4, Basis 8 und Basis 10 beziehungsweise wiederzucodieren.

Nach meiner Meinung die üblichste Art des Wiedercodierens, das wir die ganze Zeit verwenden, soll davon in einen wörtlichen Code übersetzen. Wenn es eine Geschichte oder ein Argument oder eine Idee gibt, darüber wir uns erinnern wollen, versuchen wir gewöhnlich es “in unseren eigenen Wörtern umzuformulieren.” Wenn wir ein Ereignis bezeugen, wollen wir uns das merken, wir machen eine wörtliche Beschreibung des Ereignisses und erinnern uns dann an unsere Verbalisierung. Auf den Rückruf erfrischen wir durch die sekundäre Weiterentwicklung die Details, die im Einklang stehend mit dem besonderen wörtlichen Wiedercodieren scheinen, das wir zufällig gemacht haben. Das bekannte Experiment durch Carmichael, Hogan und Walter [3] zum Einfluss, dass die Namen auf dem Rückruf von Sehzahlen haben, ist eine Demonstration des Prozesses.

Die Ungenauigkeit des Zeugnisses von Augenzeugen ist in der gesetzlichen Psychologie weithin bekannt, aber die Verzerrungen des Zeugnisses sind nicht zufällig – sie folgen natürlich vom besonderen Wiedercodieren, das der Zeuge verwendet hat, und das besondere Wiedercodieren, das er verwendet hat, hängt von seiner ganzen Lebensgeschichte ab. Unsere Sprache ist für das Wiederverpackungsmaterial in einigen Stücken sehr nützlich, reich an der Information. Ich vermute die Bildsprache ist auch eine Form der Umschlüsselung, aber Images scheinen viel härter betrieblich zu bekommen und experimentell zu studieren, als die symbolischeren Arten des Wiedercodierens.

Es scheint sogar es ist möglich das Memorieren in diesen Begriffen auch studiert werden kann. Der Prozess des Merkens kann einfach die Bildung von Brocken oder Gruppen von Sachen sein, die gleich sind, bisher gibt es wenige genug Brocken, so dass wir alle Sachen zurückrufen können. Die Arbeit von Bousfield und Cohen [2] auf dem Ereignis der Gruppierung im Rückruf von Wörtern ist in dieser Beziehung besonders interessant.

Zusammenfassung

Ich bin zum Ende der Daten gekommen, die ich präsentieren wollte, so würde ich gern jetzt einige zusammenfassende Bemerkungen machen.

Erstens, die Spanne des absoluten Urteils und des unmittelbaren Gedächtnisses erlegen strenge Beschränkungen auf den Informationsbetrag auf, die wir im Stande sind, das zu erhalten, zu bearbeiten und sich zu erinnern. Indem wir den Stimulus-Eingabe gleichzeitig in mehrere Dimensionen und nacheinander in eine Folge oder Brocken organisieren, wir können die Bottleneck Information brechen (oder mindestens das zu strecken).

Zweitens, der Prozess der Umkodierung ist ein sehr wichtiger in der menschlichen Psychologie und verdient viel ausführlichere Aufmerksamkeit, als das erhalten hat. Insbesondere die Art der Sprachumkodierung, das die Menschen leisten, scheint mir von wirklichem Herzblut der Denkprozesse zu sein. Umschlüsselnde Verfahren vertreten eine ständige Bemühe für Klinikern, sozialen Psychologen, Linguisten und Anthropologen und noch wahrscheinlich, weil Umschlüsselung für die experimentelle Manipulation weniger zugänglich ist als Quatsch-Silben oder T Labyrinthe, hat der traditionelle experimentelle Psychologe wenig oder nichts zu ihrer Analyse beigetragen. Dennoch können experimentelle Techniken verwendet werden, umkodierende Methoden können angegeben werden, Verhaltensindikatoren kann gefunden werden. Und ich sehe das voraus, dass wir einen sehr regelmäßigen Satz von Beziehungen finden werden, die beschreiben, was jetzt eine unerforschte Wildnis von individuellen Unterschieden scheint.

Drittens, die Konzepte und Maßnahmen erhalten durch die Informationstheorie stellen eine quantitative Weise zur Verfügung, wie man einigen von dieser Fragen bekommen kann. Die Theorie versorgt uns mit einem Maßstab, um unsere Stimulus-Materialien zu kalibrieren und für die Leistung unserer Themen zu messen. In den Interessen der Kommunikation habe ich die technischen Details des Informationsmaßes unterdrückt und habe versucht, die Ideen in vertrauteren Begriffen auszudrücken; ich hoffe, dass diese Paraphrase Sie nicht dazu bringen wird, damit zu denken, dass sie in der Forschung nicht nützlich sind. Informationskonzepte haben sich bereits wertvoll in der Studie des Urteilsvermögens und der Sprache erwiesen; sie versprechen viel in der Studie des Lernens und Gedächtnisses; und es ist sogar vorgeschlagen worden, dass sie in der Studie der Konzeptbildung nützlich sein können. Viele Fragen, die unfruchtbar vor zwanzig oder dreißig Jahren geschienen sind, können jetzt eines anderen Blicks wert sein. Tatsächlich finde ich, dass meine Geschichte hier anhalten muss, gerade als sie beginnt, wirklich interessant zu werden.

Und schließlich, wie steht’s mit der magischen Nummer sieben? Wie steht’s mit den sieben Wundern der Welt, den sieben Meeren, den sieben tödlichen Sünden, den sieben Töchtern des Atlas in Plejaden, den sieben Altern des Mannes, den sieben Niveaus der Hölle, den sieben primären Farben, den sieben Zeichen der Musikskala, und die sieben Tage der Woche? Wie steht’s mit der geltenden Sieben-Punkte-Skala, den sieben Kategorien für das absolute Urteil, den sieben Gegenständen in der Spanne der Aufmerksamkeit und den sieben Ziffern in der Spanne des unmittelbaren Gedächtnisses? Für den Augenblick habe ich vor, Urteil vorzuenthalten. Vielleicht gibt es etwas tief und tiefsinnig hinter allen diesen Siebens, etwas nur für uns aufschreiend, darüber zu entdecken. Aber ich vermute, dass es nur ein bösartiger, Pythagoreischer Zufall ist.

Literaturhinweise

1. Beebe-Center, J.G., Rogers, M.S., und O’Connell, D.N. Transmission of information about sucrose and saline solutions through the sense of taste. J. Psychol., 1955, 39, 157-160.

2. Bousfield, W.A., und Cohen, B.H. The occurrence of clustering in the recall of randomly arranged words of different frequencies-of-usage. J. Gen. Psychol., 1955, 52, 83-95.

3. Carmichael, L., Hogan, H.P., und Walter, A.A. An experimental study of the effect of language on the reproduction of visually perceived form. J. Exp. Psychol., 1932, 15, 73-86.

4. Chapman, D.W. Relative effects of determinate and indeterminate Aufgaben. Amer. J. Psychol., 1932, 44, 163-174.

5. Eriksen, C.W. Multidimensional stimulus differences and accuracy of discrimination. USAF, WADC Tech. Rep., 1954, No. 54-165.

6. Eriksen, C.W., und Hake, H.W. Absolute judgments as a function of the stimulus range and the number of stimulus and response categories. J. Exp. Psychol., 1955, 49, 323-332.

7. Garner, W.R. An informational analysis of absolute judgments of loudness. J. Exp. Psychol., 1953, 46, 373-380.

8. Hake, H.W., and Garner, W.R. The effect of presenting various numbers of discrete steps on scale reading accuracy. J. Exp. Psychol., 1951, 42, 358-366.

9. Halsey, R.M., und Chapanis, A. Chromaticity-confusion contours in a complex viewing situation. J. Opt. Soc. Amer., 1954, 44, 442-454.

10. Hayes, J.R.M. Memory span for several vocabularies as a function of vocabulary size. In Quarterly Progress Report, Cambridge, Mass.: Acoustics Laboratory, Massachusetts Institute of Technology, Januar-Juni, 1952.

11. Jakobson, R., Fant, C.G.M., und Halle, M. Preliminaries to speech analysis.Cambridge, Mass.: Acoustics Laboratory, Massachusetts Institute of Technology, 1952. (Tech. Rep. No. 13.).

12. Kaufman, E.L., Lord, M.W., Reese, T.W., und Volkmann, J. The discrimination of visual number. Amer. J. Psychol., 1949, 62, 498-525.

13. Klemmer, E.T., und Frick, F.C. Assimilation of information from dot and matrix patterns. J. Exp. Psychol., 1953, 45, 15-19.

14. Kulpe, O. Versuche über Abstraktion. Ber. u. d. I Kongr. f. Exper. Psychol., 1904, 56-68.

15. Miller, G.A., und Nicely, P.E. An analysis of perceptual confusions among some English consonants. J. Acoust. Soc. Amer., 1955, 27, 338-352.

16. Pollack, I. The assimilation of sequentially encoded information. Amer. J. Psychol., 1953, 66, 421-435.

17. Pollack, I. The information of elementary auditory displays. J. Acoust. Soc. Amer., 1952, 24, 745-749.

18. Pollack, I. The information of elementary auditory displays. II. J. Acoust. Soc. Amer., 1953, 25, 765-769.

19. Pollack, I., und Ficks, L. Information of elementary multidimensional auditory displays. J. Acoust. Soc. Amer., 1954, 26, 155-158.

20. Woodworth, R.S. Experimental Psychology. New York: Holt, 1938.