Sozialklima von Gruppen: Probleme bei der Verwendung des Mittelwertes


Die Schätzung des Populationskorrelationskoeffizienten Bearbeiten

Dieses Kapitel ist den Problemen gewidmet, die dann auftauchen, wenn man den Mittelwert als Index für eine analytische Variable, wie sie das Sozialklima ist, her­anzieht. Keine Probleme treten auf, wenn der Mittelwert nur deskriptiv bei der Darstellung von Ergebnissen verwendet wird (z.B. bei deCHARMS, 1973). Dabei bleibt es aber meistens nicht, denn gerade in der Sozial­klimaforschung wurde der Mittelwert als Basis von kor­relationsstatistischen Analysen häufig herangezogen. Man kann die Strategien der Ermittlung von Korrelatio­nen aber nicht einfach der Dichotomie Individualwertekorrelation - Mittelwertekorrelation zuordnen. Im fol­genden werden deshalb alternative Möglichkeiten zur Schätzung des Populationskorrelationskoeffizienten ge­zeigt und geprüft.


SIROTNIK, 1980 (GUILFORD, 1965; DREESMANN, 1981b; RO­BINSON, 1950; SLATIN, 1969) unterscheiden allgemein drei Verfahrensweisen, wie man Individualwerte ver­rechnen kann:

  • die Alle Schüler der Untersuchung sind Basis der Auswertung ,
  • die Innerhalb jeder Klasse werden die Individualwerte korreliert,
    anschließend werden diese Korrelationskoeffizienten über alle Klassen gemittelt
    ,
  • die Die Mittelwerte der Klassen werden korreliert .


Auch wenn die Begriffe, die SIROTNIK verwendeten, an die Varianzanalyse erinnern und mißverständlich sein können, wollen wir diese doch weiter benutzen, da sie sich in diesem Zusammenhang durchgesetzt haben (s. KNAPP, 1977).

WALBERG & WELCH (1967; s.a. KLAUER, 1974, 100) haben eine vierte Möglichkeit vorgestellt, die Korrelation zwischen Variablen in der Population zu schätzen: die 'randomized data collection' . Dabei werden aus einer Klasse mehrere Schüler zufällig ausgewählt. Aus den Individualwerten dieser Schüler werden Mittelwerte berechnet. Diese sind - wie bei der 'Mittelung zwi­schen' - Basis der weiteren Korrelationsberechnungen (Ergebnis: r(ran)). WALBERG et al. (1967) gehen bei diesem Vorgehen davon aus, dass jede beliebige Stichpro­be von Schülern einer Klasse ein gültiges Bild des Klimas dieser Klasse geben kann. Der durch die rando­mized data collection ermittelte Korrelationskoeffizient stellt somit eine gute Schätzung der‚ 'Mittelung zwischen' dar .


Forderungen, die dargestellten Verfahren synchron an einem Datensatz zu rechnen, gibt es genug, an entspre­chenden Durchführungen mangelt es noch (z.B. CRONBACH & WEBB, 1975; v. SALDERN & LITTIG, 1985)

Im folgenden werden die vier Möglichkeiten der Schätzung des 'wahren' Korrelationskoeffizienten zusam­menfassend dargestellt. In Abb. 4.7 sind die vier Vor­gehensweisen grafisch anhand von zwei Klassen mit je sieben Schülern und den beiden Merkmalen X und Y zusam­mengefaßt

Nun muß noch geklärt werden, was die einzelnen Koeffi­zienten eigentlich aussagen. Der Klärung dieser Frage ist das nächste Kapitel gewidmet.



Zur Gültigkeit von Aussagen auf höherer Ana­lyseebene Bearbeiten

Der Sozialklimaindex kann nur durch Verrechnung von Individualwerten gewonnen werden. Wenn man die Klasse als ein durch Individuen gebildetes Kollektiv betrach­tet, kann man z.B. drei mögliche Effekte zwischen zwei Variablen feststellen. Diese sollen an einem Beispiel verdeutlicht werden, wobei die Kohäsion die unabhängige Variable und die Lernleistung eines Schülers die ab­hängige Variable ist.

(1) Individueller Effekt: Die Tatsache, daß ein Schüler die Kohäsion positiv wahrnimmt, kann die Wahr­scheinlichkeit, daß dieser Schüler auch gute Lern­leistungen bringt, steigen oder sinken lassen, unabhängig davon, wieviele Schüler mit positiver Kohäsionswahrnehmung in der Klasse vorhanden sind.
(2) Kontexteffekt: Der Anteil der Schüler mit positiver Kohäsionswahrnehmung in der Klasse kann die Wahr­scheinlichkeit, daß ein Schüler eine gute oder schlechte Lernleistung zeigt, beeinflussen.
(3) Wechselwirkungen zwischen individuellem Effekt und Kontexteffekt: Es bestehen zwei mögliche Wechsel­wirkungen. Einmal kann die Tatsache, daß ein Schü­ler die Kohäsion positiv wahrnimmt, die Wahrschein­lichkeit, daß dieser Schüler gute Lernleistungen bringt, steigen oder sinken lassen, aber abhängig von der Zahl der Schüler mit positiver Kohäsions­wahrnehmung in dieser Klasse (vgl.(1)). Zum ande­ren kann der Anteil der Schüler mit positiver Kohä­sionswahrnehmung die Wahrscheinlichkeit, ob dieser Schüler gute oder schlechte Lernleistungen zeigt, verschieden stark beeinflussen (vgl.(2)). Beide Wechselwirkungen sind logisch äquivalent.


Abb. 4.7 Übersicht über vier Möglichkeiten, den Populationskorrelatonskoeffizienten zu schätzen.


Welche Wirkung diese Effekte auf die Gültigkeit einer Aussage auf höherer Analyseebene haben, wird im folgen-den Beispiel deutlich: Angenommen, bei einer Unter­suchung wurden ausschließlich die Mittelwerte der Klas­sen ('Mittelung zwischen' oder randomized data collec­tion) als weitere Berechnungsgrundlage herangezogen und angenommen, es wird folgendes (fingiertes) Forschungs­ergebnis veröffentlicht:

Klassen mit hoher Kohäsion haben eine bessere Lern­leistung leistung als Klassen mit niederer Kohäsion.


Man kann im folgenden sehen, daß dieses Ergebnis kei­neswegs eindeutig ist, da es zumindest zwei Fragen offen läßt:

  • Was leisten die Schüler mit niedriger Kohäsions­wahrnehmung in Klassen mit durchschnittlich hoher Kohäsion?
  • Was leisten die Schüler mit hoher Kohäsionswahr­nehmung in Klassen mit durchschnittlich niedriger Kohäsion?


In ähnlicher Weise wird die Ableitung einer Kollektiv­aussage aus einer Menge von Individualaussagen von HUMMEL (1972) problematisiert: "Wenn auf der Ebene von Individuen bzw. Paaren qualitative Je-desto-Aussagen gültig sind und ... wenn die Gruppeneigenschaften als verallgemeinerte Mittelwerte aus den individuellen Eigenschaften konstruiert sind, dann ist für die Ebene der Gruppe keine Aussage deduzierbar!" (1972, 44). Die Ableitung von einer Ebene auf eine andere ist in sozi­alwissenschaftlichen Aussagesystemen unzulässig.

Es läßt sich folgern, daß ein empirisches Forschungser­gebnis, welches sich nur auf Mittelwerte der Klassen­ebene als höhere Analyseebene stützt, verschiedene Interpretationsmöglichkeiten zuläßt. Korrelationstabel­len, die auf der 'Mittelung zwischen' basieren, sind daher schwer zu interpretieren, da Individualeffekte, Kontexteffekte und Wechselwirkungen zwischen beiden in einer Mittelwertkorrelation nicht auseinanderzuhalten sind (Beispiel: HALADYNA, OLSON & SHAUGHNESSY, 1983). Genauer wäre es, das o.g. fingierte Forschungsergebnis als Folge eines falschen methodischen Vorgehens anzuse­hen. Die vier oben genannten Interpretationen kommen zustande, weil man sich methodisch ausschließlich auf Mittelwerte bezogen hat (vgl. WELZ, 1974). Wie soll man aber nun die erhobenen Individualdaten statistisch weiter verarbeiten und dabei dem Klimakonzept trotzdem gerecht werden?

Diese Frage lässt sich eigentlich nur dann befriedigend beantworten, wenn die Beziehungen zwischen den beiden angesprochenen Analyseebenen deutlicher sind. Im fol­genden Abschnitt wird deshalb das Verhältnis zwischen Individual- und Aggregatebene näher beleuchtet.



Die Beziehungen zwischen der Individual- und höheren Analyseebenen Bearbeiten

Die im vorigen Abschnitt problematisierten Aussagen auf höherer Analyseebene lassen sich leicht begründen. Der Einfachheit halber beziehen sich folgende Ausführungen dabei auf den linearen Fall ohne Wechselwirkungen. Bei einer Regression von der Variablen Y auf die Variable X auf Mittelwertebasis kommt man zu folgender Formel:


(4.1)         

Bei der Regression auf Individualebene geht man analog von folgender Formel aus:

(4.2)         

Bei einer Analyse auf Mittelwertebasis und Interpretation auf Individualebene setzt man voraus, dass

(4.3)         

wobei A...N = Gruppenindex.


D.h., daß die Steigungen der Regressionsgerade in den Gruppen identisch sind mit der der Mittelwerte. Dies kommt aber in den seltensten Fällen vor. Ein kleines Beispiel soll dies verdeutlichen: Angenommen es lägen von vier Klassen die Individual- und Mittelwerte der oben schon im Beispiel verwendeten Variablen Kohäsion und Lernleistung vor.

In Abb. 4.8 sind zwei mögliche Verteilungen der Mittel­werte (Punkte), der Individualwerte auf Klassenebene (kleine Ellipsen) und für die Gesamtstichprobe zwischen zwei Variablen wiedergegeben.

Es wird anhand dieser einfachen Abbildung (n. WALBERG, 1976) deutlich, dass man bei der Gesamtanalyse (also über alle Klassen hinweg) die Beziehungen innerhalb der Klassen nicht berücksichtigt. Ein Fehlschluss würde bei Stichprobe 1 nicht auftreten, da die Regressionslinie der Gesamtanalyse der innerhalb der einzelnen Klassen entspricht. Bei Stichprobe 2 dagegen stehen die Regressionslinien sogar senkrecht auf der der Gesamtanalyse (s.a. ECKEL, 1970; CONKLIN & BURSTEIN, 1980; v. SAL­DERN, 1982).

Zu solchen Ergebnissen kann man kommen, wenn man die Mittelwerte der Klassen korreliert ( 'Mittelung zwi­schen' ), die Korrelationen auf Klassenebene über die Gesamtstichprobe mittelt ( 'Mittelung innerhalb' ) oder die 'randomized data collection' durchführt. Letzteres geht aber nur, wenn die Annahme von WALBERG & WELCH (1967) zutrifft, dass eine Stichprobe von Schülern einer Klasse das Klima adäquat abbilden kann.


Abb. 4.8 Mögliche Zusammenhänge zwischen Lernleistung und Kohäsion in vier Klassen (nach GUILFORD, 1965, 341; WALBERG, 1976).


Einige der möglichen Beziehungen zwischen der Indivi­dual- und Aggregatebene sind in Abb. 4.9 zusammenge­faßt. Ebenso sind dort die daraus resultierenden Inter­pretationsfehler vermerkt. Es wird deutlich, wie gra­vierend die Unterschiede der Zusammenhänge zweier Va­riablen auf beiden Ebenen sein können (s.a. ALWIN & OTTO, 1977; LINCOLN & ZEITZ, 1980). Dabei sind nur lineare Zusammenhänge ohne Wechselwirkungen berück­sichtigt. Auch wurden die Fälle ausgeschlossen, in denen sich die Steigungen der Regressionsgeraden inner­halb der Klassen auch noch unterscheiden (b( A) <> b(B) <> b(C)). Im letzteren Falle nämlich wäre die Lage noch prekärer, da die Beziehungen zwischen beiden Ebenen mehrdeutig wären.

Die Gesamtanalyse unterschlägt die Gruppeneffekte, während die 'Mittelung zwischen' (ebenso wie die 'ran­domized data collection') das Verhältnis von Indivi­dual- und Gruppeneffekten offen läßt: "Die Individual­beziehung kann Null sein oder sogar entgegengesetztes Vorzeichen haben. Umgekehrt impliziert die Nicht-Exi­stenz einer Kollektivbeziehung nicht die Abwesenheit einer Individualbeziehung" (BOUDON, 1976, 469 ff.). Eine naheliegende, allerdings falsche - wie noch später begründet werden wird - Lösung wäre, wenn man für jeden Datensatz sowohl die Gesamtanalyse wie auch die 'Mit­telung zwischen' durchführte, was verschiedentlich in der Sozialklimaforschung bereits geschehen ist.


Abb. 4.9 Mögliche Beziehungen zwischen den Individualwerten in Gruppen und den Mittelwerten dieser Gruppen.


Problematisch ist dabei z. T. die Begründung für das Heranziehen beider Analyseebenen: Der Gruppenmittelwert wurde zur Erfassung der Variable 'objektive Umwelt' herangezogen, der Individualwert sollte dann die indi­viduelle 'subjektive Ausprägung' auf dieser Variablen darstellen (Beispiel: EIRMBTER, 1979, 717; vgl. PERVIN, 1975, 38). Wie schon BARKER (1968, 78) richtig bemerkt, würde man sich dann aber in einem tautologischen Zirkel befinden, aus dem es kein Entrinnen gäbe, da der Mit­telwert aus den Individualwerten gebildet wird. JAMES & JONES (1974) weisen zwar auf die Notwendigkeit der Entscheidung zwischen Individual- und Mittelwert hin, geben selbst aber keine Ratschläge.


Dies ist bedauerlich, wenn man bedenkt, welche Auswir­kungen die Aggregierung von Individualdaten auf die Verteilungsparameter hat. In Abb. 4.10 wird deutlich, daß die Aggregierung keinen beachtenswerten Einfluß auf den Mittelwert hat, sich aber stark auf die Streuung auswirkt. Diese wird mit steigender Aggregatebene klei­ner (vgl. KLITGAARD, 1975; TREIBER, 1981).

Um zu zeigen, wie sich die Beziehungen zwischen den beiden Analyseebenen praktisch auswirken, werden im folgenden Abschnitt Vergleiche von empirisch gewonnenen Ergebnissen durchgeführt.



Vergleich von Korrelationsanalysen auf Individual- und Aggregatebene Bearbeiten

In den meisten empirischen Arbeiten im Rahmen der So­zialklimaforschung wurden korrelationsstatistische Ver­fahren angewendet, um Zusammenhänge zwischen Klimawer­ten und z. B. Leistungsvariablen zu ermitteln. Im vor­herigen Abschnitt wurde deutlich, wie verzerrend eine Korrelationsanalyse auf Aggregatebene wirkt. Es liegen einige wenige Datensätze vor, die das bereits Gesagte untermauern.


Abb. 4.10: Verteilung von Individualwerten (B) und den dazugehörigen Aggregaten (A), wobei p(A) = p( B) und a( A) = a( B) .


So hat DREESMANN die Daten einer Untersuchung zum Un­terrichtsklima zweimal analysiert: 1979 stellt er die Korrelationen zwischen kognitiven Variablen der Schüler und ihren Wahrnehmungen der einzelnen Umweltdimensionen dar. Dabei hat er die Mittelung zwischen' durchgeführt, also die Klassenmittelwerte korreliert. Diese Vorgehensweise wurde bereits abgelehnt, da die Korrela­tionskoeffizienten zu viele Interpretationsmöglichkeiten zulassen. In einer späteren Veröffentlichung (DREESMANN, 1981b, im Original Tab. 1) stellt DREESMANN eine nahezu identische Tabelle vor, welche nun aber die Korrelationskoeffizienten der Gesamtanalyse über alle Klassen wiedergibt (Ausschnitte beider Tabellen sind in Tab. 4.1 zusammengefaßt). Diese Werte sagen aber wie­derum nichts über die Gruppeneffekte aus (s.o.). DREES­MANN bezieht sich bei der Interpretation seiner beiden Tabellen vorwiegend auf die multiplen Korrelationen zwischen beiden Variablensätzen. Die multiplen Kollek­tivkorrelationen (in Tab. 4.1, letzte Spalte in Klam­mern) liegen allesamt über den multiplen Individualkorrelationen (s. dazu JONES & JAMES, 1979). Auch die Rangfolge der Werte beider Analysen liegt in etwa gleich. Bei einem inhaltlichen Vergleich der multiplen Korrelationen beider Analyseebenen wird man also zu gleichen Ergebnissen kommen. Anders gestaltet sich die Lage bei dem Vergleich der einfachen Korrelationen: Wenn auch in den meisten Fällen das Vorzeichen der Individualkorrelation mit dem der Kollektivkorrelation übereinstimmt, zeigen sich z.T. beträchtliche Schwankungen.


Tab. 4.1: Einfache und multiple Korrelationen auf Klas­senebene zwischen Klimadimensionen Ausprägun­gen auf kognitiven Variablen ('Mittelung zwischen', N=34). In Klammern die Korrelatio­nen zwischen den Individualwerten ('Gesamt­analyse', N=600). Angaben nach DREESMANN, 1979, 1981 b)


Beispiel: 'Förderung des Selbstvertrauens im Unterricht' korreliert bei der Gesamtanalyse mit 'Er­klärung vorgestellter positiver Resultate durch den Lehrer' mit r(XY) = - .l9, bei der 'Mittelung zwischen' aber mit r(XY) = .54. An diesem Beispiel wird deutlich, wie gravierend die Interpretationsunterschiede beider Tabellen DREESMANNs gewesen wären, hätte er die einzel­nen Korrelationskoeffizienten verbalisiert
(s.a. BUR­STEIN, LINN & CAPELL, 1978; TREIBER, 1980b, 242; MAD­DALA, 1977).

ANDERSON & WALBERG (1974a; WALBERG & HAERTEL, 1980) konnten zeigen, daß die Retest-Reliabilitäten des 'Learning Environment Inventory' auf Klassenebene höher sind als auf Individualebene. Dies bestätigte auch WALBERG (1972) für Korrelationen zwischen den Klima­skalen des LEI, bzw. Leistungs- und Interessentests. GRUNFELD & GRILICHES (1960) bezeichnen dieses Phänomen als 'grouping-effect' (COHEN & NAGEL, 1934; HALADYNA, 1982; FRASER, 1981). SAHNER (1970) konnte zeigen, daß die allgemein geäußerte Vermutung, die Korrelation zwischen zwei Variablen steige mit der Höhe der Analy­seebene, stimmen kann, dies aber nicht in allen Fällen so sein muß, wie sich ja auch an dem DREESMANN-Beispiel gezeigt hat. TRICKETT & WILKINSON (1979) haben die Skaleninterkorrelationen der 'Classroom Environment Scale' (aus der Studie von TRICKETT & MOOS, 1973) erneut berechnet. Dabei wurden die Mittelwerte der Klassen untereinander und der Schüler untereinander korreliert, unabhängig, zu welchen Klassen sie gehör­ten. Es stellte sich heraus, daß die Struktur der Korrelationsmatrizen fast identisch war, wobei die Werte der Gesamtanalyse etwas niedriger lagen.

Im Grunde ist das bisher Gesagte keineswegs so neu. Schon ROBINSON (1950) hat das Problem um die individu­elle und ökologische Korrelation schon längst erkannt. Er stellte fest, daß Forscher die ökologische Korrela­tion immer dann verwendeten, wenn sie keine Individual­daten zur Verfügung hatten. Dies ist aber - wie am Beispiel der KlimaCorschung gezeigt - keineswegs immer so. Dort liegen Individualdaten vor, und man verwendet trotzdem die ökologische Korrelation. Die Schlußfolge­rung ROBINSONs lautet für diesen Fall: "It throws ser­ious doubt upor, the validity of a number of important studies made in recent years" (1950, 357). Auch wenn bei ROBINSON (1950) Fehler in der mathematischen Argu­mentation nachgewiesen werden konnten (vgl. HANUSHEK, JACKSON & KAIN, 1974), bleibt seine Aussage von höch­ster Aktualität.

Die größte Leistung ROBINSONs bestand darin, die Be­ziehungen zwischen folgenden Korrelationen ermittelt zu haben ( MOORMAN, 1979):


- Korrelation 'Gesamtanalyse'       r(t) (t = total)
- Korrelation 'Analyse zwischen'    r(b) (b = between)
- Korrelation 'Analyse innerhalb'    r(w) (w = within)


ROBINSON kommt zu folgender Beziehung:

(4.4)        


N(X) und N(Y) stehen für den Anteil der Summe der Abweichungsquadrate (zwischen den Gruppen) an der Summe der Abweichungsquadrate (Gesamtanalyse):

(4.5)         


ROBINSON fand zusätzlich heraus, daß die ökologische Korrelation (between) der Totalkorrelation entspricht, wenn der Durchschnitt der Innerhalb-Korrelationen nicht geringer als die Totalkorrelation ist, also

(4.6)         



Ebenenabhängige Effektkomponenten und Folgen ihrer Vernachlässigung Bearbeiten

TREIBER (1980b, 211) stellt in einer kleinen Übersicht die uns interessierende Hierarchie und die dazugehören­den interindividuellen Schülerdifferenzen - zerlegt in Effektkomponenten - dar (s. Abb. 4.11; vgl. ACHTENHA­GEN, 1981, 322).


Abb. 4.11: Hierarchische Zerlegung interindividueller Schülerdifferenzen in Effektkomponenten bil­dungsforschungsrelevanter Analyseebenen (n. TREIBER, 1980b, 211)


Durch Abb. 4.11 kann man zeigen, wie problematisch es ist, Forschungen auf einer Ebene ungeachtet der Be­ziehungen dieser Ebene mit den darunter- oder darü­berliegenden durchzuführen. Es fällt auf, daß insbeson­dere die Forschung zum Sozialklima die 'Clique' als Ebene zwischen Schüler und Schulklasse weitgehend außer Betracht gelassen hat. Welche Kriterien beeinflussen die Wahl einer bestimmten Analyseebene? TREIBER (1980b, 218) faßt zusammen: Die Wahl der Analyseebene wird determiniert


"- durch die Problemstellung einer Untersuchung, die z.B. individuelle Lernverläufe von Schülern oder Aspekte der Unterrichtsqualität von Schulklassen thematisiert;
- durch den Analyseplan einer Untersuchung (Art der erfaßten Unterrichtsvariablen, Unabhängigkeit der Beobachtungen, Konfundierung von Unterrichts- und Hintergrundvariablen, verfügbare Stichprobengröße);
- durch statistische Erwägungen (Instrumentenrelia­bilität, verfügbare Anzahl von Freiheitsgraden, Voraussetzungen der gewählten Prüfverfahren);
- durch praktische Erwägungen (fehlende oder unvoll­ständige Daten, Ökonomie, Mehrfacherhebung in einem Längsschnittdesign)."


Begründungen sind nur zulässig durch den Rückbezug auf die theoretische Problemstellung bzw. auf den daraus resultierenden Analyseplan. Statistische und 'prakti­sche' (so TREIBER) – besser: 'durch Mängel erzwungene' - Begründungen dürfen nicht gelten, da der gesetzte Analyseplan dann nicht mehr der Problemstellung ent­sprechen kann. Besonders problematisch wird es aber erst dann, wenn der Analyseplan der theoretischen Pro­blemstellung nicht entspricht. Es gibt bei zwei Ebenen zwei mögliche Einebenenanalysen (s. Abb. 4.12).

Grundsätzlich gilt: Individualwerte werden auf Indivi­dualebene ausgewertet, Aggregatmerkmale auf Aggregatebene. So gibt es bei der Verwendung von Einebenenanalysen nur zwei mögliche Analysemodelle, die folgende Bedingungen nach sich ziehen:


Abb. 4.12: Mögliche Einebenenanalysen bei hierarchi­scher Variablenstruktur, wobei gilt:
Y(ij) = Nachtestwert von Schüler i in Schulklasse j,

X(ij) = Vortestwert von Schüler i in Schulklasse j,  

Z(j) = Aggregatmerkmal der Schulklasse j.       


Im Modell 1 setzt man voraus, daß der Individualeffekt (X(ij)--> Y(ij)) auch durch die Aggregierung der Individualwerte (X(.j)--> Y(.j)) angemessen abgebildet werden kann. Dieses Pro­blem wurde eingehender in diesem Abschnitt behandelt. Modell 2 unterstellt, daß der Kontexteffekt (Z(j) --> Y(.j)) angemessen durch den individuellen Effekt (Z(ij)--> Y(ij)) repräsentiert werden kann. Bei Einebenenanalysen müssen also entweder die Individualeffekte aggregiert werden (Modell 1) oder die Kontexteffekte desaggregiert ('individualisiert') werden. Diese Voraussetzungen sind zwar notwendig, aber nicht hinreichend, denn bei der Verwendung von Einebenenanalysen gibt es drei Phasen, zwischen denen ein Ebenenwechsel nicht vollzogen werden darf:

Phase A: Formulierung der theoretischen Problemstellung (= Wahl des Analyseniveaus)

Phase B: Statistische Verifizierung der Phase A (= Wahl des Modell 1 oder Modell 2 gem. Abb. 4.12)

Phase C: Interpretation der Ergebnisse.


Während der Phasen A - C muß also an der einmal gewähl­ten Analyseebene festgehalten werden. Bei Vorliegen der sonstigen Voraussetzungen ergeben sich folgende Kombi­nationen (s. Tab. 4.2).

Die unter 1 und 2 genannten Phasenabfolgen sind aller­dings nur dann korrekt im Ergebnis, wenn die o.g. Voraussetzungen zutreffen, was meistens nicht der Fall ist. Bei den Phasenabfolgen 3 und 4 sind interpretato­rische Fehlschlüsse unvermeidlich. Auf diese möglichen Fehlschlüsse wird im folgenden eingegangen.


Tab. 4.2: Forschungsabläufe und darauf basierende Be­wertungen der Ergebnisinterpretation



Fehlerquellen bei der Interpretation von Forschungsbefunden Bearbeiten

Bei der Interpretation von Ergebnissen werden häufig folgenschwere Fehleinschätzungen gemacht. Diese Fehler wurden oftmals beschrieben und benannt (ACHTENHAGEN, 1981; ALKER, 1969; BOYD & IVERSEN, 1979; HUMMEL, 1972; TREIBER, 1980b; ZIEGLER, 1973). Im folgenden werden diese Fehlschlüsse ('fallacies') genauer ausdifferen­ziert und z.T. wegen fehlender Begriffsschärfe neu benannt.


Man kann zwei Fehlergruppen voneinander unterscheiden:

  • Die Fehlschlüsse 'über die Einheiten' (cross-con­text-fallacies), bei denen von Beziehungen zwischen Variablen in einem Kontext auf Beziehungen in einem anderen Kontext geschlossen wird (Kovarianz, Korrela­tion, Regressionssteigung, etc.).
  • Die Fehlschlüsse 'über die Ebenen' (cross-level­fallacies), bei denen von Beziehungen zwischen Varia­blen einer Ebene auf Beziehungen von Variablen auf einer anderen Ebene geschlossen wird.

Bei beiden Fehlschlussarten klaffen Berechnungsebene und Interpretationsebene auseinander. Die nun genauer zu beschreibenden Fehlschlüsse sollen anhand der in Ab­schnitt 4.2.1 beschriebenen drei Analysewege darge­stellt werden. Zuvor deshalb eine kurze Wiederholung.


Bei der 'Gesamtanalyse' werden die Korrelationen zwi­schen zwei Variablen über alle Schüler berechnet, wobei die Zugehörigkeit zu ihrer Klasse vernachlässigt wird (ACHTENHAGEN, 1981):


(4.7)        


Bei der 'Mittelung zwischen' werden die durchschnittli­chen Klassenleistungen (Mittelwerte) korreliert:


(4.8)        


Bei der 'Mittelung innerhalb' werden zuerst die Indi­vidualkorrelationen auf Klassenebene errechnet:


(4.9)        


Zur Erklärung der verschiedenen Fehlschlüsse könnte man genauso, anstatt des Korrelationskoeffizienten, andere Maße verwenden wie z.B. den Regressionskoeffizienten oder die Kovarianz.


Man kann folgende Fehlschlüsse voneinander unterschei­den ( s. Abb. 4. 13) :

  1. Über-die-Ebenen (ökologisch), wobei ein Schluss von Kollektivindices auf Individualeffekte vorliegt. Von wird auf geschlossen. Dies ist der in den vorherigen Abschnitten so intensiv bespro­chene Fehler, der in der Sozialklimaforschung schon fast zur Regel geworden ist.
  2. Über-die-Ebenen (individualistisch), wobei "fälsch­licherweise aus Beobachtungen der Einheiten niedri­gerer Ebene die Bedingungen der Systeme höherer Ordnung" gefolgert werden (SCHEUCH. 1977). Hierbei wird von auf geschlossen.
  3. Über-die-Ebenen (selektiv), wobei von den individu­ellen Beziehungen innerhalb eines Kollektives auf die Intergruppenbeziehungen geschlossen wird.
  4. Über-die-Ebenen (universalistisch), wobei von den Intergruppenbeziehungen auf die Beziehungen innerhalb eines Kontextes geschlossen wird.
  5. Über-die-Einheiten (individualistisch), wobei von individuellen Beziehungen in den Kollektiven auf die Gesamtkorrelation ge­schlossen wird.
  6. Über-die-Einheiten (ökologisch), wobei von auf geschlossen wird.
  7. Über-die-Einheiten (gleichbleibend), wobei von den Beziehungen innerhalb des einen Kollektivs auf die Beziehungen innerhalb eines ande­ren Kollektivs geschlossen wird.
Abb. 4.13: Systematik der Fehlschlüsse


In Anlehnung an ALKER (1969) und ZIEGLER (1973) lassen sich diese Fehlschlussarten unter Zuhilfenahme des Kova­rianztheorems für
2 Gruppen einer Population wie folgt darstellen:


(4.10)         


wobei gilt:

   die individuelle Kovarianz zwischen den Varia­blen X und Y in der Population,
   die Kovarianz zwischen den individuellen Merk­malen im j-ten Kollektiv,
   die ökologische Korrelation zwischen den kol­lektiven analytischen Merkmalen X und Y.


Verfolgt man bildlich die Pfeile in Abb. 4.13, so lässt sich folgendes feststellen: Der Startpunkt eines Pfeiles ist der dem Forscher vorliegende Befund, der Zielpunkt ist der Befund, von dem der Forscher glaubt, dass er ihm vorliegt und auf den er seine Interpretatio­nen stützt.

Soweit die Darstellung der schwerwiegenden Probleme, denen sich die Sozialklimaforschung zu stellen hat. Offen ist nun die Frage, ob es dazu Alternativen oder Lösungsmöglichkeiten gibt. Diese Frage lässt sich nicht leicht beantworten, aber es gibt eine Gruppe von Analy­sestrategien, die Mehrebenenanalysen, die diese Proble­me adäquater zu lösen versuchen. In ihnen ist die methodische Einbettung einer zukünftigen Sozialklima­forschung zu sehen.

Zusammenfassung Bearbeiten

Dieses Kapitel behandelte methodische Probleme bei der empirischen Erfassung des Sozialklimas und versuchte, neue Wege aufzuzeigen. Das Kapitel gliederte sich in zwei Teile. Im ersten wurde unter Rückbezug auf wissen­schaftstheoretische Fragestellungen geklärt, warum es notwendig ist, zwischen individuellen und kollektiven Phänomenen zu unterscheiden. Unmittelbar damit hängt die Diskussion über Formen der Aggregierung, die Wahl der Analyseebene und das Problem der Indexbildung zu­sammen. Es zeigte sich, daß das Sozialklima von Schulklassen nur dann als kollektives Phänomen betrach­tet werden kann, wenn die drei letztgenannten Punkte adäquat in der empirischen Forschung berücksichtigt werden.

Im zweiten Abschnitt wurden die schwerwiegenden Nach­teile bei der Verwendung des Mittelwertes in der So­zialklimaforschung aufgezeigt. Der Mittelwert ist ein geeigneter Index zur Beschreibung des Sozialklimas in einer Gruppe. Sein Einbezug in korrelationsstatistische Analysen kann aber erhebliche Interpretationsfehler nach sich ziehen. Dabei zeigte es sich, daß die Verwen­dung des Mittelwertes in dieser Art und Weise nur ein Spezialfall von möglichen Fehlerquellen bei der Inter­pretation von Forschungsbefunden ist.

Ohne hier noch einmal auf die einzelnen Verfahren ein­zugehen, kann gesagt werden, daß der Kreativität zur Bildung theoretisch notwendiger Modelle in diesem Be­reich keine Grenzen gesetzt sind.