Sozialklima von Gruppen: Probleme bei der Verwendung des Mittelwertes

– Inhaltsverzeichnis –

Die Schätzung des Populationskorrelationskoeffizienten

Dieses Kapitel ist den Problemen gewidmet, die dann auftauchen, wenn man den Mittelwert als Index für eine analytische Variable, wie sie das Sozialklima ist, heranzieht. Keine Probleme treten auf, wenn der Mittelwert nur deskriptiv bei der Darstellung von Ergebnissen verwendet wird (z.B. bei deCHARMS, 1973). Dabei bleibt es aber meistens nicht, denn gerade in der Sozialklimaforschung wurde der Mittelwert als Basis von korrelationsstatistischen Analysen häufig herangezogen. Man kann die Strategien der Ermittlung von Korrelationen aber nicht einfach der Dichotomie Individualwertekorrelation - Mittelwertekorrelation zuordnen. Im folgenden werden deshalb alternative Möglichkeiten zur Schätzung des Populationskorrelationskoeffizienten gezeigt und geprüft.

SIROTNIK, 1980 (GUILFORD, 1965; DREESMANN, 1981b; ROBINSON, 1950; SLATIN, 1969) unterscheiden allgemein drei Verfahrensweisen, wie man Individualwerte verrechnen kann:

die $'Gesamtanalyse':$ Alle Schüler der Untersuchung sind Basis der Auswertung $(Ergebnis\!:r(XY))$ ,

die $'Mittelung\ innerhalb':$ Innerhalb jeder Klasse werden die Individualwerte korreliert,
anschließend werden diese Korrelationskoeffizienten über alle Klassen gemittelt $(Ergebnis\!:{\bar {r}}(XY))$ ,

die $'Mittelung\ zwischen':$ Die Mittelwerte der Klassen werden korreliert $(Ergebnis\!:r({\bar {X}}{\bar {Y}}))$ .

Auch wenn die Begriffe, die SIROTNIK verwendeten, an die Varianzanalyse erinnern und mißverständlich sein können, wollen wir diese doch weiter benutzen, da sie sich in diesem Zusammenhang durchgesetzt haben (s. KNAPP, 1977).

WALBERG & WELCH (1967; s.a. KLAUER, 1974, 100) haben eine vierte Möglichkeit vorgestellt, die Korrelation zwischen Variablen in der Population zu schätzen: die 'randomized data collection' . Dabei werden aus einer Klasse mehrere Schüler zufällig ausgewählt. Aus den Individualwerten dieser Schüler werden Mittelwerte berechnet. Diese sind - wie bei der 'Mittelung zwischen' - Basis der weiteren Korrelationsberechnungen (Ergebnis: r(ran)). WALBERG et al. (1967) gehen bei diesem Vorgehen davon aus, dass jede beliebige Stichprobe von Schülern einer Klasse ein gültiges Bild des Klimas dieser Klasse geben kann. Der durch die randomized data collection ermittelte Korrelationskoeffizient stellt somit eine gute Schätzung der‚ 'Mittelung zwischen' dar $(r({\bar {X}}{\bar {Y}})=r(ran))$ .

Forderungen, die dargestellten Verfahren synchron an einem Datensatz zu rechnen, gibt es genug, an entsprechenden Durchführungen mangelt es noch (z.B. CRONBACH & WEBB, 1975; v. SALDERN & LITTIG, 1985)

Im folgenden werden die vier Möglichkeiten der Schätzung des 'wahren' Korrelationskoeffizienten zusammenfassend dargestellt. In Abb. 4.7 sind die vier Vorgehensweisen grafisch anhand von zwei Klassen mit je sieben Schülern und den beiden Merkmalen X und Y zusammengefaßt

Nun muß noch geklärt werden, was die einzelnen Koeffizienten eigentlich aussagen. Der Klärung dieser Frage ist das nächste Kapitel gewidmet.

Zur Gültigkeit von Aussagen auf höherer Analyseebene

Der Sozialklimaindex kann nur durch Verrechnung von Individualwerten gewonnen werden. Wenn man die Klasse als ein durch Individuen gebildetes Kollektiv betrachtet, kann man z.B. drei mögliche Effekte zwischen zwei Variablen feststellen. Diese sollen an einem Beispiel verdeutlicht werden, wobei die Kohäsion die unabhängige Variable und die Lernleistung eines Schülers die abhängige Variable ist.

(1) Individueller Effekt: Die Tatsache, daß ein Schüler die Kohäsion positiv wahrnimmt, kann die Wahrscheinlichkeit, daß dieser Schüler auch gute Lernleistungen bringt, steigen oder sinken lassen, unabhängig davon, wieviele Schüler mit positiver Kohäsionswahrnehmung in der Klasse vorhanden sind.

(2) Kontexteffekt: Der Anteil der Schüler mit positiver Kohäsionswahrnehmung in der Klasse kann die Wahrscheinlichkeit, daß ein Schüler eine gute oder schlechte Lernleistung zeigt, beeinflussen.

(3) Wechselwirkungen zwischen individuellem Effekt und Kontexteffekt: Es bestehen zwei mögliche Wechselwirkungen. Einmal kann die Tatsache, daß ein Schüler die Kohäsion positiv wahrnimmt, die Wahrscheinlichkeit, daß dieser Schüler gute Lernleistungen bringt, steigen oder sinken lassen, aber abhängig von der Zahl der Schüler mit positiver Kohäsionswahrnehmung in dieser Klasse (vgl.(1)). Zum anderen kann der Anteil der Schüler mit positiver Kohäsionswahrnehmung die Wahrscheinlichkeit, ob dieser Schüler gute oder schlechte Lernleistungen zeigt, verschieden stark beeinflussen (vgl.(2)). Beide Wechselwirkungen sind logisch äquivalent.

Welche Wirkung diese Effekte auf die Gültigkeit einer Aussage auf höherer Analyseebene haben, wird im folgen-den Beispiel deutlich: Angenommen, bei einer Untersuchung wurden ausschließlich die Mittelwerte der Klassen ('Mittelung zwischen' oder randomized data collection) als weitere Berechnungsgrundlage herangezogen und angenommen, es wird folgendes (fingiertes) Forschungsergebnis veröffentlicht:

Klassen mit hoher Kohäsion haben eine bessere Lernleistung leistung als Klassen mit niederer Kohäsion.

Man kann im folgenden sehen, daß dieses Ergebnis keineswegs eindeutig ist, da es zumindest zwei Fragen offen läßt:

Was leisten die Schüler mit niedriger Kohäsionswahrnehmung in Klassen mit durchschnittlich hoher Kohäsion?

Was leisten die Schüler mit hoher Kohäsionswahrnehmung in Klassen mit durchschnittlich niedriger Kohäsion?

In ähnlicher Weise wird die Ableitung einer Kollektivaussage aus einer Menge von Individualaussagen von HUMMEL (1972) problematisiert: "Wenn auf der Ebene von Individuen bzw. Paaren qualitative Je-desto-Aussagen gültig sind und ... wenn die Gruppeneigenschaften als verallgemeinerte Mittelwerte aus den individuellen Eigenschaften konstruiert sind, dann ist für die Ebene der Gruppe keine Aussage deduzierbar!" (1972, 44). Die Ableitung von einer Ebene auf eine andere ist in sozialwissenschaftlichen Aussagesystemen unzulässig.

Es läßt sich folgern, daß ein empirisches Forschungsergebnis, welches sich nur auf Mittelwerte der Klassenebene als höhere Analyseebene stützt, verschiedene Interpretationsmöglichkeiten zuläßt. Korrelationstabellen, die auf der 'Mittelung zwischen' basieren, sind daher schwer zu interpretieren, da Individualeffekte, Kontexteffekte und Wechselwirkungen zwischen beiden in einer Mittelwertkorrelation nicht auseinanderzuhalten sind (Beispiel: HALADYNA, OLSON & SHAUGHNESSY, 1983). Genauer wäre es, das o.g. fingierte Forschungsergebnis als Folge eines falschen methodischen Vorgehens anzusehen. Die vier oben genannten Interpretationen kommen zustande, weil man sich methodisch ausschließlich auf Mittelwerte bezogen hat (vgl. WELZ, 1974). Wie soll man aber nun die erhobenen Individualdaten statistisch weiter verarbeiten und dabei dem Klimakonzept trotzdem gerecht werden?

Diese Frage lässt sich eigentlich nur dann befriedigend beantworten, wenn die Beziehungen zwischen den beiden angesprochenen Analyseebenen deutlicher sind. Im folgenden Abschnitt wird deshalb das Verhältnis zwischen Individual- und Aggregatebene näher beleuchtet.

Die Beziehungen zwischen der Individual- und höheren Analyseebenen

Die im vorigen Abschnitt problematisierten Aussagen auf höherer Analyseebene lassen sich leicht begründen. Der Einfachheit halber beziehen sich folgende Ausführungen dabei auf den linearen Fall ohne Wechselwirkungen. Bei einer Regression von der Variablen Y auf die Variable X auf Mittelwertebasis kommt man zu folgender Formel:

(4.1)

{\bar {Y}}_{.j}=a+b_{XY}{\bar {X}}_{.j}+e_{j}

Bei der Regression auf Individualebene geht man analog von folgender Formel aus:

(4.2)

Y_{ij}=a+b_{XY}X_{ij}+e_{ij}

Bei einer Analyse auf Mittelwertebasis und Interpretation auf Individualebene setzt man voraus, dass

(4.3)

b_{XY}=b_{XY(A)}=b_{XY(B)}=...b_{XY(N)}

wobei A...N = Gruppenindex.

D.h., daß die Steigungen der Regressionsgerade in den Gruppen identisch sind mit der der Mittelwerte. Dies kommt aber in den seltensten Fällen vor. Ein kleines Beispiel soll dies verdeutlichen: Angenommen es lägen von vier Klassen die Individual- und Mittelwerte der oben schon im Beispiel verwendeten Variablen Kohäsion und Lernleistung vor.

In Abb. 4.8 sind zwei mögliche Verteilungen der Mittelwerte (Punkte), der Individualwerte auf Klassenebene (kleine Ellipsen) und für die Gesamtstichprobe zwischen zwei Variablen wiedergegeben.

Es wird anhand dieser einfachen Abbildung (n. WALBERG, 1976) deutlich, dass man bei der Gesamtanalyse (also über alle Klassen hinweg) die Beziehungen innerhalb der Klassen nicht berücksichtigt. Ein Fehlschluss würde bei Stichprobe 1 nicht auftreten, da die Regressionslinie der Gesamtanalyse der innerhalb der einzelnen Klassen entspricht. Bei Stichprobe 2 dagegen stehen die Regressionslinien sogar senkrecht auf der der Gesamtanalyse (s.a. ECKEL, 1970; CONKLIN & BURSTEIN, 1980; v. SALDERN, 1982).

Zu solchen Ergebnissen kann man kommen, wenn man die Mittelwerte der Klassen korreliert ( 'Mittelung zwischen' ), die Korrelationen auf Klassenebene über die Gesamtstichprobe mittelt ( 'Mittelung innerhalb' ) oder die 'randomized data collection' durchführt. Letzteres geht aber nur, wenn die Annahme von WALBERG & WELCH (1967) zutrifft, dass eine Stichprobe von Schülern einer Klasse das Klima adäquat abbilden kann.

Einige der möglichen Beziehungen zwischen der Individual- und Aggregatebene sind in Abb. 4.9 zusammengefaßt. Ebenso sind dort die daraus resultierenden Interpretationsfehler vermerkt. Es wird deutlich, wie gravierend die Unterschiede der Zusammenhänge zweier Variablen auf beiden Ebenen sein können (s.a. ALWIN & OTTO, 1977; LINCOLN & ZEITZ, 1980). Dabei sind nur lineare Zusammenhänge ohne Wechselwirkungen berücksichtigt. Auch wurden die Fälle ausgeschlossen, in denen sich die Steigungen der Regressionsgeraden innerhalb der Klassen auch noch unterscheiden (b( A) <> b(B) <> b(C)). Im letzteren Falle nämlich wäre die Lage noch prekärer, da die Beziehungen zwischen beiden Ebenen mehrdeutig wären.

Die Gesamtanalyse unterschlägt die Gruppeneffekte, während die 'Mittelung zwischen' (ebenso wie die 'randomized data collection') das Verhältnis von Individual- und Gruppeneffekten offen läßt: "Die Individualbeziehung kann Null sein oder sogar entgegengesetztes Vorzeichen haben. Umgekehrt impliziert die Nicht-Existenz einer Kollektivbeziehung nicht die Abwesenheit einer Individualbeziehung" (BOUDON, 1976, 469 ff.). Eine naheliegende, allerdings falsche - wie noch später begründet werden wird - Lösung wäre, wenn man für jeden Datensatz sowohl die Gesamtanalyse wie auch die 'Mittelung zwischen' durchführte, was verschiedentlich in der Sozialklimaforschung bereits geschehen ist.

Problematisch ist dabei z. T. die Begründung für das Heranziehen beider Analyseebenen: Der Gruppenmittelwert wurde zur Erfassung der Variable 'objektive Umwelt' herangezogen, der Individualwert sollte dann die individuelle 'subjektive Ausprägung' auf dieser Variablen darstellen (Beispiel: EIRMBTER, 1979, 717; vgl. PERVIN, 1975, 38). Wie schon BARKER (1968, 78) richtig bemerkt, würde man sich dann aber in einem tautologischen Zirkel befinden, aus dem es kein Entrinnen gäbe, da der Mittelwert aus den Individualwerten gebildet wird. JAMES & JONES (1974) weisen zwar auf die Notwendigkeit der Entscheidung zwischen Individual- und Mittelwert hin, geben selbst aber keine Ratschläge.

Dies ist bedauerlich, wenn man bedenkt, welche Auswirkungen die Aggregierung von Individualdaten auf die Verteilungsparameter hat. In Abb. 4.10 wird deutlich, daß die Aggregierung keinen beachtenswerten Einfluß auf den Mittelwert hat, sich aber stark auf die Streuung auswirkt. Diese wird mit steigender Aggregatebene kleiner (vgl. KLITGAARD, 1975; TREIBER, 1981).

Um zu zeigen, wie sich die Beziehungen zwischen den beiden Analyseebenen praktisch auswirken, werden im folgenden Abschnitt Vergleiche von empirisch gewonnenen Ergebnissen durchgeführt.

Vergleich von Korrelationsanalysen auf Individual- und Aggregatebene

In den meisten empirischen Arbeiten im Rahmen der Sozialklimaforschung wurden korrelationsstatistische Verfahren angewendet, um Zusammenhänge zwischen Klimawerten und z. B. Leistungsvariablen zu ermitteln. Im vorherigen Abschnitt wurde deutlich, wie verzerrend eine Korrelationsanalyse auf Aggregatebene wirkt. Es liegen einige wenige Datensätze vor, die das bereits Gesagte untermauern.

So hat DREESMANN die Daten einer Untersuchung zum Unterrichtsklima zweimal analysiert: 1979 stellt er die Korrelationen zwischen kognitiven Variablen der Schüler und ihren Wahrnehmungen der einzelnen Umweltdimensionen dar. Dabei hat er die Mittelung zwischen' durchgeführt, also die Klassenmittelwerte korreliert. Diese Vorgehensweise wurde bereits abgelehnt, da die Korrelationskoeffizienten zu viele Interpretationsmöglichkeiten zulassen. In einer späteren Veröffentlichung (DREESMANN, 1981b, im Original Tab. 1) stellt DREESMANN eine nahezu identische Tabelle vor, welche nun aber die Korrelationskoeffizienten der Gesamtanalyse über alle Klassen wiedergibt (Ausschnitte beider Tabellen sind in Tab. 4.1 zusammengefaßt). Diese Werte sagen aber wiederum nichts über die Gruppeneffekte aus (s.o.). DREESMANN bezieht sich bei der Interpretation seiner beiden Tabellen vorwiegend auf die multiplen Korrelationen zwischen beiden Variablensätzen. Die multiplen Kollektivkorrelationen (in Tab. 4.1, letzte Spalte in Klammern) liegen allesamt über den multiplen Individualkorrelationen (s. dazu JONES & JAMES, 1979). Auch die Rangfolge der Werte beider Analysen liegt in etwa gleich. Bei einem inhaltlichen Vergleich der multiplen Korrelationen beider Analyseebenen wird man also zu gleichen Ergebnissen kommen. Anders gestaltet sich die Lage bei dem Vergleich der einfachen Korrelationen: Wenn auch in den meisten Fällen das Vorzeichen der Individualkorrelation mit dem der Kollektivkorrelation übereinstimmt, zeigen sich z.T. beträchtliche Schwankungen.

Beispiel: 'Förderung des Selbstvertrauens im Unterricht' korreliert bei der Gesamtanalyse mit 'Erklärung vorgestellter positiver Resultate durch den Lehrer' mit r(XY) = - .l9, bei der 'Mittelung zwischen' aber mit r(XY) = .54. An diesem Beispiel wird deutlich, wie gravierend die Interpretationsunterschiede beider Tabellen DREESMANNs gewesen wären, hätte er die einzelnen Korrelationskoeffizienten verbalisiert
(s.a. BURSTEIN, LINN & CAPELL, 1978; TREIBER, 1980b, 242; MADDALA, 1977).

ANDERSON & WALBERG (1974a; WALBERG & HAERTEL, 1980) konnten zeigen, daß die Retest-Reliabilitäten des 'Learning Environment Inventory' auf Klassenebene höher sind als auf Individualebene. Dies bestätigte auch WALBERG (1972) für Korrelationen zwischen den Klimaskalen des LEI, bzw. Leistungs- und Interessentests. GRUNFELD & GRILICHES (1960) bezeichnen dieses Phänomen als 'grouping-effect' (COHEN & NAGEL, 1934; HALADYNA, 1982; FRASER, 1981). SAHNER (1970) konnte zeigen, daß die allgemein geäußerte Vermutung, die Korrelation zwischen zwei Variablen steige mit der Höhe der Analyseebene, stimmen kann, dies aber nicht in allen Fällen so sein muß, wie sich ja auch an dem DREESMANN-Beispiel gezeigt hat. TRICKETT & WILKINSON (1979) haben die Skaleninterkorrelationen der 'Classroom Environment Scale' (aus der Studie von TRICKETT & MOOS, 1973) erneut berechnet. Dabei wurden die Mittelwerte der Klassen untereinander und der Schüler untereinander korreliert, unabhängig, zu welchen Klassen sie gehörten. Es stellte sich heraus, daß die Struktur der Korrelationsmatrizen fast identisch war, wobei die Werte der Gesamtanalyse etwas niedriger lagen.

Im Grunde ist das bisher Gesagte keineswegs so neu. Schon ROBINSON (1950) hat das Problem um die individuelle und ökologische Korrelation schon längst erkannt. Er stellte fest, daß Forscher die ökologische Korrelation immer dann verwendeten, wenn sie keine Individualdaten zur Verfügung hatten. Dies ist aber - wie am Beispiel der KlimaCorschung gezeigt - keineswegs immer so. Dort liegen Individualdaten vor, und man verwendet trotzdem die ökologische Korrelation. Die Schlußfolgerung ROBINSONs lautet für diesen Fall: "It throws serious doubt upor, the validity of a number of important studies made in recent years" (1950, 357). Auch wenn bei ROBINSON (1950) Fehler in der mathematischen Argumentation nachgewiesen werden konnten (vgl. HANUSHEK, JACKSON & KAIN, 1974), bleibt seine Aussage von höchster Aktualität.

Die größte Leistung ROBINSONs bestand darin, die Beziehungen zwischen folgenden Korrelationen ermittelt zu haben ( MOORMAN, 1979):

- Korrelation 'Gesamtanalyse' r(t) (t = total)

- Korrelation 'Analyse zwischen' r(b) (b = between)

- Korrelation 'Analyse innerhalb' r(w) (w = within)

ROBINSON kommt zu folgender Beziehung:

(4.4)

r_{t}=N_{X}N_{Y}r_{b}+{\sqrt {1-N_{X}^{2}}}\cdot {\sqrt {1-N_{Y}^{2}}}

N(X) und N(Y) stehen für den Anteil der Summe der Abweichungsquadrate (zwischen den Gruppen) an der Summe der Abweichungsquadrate (Gesamtanalyse):

(4.5)

N_{X}={\frac {\sum _{j}n_{j}(X_{j}-X)^{2}}{\sum _{i}\sum _{j}(X_{ij}-X)^{2}}}

ROBINSON fand zusätzlich heraus, daß die ökologische Korrelation (between) der Totalkorrelation entspricht, wenn der Durchschnitt der Innerhalb-Korrelationen nicht geringer als die Totalkorrelation ist, also

(4.6)

r_{w}=r_{t}{\frac {1-N_{X}N_{Y}}{{\sqrt {1-N_{X}}}\cdot {\sqrt {1-N_{Y}}}}}

Ebenenabhängige Effektkomponenten und Folgen ihrer Vernachlässigung

TREIBER (1980b, 211) stellt in einer kleinen Übersicht die uns interessierende Hierarchie und die dazugehörenden interindividuellen Schülerdifferenzen - zerlegt in Effektkomponenten - dar (s. Abb. 4.11; vgl. ACHTENHAGEN, 1981, 322).

Durch Abb. 4.11 kann man zeigen, wie problematisch es ist, Forschungen auf einer Ebene ungeachtet der Beziehungen dieser Ebene mit den darunter- oder darüberliegenden durchzuführen. Es fällt auf, daß insbesondere die Forschung zum Sozialklima die 'Clique' als Ebene zwischen Schüler und Schulklasse weitgehend außer Betracht gelassen hat. Welche Kriterien beeinflussen die Wahl einer bestimmten Analyseebene? TREIBER (1980b, 218) faßt zusammen: Die Wahl der Analyseebene wird determiniert

"- durch die Problemstellung einer Untersuchung, die z.B. individuelle Lernverläufe von Schülern oder Aspekte der Unterrichtsqualität von Schulklassen thematisiert;

- durch den Analyseplan einer Untersuchung (Art der erfaßten Unterrichtsvariablen, Unabhängigkeit der Beobachtungen, Konfundierung von Unterrichts- und Hintergrundvariablen, verfügbare Stichprobengröße);

- durch statistische Erwägungen (Instrumentenreliabilität, verfügbare Anzahl von Freiheitsgraden, Voraussetzungen der gewählten Prüfverfahren);

- durch praktische Erwägungen (fehlende oder unvollständige Daten, Ökonomie, Mehrfacherhebung in einem Längsschnittdesign)."

Begründungen sind nur zulässig durch den Rückbezug auf die theoretische Problemstellung bzw. auf den daraus resultierenden Analyseplan. Statistische und 'praktische' (so TREIBER) – besser: 'durch Mängel erzwungene' - Begründungen dürfen nicht gelten, da der gesetzte Analyseplan dann nicht mehr der Problemstellung entsprechen kann. Besonders problematisch wird es aber erst dann, wenn der Analyseplan der theoretischen Problemstellung nicht entspricht. Es gibt bei zwei Ebenen zwei mögliche Einebenenanalysen (s. Abb. 4.12).

Grundsätzlich gilt: Individualwerte werden auf Individualebene ausgewertet, Aggregatmerkmale auf Aggregatebene. So gibt es bei der Verwendung von Einebenenanalysen nur zwei mögliche Analysemodelle, die folgende Bedingungen nach sich ziehen:

Y(ij) = Nachtestwert von Schüler i in Schulklasse j,

X(ij) = Vortestwert von Schüler i in Schulklasse j,

Z(j) = Aggregatmerkmal der Schulklasse j.

Im Modell 1 setzt man voraus, daß der Individualeffekt (X(ij)--> Y(ij)) auch durch die Aggregierung der Individualwerte (X(.j)--> Y(.j)) angemessen abgebildet werden kann. Dieses Problem wurde eingehender in diesem Abschnitt behandelt. Modell 2 unterstellt, daß der Kontexteffekt (Z(j) --> Y(.j)) angemessen durch den individuellen Effekt (Z(ij)--> Y(ij)) repräsentiert werden kann. Bei Einebenenanalysen müssen also entweder die Individualeffekte aggregiert werden (Modell 1) oder die Kontexteffekte desaggregiert ('individualisiert') werden. Diese Voraussetzungen sind zwar notwendig, aber nicht hinreichend, denn bei der Verwendung von Einebenenanalysen gibt es drei Phasen, zwischen denen ein Ebenenwechsel nicht vollzogen werden darf:

Phase A: Formulierung der theoretischen Problemstellung (= Wahl des Analyseniveaus)

Phase B: Statistische Verifizierung der Phase A (= Wahl des Modell 1 oder Modell 2 gem. Abb. 4.12)

Phase C: Interpretation der Ergebnisse.

Während der Phasen A - C muß also an der einmal gewählten Analyseebene festgehalten werden. Bei Vorliegen der sonstigen Voraussetzungen ergeben sich folgende Kombinationen (s. Tab. 4.2).

Die unter 1 und 2 genannten Phasenabfolgen sind allerdings nur dann korrekt im Ergebnis, wenn die o.g. Voraussetzungen zutreffen, was meistens nicht der Fall ist. Bei den Phasenabfolgen 3 und 4 sind interpretatorische Fehlschlüsse unvermeidlich. Auf diese möglichen Fehlschlüsse wird im folgenden eingegangen.

Fehlerquellen bei der Interpretation von Forschungsbefunden

Bei der Interpretation von Ergebnissen werden häufig folgenschwere Fehleinschätzungen gemacht. Diese Fehler wurden oftmals beschrieben und benannt (ACHTENHAGEN, 1981; ALKER, 1969; BOYD & IVERSEN, 1979; HUMMEL, 1972; TREIBER, 1980b; ZIEGLER, 1973). Im folgenden werden diese Fehlschlüsse ('fallacies') genauer ausdifferenziert und z.T. wegen fehlender Begriffsschärfe neu benannt.

Man kann zwei Fehlergruppen voneinander unterscheiden:

Die Fehlschlüsse 'über die Einheiten' (cross-context-fallacies), bei denen von Beziehungen zwischen Variablen in einem Kontext auf Beziehungen in einem anderen Kontext geschlossen wird (Kovarianz, Korrelation, Regressionssteigung, etc.).

Die Fehlschlüsse 'über die Ebenen' (cross-levelfallacies), bei denen von Beziehungen zwischen Variablen einer Ebene auf Beziehungen von Variablen auf einer anderen Ebene geschlossen wird.

Bei beiden Fehlschlussarten klaffen Berechnungsebene und Interpretationsebene auseinander. Die nun genauer zu beschreibenden Fehlschlüsse sollen anhand der in Abschnitt 4.2.1 beschriebenen drei Analysewege dargestellt werden. Zuvor deshalb eine kurze Wiederholung.

Bei der 'Gesamtanalyse' werden die Korrelationen zwischen zwei Variablen über alle Schüler berechnet, wobei die Zugehörigkeit zu ihrer Klasse vernachlässigt wird (ACHTENHAGEN, 1981):

(4.7)

r_{XY}={\frac {\sum _{j}\sum _{i}(X_{ij}-{\bar {X}})(Y_{ij}-{\bar {Y}})}{\sqrt {\sum _{j}\sum _{i}(X_{ij}-{\bar {X}})^{2}\sum _{j}\sum _{i}(Y_{ij}-{\bar {Y}})^{2}}}}

Bei der 'Mittelung zwischen' werden die durchschnittlichen Klassenleistungen (Mittelwerte) korreliert:

(4.8)

r_{{\bar {X}}{\bar {Y}}}={\frac {\sum _{j}n_{j}({\bar {X}}_{j}-{\bar {X}})({\bar {Y}}_{j}-{\bar {Y}})}{\sqrt {\sum _{j}n_{j}({\bar {X}}_{j}-{\bar {X}})^{2}\sum _{j}n_{j}({\bar {Y}}_{j}-{\bar {Y}})^{2}}}}

Bei der 'Mittelung innerhalb' werden zuerst die Individualkorrelationen auf Klassenebene errechnet:

(4.9)

r_{XY.j}={\frac {\sum _{j}\sum _{i}(X_{ij}-{\bar {X}})(Y_{ij}-{\bar {Y}}_{j})}{\sqrt {\sum _{j}\sum _{i}(X_{ij}-{\bar {X}}_{j})^{2}\sum _{j}\sum _{i}(Y_{ij}-{\bar {Y}}_{j})^{2}}}}

Zur Erklärung der verschiedenen Fehlschlüsse könnte man genauso, anstatt des Korrelationskoeffizienten, andere Maße verwenden wie z.B. den Regressionskoeffizienten oder die Kovarianz.

Man kann folgende Fehlschlüsse voneinander unterscheiden ( s. Abb. 4. 13) :

Über-die-Ebenen (ökologisch), wobei ein Schluss von Kollektivindices auf Individualeffekte vorliegt. Von $r({\bar {X}}{\bar {Y}})$ wird auf $r(XY)$ geschlossen. Dies ist der in den vorherigen Abschnitten so intensiv besprochene Fehler, der in der Sozialklimaforschung schon fast zur Regel geworden ist.
Über-die-Ebenen (individualistisch), wobei "fälschlicherweise aus Beobachtungen der Einheiten niedrigerer Ebene die Bedingungen der Systeme höherer Ordnung" gefolgert werden (SCHEUCH. 1977). Hierbei wird von $r(XY)$ auf $r({\bar {X}}{\bar {Y}})$ geschlossen.
Über-die-Ebenen (selektiv), wobei von den individuellen Beziehungen innerhalb eines Kollektives $(r(XY.j))$ auf die Intergruppenbeziehungen $(r({\bar {X}}{\bar {Y}}))$ geschlossen wird.
Über-die-Ebenen (universalistisch), wobei von den Intergruppenbeziehungen $(r({\bar {X}}{\bar {Y}}))$ auf die Beziehungen innerhalb eines Kontextes $(r(XY.j))$ geschlossen wird.
Über-die-Einheiten (individualistisch), wobei von individuellen Beziehungen in den Kollektiven $(r(XY.j))$ auf die Gesamtkorrelation $(r(XY))$ geschlossen wird.
Über-die-Einheiten (ökologisch), wobei von $r(XY)$ auf $r(XY.j)$ geschlossen wird.
Über-die-Einheiten (gleichbleibend), wobei von den Beziehungen innerhalb des einen Kollektivs $(r(XY.j))$ auf die Beziehungen innerhalb eines anderen Kollektivs $(r(XY.j+1)$ geschlossen wird.

In Anlehnung an ALKER (1969) und ZIEGLER (1973) lassen sich diese Fehlschlussarten unter Zuhilfenahme des Kovarianztheorems für
2 Gruppen einer Population wie folgt darstellen:

(4.10)

{\boldsymbol {C_{XY}=C_{XY.1}+C_{XY.2}+r_{XY}}}

wobei gilt:

$C(XY)\qquad :$    die individuelle Kovarianz zwischen den Variablen X und Y in der Population,
$C(XY.j)\quad :$    die Kovarianz zwischen den individuellen Merkmalen im j-ten Kollektiv,
$r(XY)\qquad :$    die ökologische Korrelation zwischen den kollektiven analytischen Merkmalen X und Y.

Verfolgt man bildlich die Pfeile in Abb. 4.13, so lässt sich folgendes feststellen: Der Startpunkt eines Pfeiles ist der dem Forscher vorliegende Befund, der Zielpunkt ist der Befund, von dem der Forscher glaubt, dass er ihm vorliegt und auf den er seine Interpretationen stützt.

Soweit die Darstellung der schwerwiegenden Probleme, denen sich die Sozialklimaforschung zu stellen hat. Offen ist nun die Frage, ob es dazu Alternativen oder Lösungsmöglichkeiten gibt. Diese Frage lässt sich nicht leicht beantworten, aber es gibt eine Gruppe von Analysestrategien, die Mehrebenenanalysen, die diese Probleme adäquater zu lösen versuchen. In ihnen ist die methodische Einbettung einer zukünftigen Sozialklimaforschung zu sehen.

Zusammenfassung

Dieses Kapitel behandelte methodische Probleme bei der empirischen Erfassung des Sozialklimas und versuchte, neue Wege aufzuzeigen. Das Kapitel gliederte sich in zwei Teile. Im ersten wurde unter Rückbezug auf wissenschaftstheoretische Fragestellungen geklärt, warum es notwendig ist, zwischen individuellen und kollektiven Phänomenen zu unterscheiden. Unmittelbar damit hängt die Diskussion über Formen der Aggregierung, die Wahl der Analyseebene und das Problem der Indexbildung zusammen. Es zeigte sich, daß das Sozialklima von Schulklassen nur dann als kollektives Phänomen betrachtet werden kann, wenn die drei letztgenannten Punkte adäquat in der empirischen Forschung berücksichtigt werden.

Im zweiten Abschnitt wurden die schwerwiegenden Nachteile bei der Verwendung des Mittelwertes in der Sozialklimaforschung aufgezeigt. Der Mittelwert ist ein geeigneter Index zur Beschreibung des Sozialklimas in einer Gruppe. Sein Einbezug in korrelationsstatistische Analysen kann aber erhebliche Interpretationsfehler nach sich ziehen. Dabei zeigte es sich, daß die Verwendung des Mittelwertes in dieser Art und Weise nur ein Spezialfall von möglichen Fehlerquellen bei der Interpretation von Forschungsbefunden ist.

Ohne hier noch einmal auf die einzelnen Verfahren einzugehen, kann gesagt werden, daß der Kreativität zur Bildung theoretisch notwendiger Modelle in diesem Bereich keine Grenzen gesetzt sind.

Zurück | Hoch | Weiter