beim GLM gehen wir davon aus, dass die Residuen unabhängig voneinander sind
Annahme ist verletzt, wenn die Fälle der Stichprobe nicht unabhängig voneinander sind
typische Fälle sind (a) zeitliche Abhängigkeiten, z.B. durch Messwiederholung, und (b) Abhängigkeiten durch geschachtelte Daten
wenn Unabhängigkeitsannahme verletzt ist, werden (a) Schätzer verzerrt sein und (b) die Standardfehler zu klein, d.h. erhöhtes Risiko für Alpha-Fehler
Was sind geschachtelte (nested) Daten?
Level-1-Einheiten gehören zu/sind geschachtelt in Level-2-Einheiten.
Schüler geschachtelt in Klassen oder Schulen
Beiträge geschachtelt in Nachrichtenoutlets, Accounts, Ausgaben oder Sendungen
Messungen geschachtelt in Personen (Personen sind Level-2!)
Daten können auch auf mehr als zwei hierarchischen Ebenen (Schüler, Klasse, Schule) geschachtelt oder kreuzklassifiziert sein
bei kreuzklassifizierten Daten gehören Level-1-Einheiten zu min. zwei verschiedenen Kontexten (z.B. Bewertungen von Werbespots gehören zu bewertenden Personen und bewerteten Spots)
Warum Multilevel-Modelle?
statistische Gründe: Die Schachtelung der Level-1-Einheiten muss auch berücksichtigt werden, wenn nur Level-1-Zusammenhänge von Interesse sind (dependence as a nuisance).
substanziellen Gründe: Multilevel-Modelle erlauben eine Zerlegung in Between- und Within-Group-Varianz und damit die adäquate Modellierung von Zusammenhängen auf verschiedenen Ebenen (dependence as an interesting phenomenon).
Grundbegriffe
Multilevel Model = Hierarchical Model = Mixed Effects Model (= Mehrebenen-Modell)
Between-Group-Varianz = Varianz, die durch Unterschiede in den Level-2-Einheiten erzeugt wird
Within-Group-Varianz = Varianz, die durch Unterschiede der Level-1-Einheiten innerhalb derselben Level-2-Einheit erzeugt wird
Fixed Effects = Zusammenhänge, die in allen Level-2-Kontexten gleich sind
Random (Varying) Effects = Zusammenhänge, die über die Level-2-Kontexte variieren
Cross-Level-Interaction = Zusammenhang zwischen Level-1-Effekt und Level-2-Kontextmerkmalen
Nullmodell mit varierenden Intercepts
Das Multilevel-Nullmodell für geschachtelte Daten mit \(i\) Individuen in \(j\) Gruppen besteht aus je einem Nullmodell pro Ebene:
oder zusammengenommen: \(Y_{ij} = \gamma_{00} + u_{0j} + \epsilon_{ij}\)
\(\gamma_{00}\) ist der globale Mittelwert von \(Y\), \(u_{0j}\) ist die gruppenspezifische Abweichung vom globalen Mittelwert und \(\epsilon_{ij}\) ist das individuelle Residuum.
Intra-Class-Correlation (ICC)
zu Beginn sollte man ein Nullmodell (d.h. ohne Prädiktoren) schätzen, um die Intra-Class-Correlation (ICC) zu berechnen
ICC Anteil der Varianz in einer Variable, der durch die Kontexte (Level-2) erklärt wird. Technisch: der Anteil Between-Group-Varianz (also die Varianz von \(u_{0j}\)) an der Gesamtvarianz von \(Y\).
wenn der ICC hoch ist (viel Gruppenvarianz), lohnt sich die Betrachtung von Level-2-Prädiktoren
wenn der ICC niedrig ist (wenig Gruppenvarianz), sind Level-1-Prädiktoren ein sinnvolleres Ziel
selbst bei kleinem ICC ist Mehrebenenanalyse sinnvoll, da sie nie “schlechter” als ein klassisches Regressionsmodell ist
Regression und Multilevel-Regression
Multilevel-Modelle sind eine konzeptionelle Erweiterung der (linearen) Regression
alle Annahmen der Regression (Normalverteilung der Residuen, Homoskedastizität, Linearität) weiterhin
gruppenspezifischen Abweichungen werden oft nur summarisch, d.h. z.B. ihre Varianz berichtet, aber nicht einzeln inspiziert
Zentrierung ist üblich, Standardisierung der Koeffizienten eher selten
Random (bzw. Varying-) Intercept Modell
-Intercepts dürfen gruppenspezifisch variieren, Regressionskoeffizienten \(B\) sind für alle Level-2-Einheiten gleich
die variierenden Intercepts die Abweichungen der einzelnen Level-2-Einheiten vom globalen Intercept
Output und Interpretation der Regressionskoeffizienten entspricht dem regulären linearen Regressionsmodell
\(R^2\) und Modellvergleich
In Multilevel-Modellen gibt es keinen Standard für die Berechnung von \(R^2\)
Alternative 1: separate Inspektion bzw. Modellvergleich der einzelnen Varianzkomponenten (Residual und Level-2-Varianz) hat den Vorteil, dass man recht klar erkennen kann, welche L1- bzw. L2-Prädiktoren wie das Modell verbessern
Alternative 2: Globalmaße, die in entweder nur die Fixed Effects (marginal \(R2\)) oder Fixed und Random Effects (conditional \(R2\)) berücksichtigen (Nakagawa et al., 2017)
Wie beim partiellen F-Test der Regression kann man auch verschiedene Modelle miteinander hinsichtlich ihrer Varianzaufklärung vergleichen, dies wird oft Likelihood-Ratio-Test genannt
Modellerweiterungen
zusätzlich zu den Intercepts kann man auch Regressionskoeffizienten über die Level-2-Einheiten variieren lassen, um die Effektheterogenität über Gruppen zu prüfen
ebenso kann man Interaktionen sowohl innerhalb einer Ebene als auch sog. Cross-Level-Interactions modellieren, d.h. ob der Kontext- den Individualeffekt moderiert
Beispielstudie: Fähnrich et al. (2020)
Daten
Stichprobe von 10807 Facebook-Posts von 42 Universitäten
Uni-Fans ist die Anzahl Fans der Facebook-Seite (in Tausend), d.h. hier eine Level-2-Variable
Alle anderen Variablen sind pro Post, d.h. Level-1-Variablen.
uni
uni_fans
created_time
type
likes_count
comments_count
UC Berkeley
354.90
2013-02-26 01:01:53
video
82
11
Cornell U
272.76
2013-06-08 14:19:45
photo
91
2
UC Santa Barbara
65.43
2013-06-12 20:00:01
photo
158
23
U Toronto
253.77
2015-04-22 15:22:52
photo
1950
59
Cornell U
272.76
2015-06-25 18:49:14
photo
286
1
Outcome-Variable
Variable
n_Obs
Mean
SD
Median
MAD
Min
Max
comments_count
10807
12.15
36.46
3
4.45
0
1556
Nullmodell und ICC
Parameter
Coefficient
95% CI
t(10804)
p
Effects
Group
Std. Coef.
Fit
(Intercept)
14.34
(9.23, 19.44)
5.50
< .001
fixed
0.06
16.71
random
uni
33.32
random
Residual
AICc
106618.77
R2 (conditional)
0.20
R2 (marginal)
0.00
Sigma
33.32
16.71^2/ (16.71^2+33.32^2)
[1] 0.2009607
Vorhergesagte Werte (Uni-Page)
uni
estimate
std.error
statistic
p.value
conf.low
conf.high
Columbia U
2.33
2.61
0.89
0.37
-2.78
7.44
Cornell U
9.40
2.61
3.61
0.00
4.29
14.51
Duke U
8.69
2.61
3.34
0.00
3.58
13.80
Harvard U
66.38
2.61
25.48
0.00
61.27
71.48
Imperial College London
3.40
2.61
1.30
0.19
-1.71
8.50
Johns Hopkins U
3.18
2.61
1.22
0.22
-1.92
8.29
MIT
15.76
2.61
6.05
0.00
10.66
20.87
New York U
10.71
2.61
4.11
0.00
5.61
15.82
Northwestern U
7.88
2.61
3.03
0.00
2.78
12.99
Princeton U
5.63
2.61
2.16
0.03
0.53
10.74
Varying Intercept-Modell (Topic Research)
Parameter
Coefficient
95% CI
t(10387)
p
Effects
Group
Std. Coef.
Fit
(Intercept)
15.57
(10.48, 20.67)
5.99
< .001
fixed
0.06
topic research
-4.06
(-5.53, -2.59)
-5.42
< .001
fixed
-0.05
16.60
random
uni
33.41
random
Residual
AICc
102577.73
R2 (conditional)
0.20
R2 (marginal)
0.00
Sigma
33.41
Modellvorhersagen (varying intercepts)
Varying Intercept vs. Varying Slope-Modell
npar
AIC
BIC
logLik
deviance
Chisq
Df
Pr(>Chisq)
m1_research
4
102582.7
102611.7
-51287.36
102574.7
m2_research_vs
6
102532.8
102576.3
-51260.39
102520.8
53.93
2
0
Varying Slopes pro Uni-Page
term
uni
estimate
std.error
statistic
p.value
conf.low
conf.high
topic_research
Columbia U
-0.43
1.22
-0.35
0.72
-2.82
1.96
topic_research
Cornell U
-3.15
1.22
-2.58
0.01
-5.54
-0.76
topic_research
Duke U
-2.72
1.22
-2.23
0.03
-5.11
-0.33
topic_research
Harvard U
-24.59
1.22
-20.16
0.00
-26.98
-22.20
topic_research
Imperial College London
-0.91
1.22
-0.75
0.45
-3.30
1.48
topic_research
Johns Hopkins U
-0.73
1.22
-0.60
0.55
-3.13
1.66
topic_research
MIT
-5.51
1.22
-4.52
0.00
-7.90
-3.12
topic_research
New York U
-3.48
1.22
-2.85
0.00
-5.87
-1.09
topic_research
Northwestern U
-2.43
1.22
-1.99
0.05
-4.82
-0.04
topic_research
Princeton U
-1.67
1.22
-1.37
0.17
-4.07
0.72
Modellvorhersagen (varying slopes)
Modell mit Level-2-Prädiktor
Parameter
Coefficient
95% CI
t(10384)
p
Effects
Group
Std. Coef.
Fit
(Intercept)
10.88
(6.56, 15.19)
4.94
< .001
fixed
0.05
topic research
-5.69
(-8.35, -3.04)
-4.21
< .001
fixed
-0.07
uni fans
0.01
(0.01, 0.01)
8.18
< .001
fixed
0.21
13.41
random
uni
7.26
random
uni
-0.99
random
uni
33.32
random
Residual
AICc
102509.01
R2 (conditional)
0.16
R2 (marginal)
0.05
Sigma
33.32
Fazit
in der Kommunikationswissenschaft sind geschachtelte Daten nahezu überall anzutreffen, sei es bei Inhaltsanalysen, Panel- oder Mehrländer-Befragungen
oft sind auch Personen die Level-2-Einheiten, z.B. bei Experience-Sampling-Daten oder Within-Subject-Experimenten
die Grundlogik der Multilevel-Analyse entspricht dem linearen Modell, lediglich die Art und Weise, die Schachtelung zu berücksichtigen, variiert
wenn Verdacht auf Verletzung der Unabhängigkeitsannahme besteht, kann man immer zumindest ein Varying Intercept Modell schätzen, das nie “schlechter” als ein lineares Regressionsmodell ist
technisch muss man in R (fast) nur lm() durch lmer() ersetzen und die Modellformel leicht anpassen (siehe praktische Übung)
Literatur
Hox, J. J., Moerbeek, M., & Van de Schoot, R. (2017). Multilevel analysis: Techniques and applications. Routledge.
Fähnrich, B., Vogelgesang, J., & Scharkow, M. (2020). Evaluating universities’ strategic online communication: how do Shanghai Ranking’s top 50 universities grow stakeholder engagement with Facebook posts?. Journal of Communication Management, 26(3).