Anwendungsorientierte Analyseverfahren

Moderationsanalyse

Prof. Dr. Michael Scharkow

Sommersemester 2024

Fragen zur Studienleistung oder praktischen Übung?

Wiederholung: Information Overload

Parameter Coefficient 95% CI t(983) p Std. Coef. Fit
(Intercept) 6.93 (5.89, 7.97) 13.09 < .001 0.03
Gender (female) 0.72 (0.32, 1.12) 3.51 < .001 0.23
Age 0.02 (0.00, 0.03) 2.06 0.039 0.07
Education (Middle) -0.40 (-1.01, 0.21) -1.29 0.198 -0.13
Education (High) -0.62 (-1.23, -0.01) -1.98 0.048 -0.20
Outlets Used 0.10 (0.06, 0.13) 4.97 < .001 0.16
AICc 5062.21
R2 0.04
R2 (adj.) 0.03
Sigma 3.11

Was tut eine intervenierende Variable?

iv

Moderationsanalyse

  • Diagnose: Effektheterogenität, d.h. der Zusammenhang von X und Y ist nicht für alle gleich
  • der Effekt von X auf Y hängt von Moderatorvariable Z ab (“wird von Z moderiert”)
  • die Größe und die Richtung des Regressionskoeffizienten ist davon abhängig, welche Ausprägung Z hat
  • Beispiele:
    • Experimente mit min. 2 Faktoren, die sich gegenseitig beeiflussen
    • Effektheterogenität in verschiedenen Subgruppen der Stichprobe
  • Effektheterogenität aktuell en vogue (person-specific media effects, Valkenburg et al., 2021), aber theoretisch und empirisch ggf. problematisch (Healy, 2017; Vuorre et al., 2022)

Woran erkennen wir Effektheterogenität?

Analysemöglichkeiten

(a) separate Regressionsmodelle pro Subgruppe schätzen

  • kein direkter Test der Moderationshypothese
  • weniger statistische Power wg. kleinerer Subsamples
  • alle Regressionskoeffizienten werden unterschiedlich geschätzt
  • bei metrischen Moderatoren Dichotomisierung o.ä. nötig

(b) Moderationsanalyse mit Interaktionstermen

  • gezielt für spezifische Prädiktoren möglich
  • statistische Power bleibt erhalten
  • metrische Moderatoren problemlos integrierbar

Beispiel getrennte Analysen

  Overload (female) Overload (male)
Predictors Estimates CI p Estimates CI p
(Intercept) 7.79 6.47 – 9.11 <0.001 7.97 6.53 – 9.40 <0.001
Age 0.02 -0.00 – 0.04 0.090 0.01 -0.01 – 0.04 0.186
Education: Middle 0.08 -0.83 – 1.00 0.858 -0.59 -1.43 – 0.25 0.171
Education: High 0.12 -0.79 – 1.02 0.799 -0.72 -1.56 – 0.11 0.089
Observations 474 519
R2 / R2 adjusted 0.006 / -0.000 0.009 / 0.004

Regressionsformel für Moderation

  • Bei der Moderationsanalyse gehen wir davon aus, dass der Effekt X auf Y eine Funktion von Z ist
    \(Y = b_0 + f(Z)X + b_2Z + \epsilon\)

  • Die Funktion f(Z) sei definiert als lineare Funktion \(f(Z) = b_1 + b_3Z\)
    \(Y = b_0 + (b_1 + b_3Z)X + b_2Z + \epsilon\)

  • Durch Ausmultiplizieren erhalten wir einen Interaktionsterm \(XZ\), der einfach das Produkt von \(X\) und \(Z\) ist
    \(Y = b_0 + b_1X + b_2Z + b_3XZ + \epsilon\)

Was bedeuten die Koeffizienten?

  • Regressionsformel \(Y = b_0 + b_1X + b_2Z + b_3XZ + \epsilon\)
  • \(b_0\) (Intercept) ist der erwartete Wert von \(Y\), wenn \(X = 0\) und \(Z = 0\)
  • \(b_1\) ist der (konditionale) Effekt von \(X\), wenn \(Z = 0\)
  • \(b_2\) ist der (konditionale) Effekt von \(Z\), wenn \(X = 0\)
  • \(b_3\) ist der eigentliche Interaktionseffekt, d.h. die Differenz in \(b_1\), wenn \(Z\) sich um eine Einheit ändert

Interpretation konditionaler Effekte

  • bei Moderationsanalysen wird oft nur auf die Signifikanz des Interaktionsterms geschaut.
  • man kann und sollte aber auch die substanziellen Effekte betrachten, z.B. durch
    • Schätzung der konditionalen Regressionskoeffizienten für (typische) Werte von \(Z\)
    • Visualisierung der Modellvorhersagen für \(Y\) für (typische) Werte von \(Z\)

Wichtig: Bei Regressionsmodellen mit Interaktionseffekten \(XZ\) sind die Koeffizienten von \(X\) und \(Z\) nicht mehr unabhängig voneinander interpretierbar, d.h. die Effekte sind nicht mehr unkonditional für alle Fälle \(n\) gültig!

Wichtig: Damit die konditionalen Effekte überhaupt interpretierbar sind, sollten wir metrische Variablen zentrieren und kategorielle Variablen dummy- oder effektcodieren!

Interaktionsterme

  • in R kann man Interaktionsterme direkt in die Modellformel für lm() aufnehmen: y ~ x + z + x:z oder einfacher y ~ x * z
  • alternativ werden Interaktionsterme manuell erstellt:
    • vor der Schätzung die beiden Variablen \(X\) und \(Z\) miteinander zu einer neuen Variable \(XZ\) multiplizieren
    • dieser Interaktionsterm \(XZ\) wird dann als zusätzliche Prädiktorvariable ins Modell aufgenommen
  • für leichtere Interpretierbarkeit immer darauf achten, dass \(X\) und \(Z\) einen sinnvollen Wert für 0 haben

Beispielstudie: Vögele & Bachl, 2017

Daten

  • schwab: Experimentalbedingung Dialekt schwäbisch 0 (nein), 1 (ja)
  • atol: Attitude toward other language = Einstellung zum Schwäbischen (1-5)
  • gesamt: Gesamtbewertung des Politikers (Outcome-Variable, 1-5)

schwab geschlecht_w atol gesamt
1 1 2.4 3
0 0 3.8 4
0 1 2.2 4
1 0 3.0 2
0 1 2.0 4

Bivariates Modell (nur Versuchsbedingung)

Parameter Coefficient 95% CI t(361) p Std. Coef. Fit
(Intercept) 3.81 (3.67, 3.94) 55.54 < .001 0.00
schwab -0.20 (-0.39, -0.02) -2.22 0.027 -0.12
AICc 937.93
R2 0.01
R2 (adj.) 0.01
Sigma 0.88

Beispielanalyse: kategorielle Moderatoren

Zwei Prädiktoren (nur Haupteffekte)

Parameter Coefficient 95% CI t(360) p Std. Coef. Fit
(Intercept) 3.63 (3.46, 3.79) 43.52 < .001 0.00
schwab -0.21 (-0.39, -0.03) -2.31 0.021 -0.12
geschlecht w 0.34 (0.16, 0.52) 3.75 < .001 0.19
AICc 926.08
R2 0.05
R2 (adj.) 0.05
Sigma 0.86

Modell mit kategoriellem Moderator

Parameter Coefficient 95% CI t(359) p Std. Coef. Fit
(Intercept) 3.71 (3.51, 3.90) 37.37 < .001 0.00
schwab -0.36 (-0.62, -0.09) -2.66 0.008 -0.12
geschlecht w 0.19 (-0.07, 0.46) 1.42 0.158 0.19
schwab × geschlecht w 0.27 (-0.09, 0.63) 1.49 0.137 0.08
AICc 925.89
R2 0.06
R2 (adj.) 0.05
Sigma 0.86

Konditionale Effekte

Durch Einsetzen in die Gleichung \(f(Z) = b_1 + b_3Z\) lassen sich die konditionalen Effekte von \(X\) (Dialekt) bei verschiedenen Ausprägungen vom Moderator \(Z\) (Geschlecht) schätzen:


term geschlecht_w estimate p.value conf.low conf.high
schwab 0 -0.36 0.01 -0.62 -0.09
schwab 1 -0.09 0.48 -0.33 0.15

Average Marginal Effects (AME)

Die durchschnittlichen Effekte von \(X\) über die gesamte Stichprobe (average marginal effects) lassen sich bestimmen, indem für jeden einzelnen Fall der konditionale Effekt berechnet und dann gemittelt wird.

term estimate p.value conf.low conf.high
schwab -0.21 0.02 -0.39 -0.03


Average Marginal Effects (AME) entsprechen im linearen Modell den unmoderierten Koeffizienten

term estimate std.error statistic p.value
schwab -0.21 0.09 -2.31 0.02
geschlecht_w 0.34 0.09 3.75 0.00

Vorhergesagte Werte

  • Durch Einsetzen der Werte von \(X\) in die Regressionsgleichung lassen sich wie immer die vorhergesagten Werte in \(Y\) schätzen.
  • Im Beispiel gibt es nur 4 typische Bedingungen (2 Treatment x 2 Geschlecht), die wir explizit vorhersagen.
schwab geschlecht_w estimate std.error conf.low conf.high
0 0 3.71 0.10 3.51 3.90
1 0 3.35 0.09 3.17 3.53
0 1 3.90 0.09 3.72 4.08
1 1 3.81 0.08 3.65 3.97

Visualisierung der Vorhersagen

Erweiterungen

  • dieselbe Analyselogik gilt auch für Moderatoren mit mehr als zwei Ausprägungen, d.h.
    • alle konditionalen Effekte gelten dann für die Referenzgruppe
    • es gibt jeweils \(k-1\) Haupt- und Interaktionseffekte
  • in (zum Glück) seltenen Fällen gibt es auch 3-Wege-Interaktionen (2 Moderatoren)
    • Einbeziehung bzw. Berechnung der Interaktionsterme \(XZ_1\), \(XZ_2\) und \(XZ_1Z_2\)
    • Interpretation doppelt konditionaler Effekt sehr kompliziert

Beispiel Moderation mit 3 Gruppen

Parameter Coefficient 95% CI t(987) p Std. Coef. Fit
(Intercept) 2.82 (2.55, 3.09) 20.37 < .001 -0.16
Gender (female) -0.63 (-1.07, -0.19) -2.81 0.005 -0.46
Education (Middle) 0.50 (0.18, 0.82) 3.04 0.002 0.37
Education (High) 0.98 (0.66, 1.30) 6.00 < .001 0.72
Gender (female) × Education (Middle) -0.11 (-0.61, 0.40) -0.42 0.672 -0.08
Gender (female) × Education (High) -0.45 (-0.94, 0.05) -1.75 0.080 -0.33
AICc 3300.42
R2 0.14
R2 (adj.) 0.13
Sigma 1.27

Beispiel Moderation mit 3 Gruppen

Beispiel 3-Way-Interaction

Quelle: Rains et al. (2023)

Zwischenfazit

  • Moderationsanalysen mit kategoriellen Variablen sind technisch leicht durchführbar, erfordern aber eine neue Interpretation
  • die Interpretation der stat. Signifikanz der Interaktionsterme ist einfach, die substanzielle Interpretation schwierig
  • durch Hinzunahme des Interaktionsterms werden aus den beteiligten Haupteffekten automatisch konditionale Effekte in der Referenzgruppe (!)
  • die Koeffizienten der Prädiktoren ohne Interaktionsterm bleiben unkonditional (!)

Fragen?

Beispielanalyse: metrische Moderatoren

Regression mit metrischem Moderator

  • Anstelle einer dichotomen Variable kann man auch eine metrische Moderatorvariable berücksichtigt werden, hier zum Beispiel die Voreinstellung gegenüber dem schwäbischen Dialekt (atol).
  • Hypothese: Je positiver die Einstellung zum schwäbischen Dialekt bei einer Versuchsperson, desto positiver der Effekt der Experimentalbedingung
  • Reminder: der Koeffizient für Dialekt bezieht sich nun auf einen konkreten Wert von atol (konditionaler Effekt)

Regression mit metrischem Moderator

Parameter Coefficient 95% CI t(359) p Std. Coef. Fit
(Intercept) 4.19 (3.60, 4.79) 13.79 < .001 0.01
schwab -1.53 (-2.32, -0.74) -3.80 < .001 -0.11
atol -0.12 (-0.29, 0.06) -1.30 0.196 0.09
schwab × atol 0.40 (0.17, 0.64) 3.40 < .001 0.18
AICc 926.98
R2 0.05
R2 (adj.) 0.05
Sigma 0.86

Konditionale Effekte durch Zentrierung

  • Zentrierung von atol mit 1, d.h. Koeffizient für Dialekt gilt für atol = 1 (Minimum)
Parameter Coefficient 95% CI t(359) p Std. Coef. Fit
(Intercept) 4.08 (3.65, 4.51) 18.69 < .001 0.10
schwab -1.13 (-1.69, -0.56) -3.91 < .001 0.06
atol - 1 -0.12 (-0.29, 0.06) -1.30 0.196 0.09
schwab × atol - 1 0.40 (0.17, 0.64) 3.40 < .001 0.18
AICc 926.98
R2 0.05
R2 (adj.) 0.05
Sigma 0.86

Conditional Effects

  • wie bei Modellvorhersagen können wir für typische Werte des Moderators den Koeffizienten von X schätzen
term atol estimate p.value conf.low conf.high
schwab 1 -1.13 0.00 -1.69 -0.56
schwab 2 -0.72 0.00 -1.07 -0.37
schwab 3 -0.32 0.00 -0.51 -0.13
schwab 4 0.08 0.50 -0.16 0.32
schwab 5 0.48 0.03 0.05 0.92

Conditional effects plot

Johnson-Neyman Intervalle

  • es werden Intervallgrenzen geschätzt, jenseits derer die Regressionskoeffizienten von \(X\) signifikant sind

JOHNSON-NEYMAN INTERVAL

When atol is OUTSIDE the interval [3.35, 4.74], the slope of schwab is p < .05.

Note: The range of observed values of atol is [1.00, 5.00]

  • Problem 1: Alpha-Fehler durch (sehr) häufige Tests
  • Problem 2: “The difference between signficant and insignificant is not itself signficant” (Andrew Gelman), sprich: die Punkte, an denen die stat. Signifikanz “umspringt”, haben keinerlei besondere Eigenschaften
  • nicht verwenden!

Modellvorhersagen

  • wie immer lassen sich mit ausgewählten Werten der Prädiktoren auch Vorhersagen berechnen
schwab atol estimate std.error conf.low conf.high
0 1 4.08 0.22 3.65 4.51
1 1 2.95 0.19 2.59 3.32
0 3 3.85 0.07 3.70 3.99
1 3 3.53 0.06 3.40 3.65
0 5 3.62 0.16 3.30 3.94
1 5 4.10 0.15 3.81 4.39

Visualisierung der Modellvorhersagen

Tipps

  • auf korrekte Interpretation der Referenzgruppen achten bei kategoriellen Moderatoren
  • metrische Variablen zentrieren, die keinen interpretierbaren Nullpunkt haben, bevor man Interaktionsterme einfügt
  • immer auch \(X\) und \(Z\) im Modell zu haben, wenn der Interaktionsterm \(XZ\) im Modell ist
  • pragmatischer Vorschlag: wenn kein signifikanter Interaktionseffekt, dann lieber unkonditionales Modell (ohne Moderator) berichten
  • substanzielle Interpretation durch Berechnung und Visualisierung von conditional effects und Modellvorhersagen

Fazit

  • lineare Modelle mit Moderation sind in der Regel sehr (zu!) leicht zu spezifizieren, aber zumeist deutlich schwieriger substanziell zu interpretieren (außer Signifikanz des Interaktionseffekts)
  • auch wenn die Regressionstabelle optisch sehr ähnlich aussieht, ändert sich Interpretation grundsätzlich
  • viele SozialwissenschaftlerInnen interpretieren moderierte Effekte entweder gar nicht oder falsch
  • Moderationshypothesen sind nicht per se theoretisch wertvoll, und auch bei Moderationsanalysen gibt es Alpha-Fehler

Take-Home Aufgabe #3

Altay et al. (2022) untersuchen experimentell, ob falsche Nachrichten weniger als wahre geteilt werden, und wie dies von der Interessantheit der Nachricht abhängt.

Beantworten Sie folgende Forschungsfragen mit Hilfe der Studien-Daten:

  1. Werden wahre Nachrichten eher geteilt als falsche?
  2. Werden interessante Nachrichten eher geteilt als uninteressante?
  3. Gibt es den im Titel des Artikels angesprochenen Effekt eines zusätzlichen “interesting-if-true” Effekts auf das Teilen von Nachrichten? Wie fällt dieser aus?

Take-Home Aufgabe #3

  1. Stellen Sie die Ergebnisse des/der geschätzen Modells/Modelle sinnvoll tabellarisch oder grafisch dar (Screenshot reicht).
  2. Beantworten Sie die Forschungsfragen anhand von Ihnen ausgewählter Kennwerte bzw. Quantities of Interest (2-3 Sätze pro Forschungsfrage)
  3. Lösung als PDF-Datei bitte bis 03.07.2024, 12 Uhr in Moodle hochladen.

Take-Home Aufgabe #3

# Daten laden
altay22 = read_tsv("data/altay2022.tsv")
Share Type Interesting
2 TN 3
1 TN 6
1 TN 4

 

  • Share = Wahrscheinlichkeit, die Nachricht mit anderen zu teilen (1-6, höher ist wahrscheinlicher)
  • Type = Nachrichtentyp (experimentell variiert, TN=wahr, FN=falsch)
  • Interesting = Wahrgenommene Interessantheit der Nachricht (1-7, höher ist interessanter)

Literatur

Healy, K. (2017). Fuck nuance. Sociological Theory, 35(2), 118-127.

Rains, S. A., Harwood, J., Shmargad, Y., Kenski, K., Coe, K., & Bethard, S. (2023). Engagement with partisan Russian troll tweets during the 2016 US presidential election: a social identity perspective. Journal of Communication, 73(1), 38-48.

Valkenburg, P., Beyens, I., Pouwels, J. L., van Driel, I. I., & Keijsers, L. (2021). Social media use and adolescents’ self-esteem: Heading for a person-specific media effects paradigm. Journal of Communication, 71(1), 56-78.

Vögele, C., & Bachl, M. (2017). Der Einfluss des Dialekts auf die Bewertung von Politikern. SCM Studies in Communication and Media, 6(2), 196-215.

Vuorre, M., Johannes, N., & Przybylski, A. K. (2022). Three objections to a novel paradigm in social media effects research.