Wie lassen sich in den Sozialwissenschaften Kausalitäten messen? Dieser Beitrag stellt die vier bekanntesten Ansätze vor und diskutiert ihre Vor- und Nachteile. Einleitung Die wirtschafts- und sozialwissenschaftliche Kausalanalyse untersucht anhand empirischer Daten die ursächliche Wirkung eines bestimmten Phänomens auf ein bestimmtes Ergebnis. Beispiele hierfür sind die Wirkung von frühkindlicher Förderung auf Bildung, von Bildung auf Einkommen oder von Einkommen auf Gesundheit, um nur ein paar zu nennen. Die Herausforderung der Kausalanalyse liegt in der Tatsache, dass sich die Wirkung eines Phänomens in der Regel nur schwer von der Wirkung anderer Phänomene isolieren lässt. So stehen wir zum Beispiel bei der Messung des Effekts von Bildung (Phänomen) auf Einkommen (Ergebnis) vor dem Problem, dass individuelle Merkmale wie Motivation, Intelligenz, Sozialverhalten und anderes sowohl die Bildung als auch das Einkommen eines Menschen beeinflussen. In diesem Fall entspricht ein naiver Einkommensvergleich zwischen höher und geringer Gebildeten nicht dem kausalen Effekt der Bildung, weil sich die Bildungsgruppen auch noch in anderen Merkmalen unterscheiden, die ebenfalls einen Einkommenseffekt aufweisen. Kurzum: Äpfel werden mit Birnen verglichen, was das Bestimmen von Ursache und Wirkung verunmöglicht.
Topics:
Martin Huber considers the following as important:
This could be interesting, too:
Cash - "Aktuell" | News writes Länder einigen sich bei Weltklima-Konferenz auf globalen Emissionshandel
Cash - "Aktuell" | News writes Selenskyj glaubt an mögliches Kriegsende 2025
Cash - "Aktuell" | News writes Was Schweizer Bäuerinnen und Bauern verdienen
Cash - "Aktuell" | News writes Schweizer Efta/EU-Delegation will Abkommen mit China optimieren
Wie lassen sich in den Sozialwissenschaften Kausalitäten messen? Dieser Beitrag stellt die vier bekanntesten Ansätze vor und diskutiert ihre Vor- und Nachteile.
Einleitung
Die wirtschafts- und sozialwissenschaftliche Kausalanalyse untersucht anhand empirischer Daten die ursächliche Wirkung eines bestimmten Phänomens auf ein bestimmtes Ergebnis. Beispiele hierfür sind die Wirkung von frühkindlicher Förderung auf Bildung, von Bildung auf Einkommen oder von Einkommen auf Gesundheit, um nur ein paar zu nennen. Die Herausforderung der Kausalanalyse liegt in der Tatsache, dass sich die Wirkung eines Phänomens in der Regel nur schwer von der Wirkung anderer Phänomene isolieren lässt. So stehen wir zum Beispiel bei der Messung des Effekts von Bildung (Phänomen) auf Einkommen (Ergebnis) vor dem Problem, dass individuelle Merkmale wie Motivation, Intelligenz, Sozialverhalten und anderes sowohl die Bildung als auch das Einkommen eines Menschen beeinflussen. In diesem Fall entspricht ein naiver Einkommensvergleich zwischen höher und geringer Gebildeten nicht dem kausalen Effekt der Bildung, weil sich die Bildungsgruppen auch noch in anderen Merkmalen unterscheiden, die ebenfalls einen Einkommenseffekt aufweisen. Kurzum: Äpfel werden mit Birnen verglichen, was das Bestimmen von Ursache und Wirkung verunmöglicht. Häufig beobachten wir zwar einen statistischen Zusammenhang oder einer sogenannten Korrelation zwischen Bildung und Einkommen ("höher Gebildete verdienen im Durchschnitt mehr als geringer Gebildete"). Um daraus aber auf einen kausalen Effekt schliessen zu können ("höher Gebildete verdienen im Durchschnitt mehr als geringer Gebildete aufgrund ihrer höheren Bildung"), müssen die diversen Bildungsgruppen möglichst vergleichbar hinsichtlich der anderen Merkmale sein.
Nachfolgend wird anhand dieses Beispiels ein kurzer Überblick über bedeutende Ansätze der Kausalanalyse gegeben, wobei die Intuition im Vordergrund steht und technische Details ausgeblendet werden. Folgende Methoden werden erläutert: (i) Von ForscherInnen durchgeführte sozialwissenschaftliche Experimente; (ii) sogenannte "natürliche" Experimente, die nicht von ForscherInnen geplant wurden sondern sich z.B. durch politische Entscheidungen "ergeben"; (iii) Kausalanalyse basierend auf sogenannten "Instrumenten", welche die Bildung beeinflussen, jedoch keinen direkten Effekt auf das Einkommen aufweisen; (iv) Kausalanalyse basierend auf dem Vergleich jener höher und geringer Gebildeten, die hinsichtlich aller anderen Merkmale, die das Einkommen beeinflussen, vergleichbar sind.
Sozialwissenschaftliche und natürliche Experimente
Experimente sind die wohl intuitivste und aus statistischer Sicht häufig überzeugendste Methode der Kausalanalyse. Sie basieren auf der zufälligen Zuteilung eines Phänomens, z.B. der Teilnahme an einem Bildungsprogramm. Da nicht irgendein Persönlichkeitsmerkmal, sondern einzig der Zufall bestimmt, wer sich in der Gruppe mit und ohne Bildungsprogramm wiederfindet, sind beide Gruppen "per Design" vergleichbar hinsichtlich anderer einkommensrelevanter Merkmale, zumindest wenn hinreichend viele Personen am Experiment teilnehmen. Deshalb kann der kausale Effekt des Bildungsprogrammes ganz einfach durch einen Einkommensvergleich der Gruppen mit und ohne Bildungsprogramm ermittelt werden, weil es keine Unterschiede in anderen Merkmalen gibt, die den Einkommenseffekt der Bildung verfälschen könnten.
Nicht für alle kausalen Fragen ist es aufgrund finanzieller, organisatorischer oder ethischer Vorbehalte möglich, Experimente durchzuführen. So könnte z.B. der beschriebene zufällige Zugang zum bzw. die Verweigerung des Bildungsprogramms zum Zwecke der Forschung unvereinbar mit dem juristischen und moralischen Recht auf Bildung sein. Manchmal geschehen Experimente aber ganz "natürlich" ohne Zutun der ForscherInnen, z.B. aufgrund politischer Entscheidungen. Nehmen wir an, dass eine Bildungsreform das gesetzlich vorgeschriebene minimale Schulaustrittsalter anhebt, sodass alle Personen ab einem bestimmten Jahrgang zwei Jahre länger schulpflichtig sind als frühere Jahrgänge. Derartige Reformen wurden im 20. Jahrhundert in mehreren Industrienationen durchgeführt und als natürliches Experiment für die Kausalanalyse wie folgt genutzt: Personen, die aufgrund ihres Alters bereits knapp von der Reform betroffen wurden und einer längeren Schulpflicht unterlagen, wurden mit geringfügig älteren Personen verglichen, die knapp noch nicht von der Reform betroffen waren. Da die beiden Gruppen aufgrund ihres geringen Altersunterschieds in anderen Merkmalen ausser der Reform selbst vergleichbar sein sollten solange Manipulation in den Altersangaben ausgeschlossen werden kann, wird gleichsam einem Experiment der kausale Effekt der Reform nicht verfälscht. Der Vergleich von Individuen, die sich in einer bestimmten Dimension wie z.B. dem Alter nur geringfügig unterscheiden, aber aufgrund dessen keine Kontinuität hinsichtlich eines bestimmten Phänomens wie z.B. der Bildungspolitik aufweisen, wird als Regressions-Diskontinuitäts-Analyse ("regression discontinuity design") bezeichnet. Sie gehört heute zum Standardwerkzeugsatz der Kausalanalyse.
Eine weitere Spielart des natürlichen Experiments ergibt sich, wenn sich die politischen Rahmenbedingungen für eine Gruppe über die Zeit verändern, für eine andere Gruppe hingegen unverändert bleiben. Nehmen wir an, dass ein Teil der Schweizer Kantone die zuvor erwähnte Bildungsreform durchführt und die Schulpflicht ausdehnt, während der andere Teil die Schulpflicht unverändert lässt. Ein Vergleich der Einkommen zwischen Kantonen mit und ohne Bildungsreform würde nicht zwingend den Effekt der Reform messen: Die Einkommen zwischen den Kantonen unterscheiden sich nicht nur aufgrund der Bildungspolitik, sondern auch wegen anderer einkommensrelevanter Merkmale wie der Konjunktur oder wirtschaftlichen Rahmenbedingungen. Ein weiterer Ansatz wäre der Einkommensvergleich in der Gruppe der Kantone mit der Bildungsreform über die Zeit, d.h. vor der Reform vs. nach der Reform. Dies scheitert jedoch, wenn z.B. die Konjunktur über die Zeit schwankt, sodass das Einkommen auch ohne Reform einer zeitlichen Veränderung unterliegt. Ein derartiger Vorher-Nachher-Vergleich würde deshalb sowohl den Reformeffekt, als auch den Zeittrend (ohne Reform) abbilden, ohne das eine vom anderen trennen zu können. Falls jedoch angenommen werden kann, dass beide Gruppen von Kantonen dem gleichen Zeittrend unterliegen, dann kann letzterer durch einen Einkommensvergleich in der Gruppe der Kantone ohne Bildungsreform über die Zeit ermittelt werden. Wenn wir dann von der Einkommensdifferenz vor und nach der Reform in der Gruppe mit Bildungsreform (Reformeffekt plus Zeittrend) die Einkommensdifferenz vor und nach der Reform in der Gruppe ohne Bildungsreform (Zeittrend) abziehen, bleibt der Reformeffekt "übrig". Die Differenz in den Vorher-Nachher-Differenzen der Einkommen beider Gruppen entspricht dem interessierenden kausalen Effekt, weshalb dieser Ansatz "Differenz-in-Differenzen Methode" ("difference-in-differences method") genannt wird.
Von Instrumenten und beobachtbaren Merkmalen
Ein weiterer Ansatz bedient sich sogenannter "Instrumente", die ein bestimmtes Phänomen wie z.B. Bildung, dessen Wirkung wir untersuchen wollen, beeinflusst, aber nicht direkt das Ergebnis, wie z.B. Einkommen. Die Idee lässt sich am besten im Kontext eines gescheiterten Experiments erklären. Nehmen wir wie zuvor wiederum an, dass Personen per Zufall ein Bildungsprogramm angeboten oder verwehrt wird. Im Unterschied zu vorher unterstellen wir nun, dass manche, denen das Bildungsprogramm angeboten wird, an diesem dennoch nicht teilnehmen. Dadurch scheitert das Experiment, denn während das Angebot selbst zufällig ist, ist es die tatsächliche Teilnahmeentscheidung nicht mehr: Jene, die das Angebot ausschlagen, könnten z.B. weniger motiviert sein als jene, die das Angebot annehmen, wodurch sich die Gruppen der tatsächlichen TeilnehmerInnen und NichtteilnehmerInnen wiederum in wichtigen Merkmalen, die das Einkommen beeinflussen, unterscheiden (im Gegensatz zu den Gruppen mit und ohne Angebot). Kausalanalyse ist dennoch möglich, falls zwei Bedingungen erfüllt sind, unter denen das Angebot als "Instrument" zur Messung des Effektes der tatsächlichen Programmteilnahme dient. Erstens, das zufällige Angebot des Programms beeinflusst die Teilnahmeentscheidung von zumindest einem Teil der Personen im Experiment: Diese Personen nehmen am Programm teil, falls es ihnen angeboten wird, aber nehmen nicht teil, falls es ihnen verwehrt wird. Mit anderen Worten, es existieren Personen, die sich dem Angebot "fügen" und im Englischen und Neu-Deutsch als "compliers" ("sich Fügende") bezeichnet werden. Zweitens, das zufällige Angebot des Programms hat selbst keine direkte Wirkung auf das Einkommen, sondern einzig durch die Teilnahme am Programm. Diese sogenannte "Ausschlussrestriktion" unterstellt also, dass das Angebot oder Nicht-Angebot selbst keine Veränderung im Einkommen bewirkt, ausser eben durch eine Veränderung in der tatsächlichen Teilnahme. Dies wäre in unserem Beispiel gegeben, wenn das Angebot selbst keinen Einfluss auf die Motivation oder andere Merkmale hätte, die das Einkommen beeinflussen könnten.
Unter diesen beiden Bedingungen lässt sich die Wirkung der Programmteilnahme wie folgt in zwei Schritten bestimmen: Erstens messen wir den Effekt des zufälligen Angebots auf das Einkommen durch einen Einkommensvergleich der Gruppen mit und ohne Angebot. Da das Angebot aufgrund der Ausschlussrestriktion aber keinen direkten Effekt auf das Einkommen haben kann, entspricht der gemessene Effekt mathematisch dem Effekt des Angebots auf die tatsächliche Teilnahme multipliziert mit dem Effekt der Teilnahme auf das Einkommen. Zweitens messen wir den Effekt des zufälligen Angebots auf die tatsächliche Teilnahme durch einen Vergleich der durchschnittlichen Teilnahme in den Gruppen mit und ohne Angebot. Dividieren wir nun den ersten Effekt (Effekt des Angebots auf die Teilnahme multipliziert mit dem Effekt der Teilnahme auf das Einkommen) durch den zweiten (Effekt des Angebots auf die Teilnahme) bleibt der Effekt der Teilnahme auf das Einkommen "übrig", also jener kausale Effekt, der uns interessiert. Somit kann der Instrumentenansatz u.a. dazu verwendet werden, gescheiterte Experimente wieder zu "kitten".
Unser letzter Ansatz basiert auf der Annahme, dass die ForscherInnen alle Merkmale, die sowohl das Phänomen Bildung, dessen Wirkung gemessen werden soll, als auch das Ergebnis Einkommen beeinflussen, in den gesammelten Daten beobachten können, wie Alter, Motivation, Intelligenz und vieles mehr. Dies wird als "Selektion basierend auf beobachteten Merkmalen" ("selection on observables") bezeichnet. Darauf basierend werden einzig die Einkommen jener höher und geringer Gebildeten analysiert, die hinsichtlich aller anderen Merkmale vergleichbar sind. Dadurch werden also Äpfeln mit Äpfeln verglichen, um zu verhindern, dass der Effekt der Bildung durch Unterschiede in anderen Merkmalen verfälscht wird. Dieser Ansatz versucht deshalb, durch beobachtbare Informationen den experimentellen Kontext nachzuahmen: Nachdem Gruppen mit hoher und geringer Bildung kreiert wurden, die sich hinsichtlich ihrer beobachtbarer Merkmale ähneln, werden Unterschiede im Einkommen einzig auf Unterschiede in der Bildung zurückgeführt. Dies unterstellt, dass unter Personen mit vergleichbaren beobachtbaren Merkmalen die Bildungsentscheidung so gut wie zufällig getroffen wird bzw. zumindest nicht von weiteren Merkmalen abhängt, die ihrerseits das Ergebnis beeinflussen.
Keine Allheilmittel
Welche der erläuterten Ansätze der Kausalanalyse angemessen sind (falls überhaupt irgendeiner) hängt vom empirischen Kontext ab. Jeder Ansatz hat seine Vor- und Nachteile und Ansprüche an die Datenbasis. Sozialwissenschaftliche Experimente werden häufig als die überzeugendste Methode angesehen, aber sind, wie bereits erwähnt, aufgrund finanzieller, organisatorischer oder ethischer Vorbehalte häufig nicht durchführbar. Regressions-Diskontinuitäts-Analysen setzen voraus, dass ein bestimmtes Phänomen wie das gesetzliche Schulaustrittsalter einen Bruch in seiner Kontinuität an einer Stelle eines anderen Merkmals wie dem Alter aufweist und letzteres nicht manipuliert werden kann. Für die Differenz-in-Differenzen Methode müssen Ergebnisse wie das Einkommen sowohl vor als auch nach einem zu evaluierenden Phänomen wie einer Bildungsreform beobachtbar sein und der zuvor erwähnte Zeittrend muss für die Gruppen mit und ohne Reform vergleichbar sein. Der instrumentenbasierte Ansatz verlangt, dass das Instrument zufällig zugeteilt wird und keinen direkten Einfluss auf das Ergebnis hat. Selektion basierend auf beobachteten Merkmalen erscheint im Allgemeinen nur dann als plausible Annahme, wenn die im analysierten Datensatz verfügbaren Informationen zu weiteren Merkmalen überaus umfangreich sind. Obwohl es also kein Allheilmittel für jede erdenkliche Kausalanalyse gibt, wurden die erwähnten Methoden abhängig von der Struktur der Datenbasis in einer Vielzahl von wirtschafts- und sozialwissenschaftlichen Studien erfolgreich angewandt.
Zwar ist die technische Umsetzung der einzelnen Ansätze, die von StatistikerInnen und ÖkonometrikerInnen ständig verbessert wird, nicht immer ganz trivial. Wichtiger für EntscheidungsträgerInnen in Politik und Wirtschaft sowie interessierte BürgerInnen ist aber ohnehin das intuitive Verständnis der Verhaltensannahmen, die den einzelnen Ansätzen zugrunde liegen, um deren Plausibilität einschätzen zu können. Schliesslich scheitert selbst die fortschrittlichste technische Umsetzung einer Methode an der Messung eines kausalen Effektes und der Ableitung einer adäquaten Handlungsempfehlung, wenn die vorausgesetzten Annahmen fernab der Realität liegen. Es im Zweifelsfall immer noch besser, die statistischen Annahmen der Realität anzupassen, als auf das Gegenteil zu hoffen.
©KOF ETH Zürich, 13. Mär. 2017