Einen Lerneffekt hatten die Wahlen 2007: Man weiss jetzt, dass Stichprobenerhebungen, repräsentativ gemacht, einen statischen Fehlerbereich haben. Doch man ist damit noch nicht am Ziel: Man muss nun auch lernen, diesen vernünftig einzusetzen!
Der Schweizerische Verband der Markt- und Sozialforschungsinstitute schreibt in seinen Richtlinien seinen Mitgliedern vor, bei jeder Publikation von Stichprobenerhebungen die Fehlerspanne zu kommunizieren. Wir halten uns lückenlos daran. Jede Veröffentlichung , egal ob sie Wahlen betrifft oder etwas anderes, muss einen technischen Kurzbericht haben, und jeder technische Kurzbericht muss auf die statistische Fehlerquote verweisen.
Wir haben uns in den letzten 4 Jahren auch dafür eingesetzt, dass die SRG, die am prominentesten unsere Umfragen veröffentlicht, das übernimmt. Mehr oder minder ist uns das gelungen. Die Richtung stimmt, also eher +. Bei den Sekundärmedien ist das leider noch häufig nicht der Fall, also eher -.
Ganz sicher ist das Minus bei der vorherrschenden Leseweise: Leider irreführend ist die verbreitete Vorstellung, dass bei einer kommunizierten Fehlerquote von beispielsweise +/- 2.2 Prozentpunkten und einem Befragungswert von 50 Prozent wahlbeteiligung jeder Wert ausserhalb von 52.2 und 47.8 Prozent an sich falsch ist, resp. jeder Wert innerhalb dieser Spanne an sich richtig ist.
Der Grund: Statistische Fehlerquoten berechnen sich aufgrund der Wahrscheinlichkeitstheorie. Diese hilft, verschiedene Randbedingungen einer Aussage gegeneinander abzuwägen; es geht um drei Sachen:
. die Sicherheit von Aussagen
. die Stichprobengrösse
. die Fehlerquote.
In den Sozialwissenschaften hat sich eine Irrtumswahrscheinlichkeit von 5 auf 100 als Massstab eingebürgert. Das heisst: Aussagen, die mit Stichprobenerhebungen gemacht werden sind, nie richtig oder falsch, sondern wahrscheinlich oder unwahrscheinlich.
Eine Sicherheit von 95 Prozent – oder eine Irrtumsmöglichkeit von 5 Prozent – bedeutet: Bei 2000 Befragten und einem Umfragewert von 50 Prozent für die Wahlbeteiligung ist die Fehlerquote +/- 2.2 Prozent. Oder anders gesagt: Mit 95prozentiger Wahrscheinlichkeit liegt der Wert in der Grundgesamtheit (”den Wahlberechtigten”), die mit einer Stichprobe von 2000 Interviewten befragt worden ist, bei der Wahlbeteiligung effektiv zwischen 47,8 und 52,2 Prozent. Das war im Konkrenten Fall des letzten Wahlbarometers auch der Fall. Die letzte Umfrage vor den Wahlen kam auf 50 Prozent, der effektive Werte war 49 Prozent.
Nun kann die Vorgabe, dass man 95 Prozent Sicherheit will, auch verringern. Dann dann ergeben sich bei der gleichen Umfrage kleiner Intervalle, die mit geringerer Sicherheit eintreffen.
Zwei Beispiele: Geht man von einem Intervall von +/- 1 % aus, ist die Wahrscheinlichkeit, dass der Umfragewert (mit Fehlerquote) stimmt, noch 62 Prozent. Das war auch im zitierten Fall – de justesse – der Fall. Noch konreter: Wer aufgrund der 50 Prozent Wahlbeteiligung in der Umfrage annimmt, in der Realität liege zwischen 48 und 52 Prozent, irrt sich mit nur 5prozentiger Wahrscheinlichkeit. Wert sagt, sie liege zwischen 49 und 51 Prozent, täuscht sich mit 38prozentiger Wahrscheinlichkeit.
Wer es bildhaft möchte: Die Fehlerquote ist nicht nicht ein quadratischer Kasten mit klaren Grenzen, der absolut gilt. Die 95prozentige Sicherheit ist eine Konvention. Sie ist in den Sozialwissenschaften verbreitet. Man kann sie aber auch aufweichen, und dann gelten andere Sicherheitsmasse. Diese lassen sich anhand einer Glockenkurve recht gut bestimmen.
Soweit die Theorie. Nun die Praxis.
Wer 20 Aussagen aufgrund einer Umfrage macht, muss – rein statistisch gesehen – bei 95prozentiger Sicherheit 19 Mal innerhalb der genannten Fehlerquoten bleiben; einmal darf man auch ausserhalb sein. Das war diesmal, bei den 6 zentralen Aussagen (Wahlbeteiligung, 5 grösste Parteien, Kleinparteien unter um 2 Prozent können hier nicht sinnvoll berücksichtigt werden) stets der Fall.
Bei 62prozentiger Sicherheit muss man in 13 Mal innerhalb von +/-1 Prozent bleiben. 7 Mal kann er ausserhalb sein. 2 unserer Hauptaussagen waren ausserhalb, alle anderen innerhalb. Das gilt, selbst wenn wir die Werte für 4 Kleinparteien hinzu nehmen, die wir ausgewiesen haben.
Man merkt es: Bei +/-1 Prozent kommen wir im Schnitt an die Grenze der Aussagekraft einer Umfrage wie dem Wahlbarometer. Verbessert werden könnte sie nur noch, wenn man entweder Trendextrapolationen nach der letzten Befragung machen, oder wenn man mit gleichem Aufwand näher an den Wahltag selber Befragungen realisieren würde, um so die Ereignisse der letzten 2-3 Wochen besser abzubilden. Das lassen aber die Einschränkungen des Verbandes nicht zu.
Genau das, was wir hier wiedergeben, war auch in früheren Wahlbarometern der Fall, weshalb wir zwei praktische Regeln für die tägliche Arbeit entwickelt haben:
Wir vergleichen die Befragungswerte mit dem Wahlergebnis 2003 und machen darauf basierend verbindliche Schlüsse.
Wir vergleichen die Befragungswert im Wahlbarometer nicht nur zwischen 2 Wahlbarometern, sondern möglichst im Trend von 3 Umfragen.
Was den Vergleich mit 2003 anbelangt, hatten wir folgende Grenzwerte vereinbart, und den SRG-JounralistInnen stets kommuniziert: Verbesserungen oder Verschlechterungen von 0,5 Prozent gegenüber der letzten Wahl werden nicht interpretiert (”Partei hält sich”). Veränderungen von 0,6 bis 1,0 werden als “leichte Gewinne” resp. als “leichte Verluste” taxiert. Veränderungen von mehr als 1 Prozent zum Wahlergebnis von 2003 waren für uns “Gewinne” oder “Verluste”.
Trotz diesen Einschränkungen blieben die Parteistärken alles andere als stabil. Sie folgten wesentlichen Momenten im Wahlkampf, die wir aus früheren Wahlbarometer kannten und beschrieben hatten:
Die Wahlbeteiligungsabsicht stieg vor allem mit dem Einsetzen des Hauptwahlkampfes im Monat August erheblich an; und sie sank im bis zu den Wahlen wieder etwas ab.
Die SVP lag meist unter ihrem Wert von 2003, und sie hatten ihr Tief am Ende des Vorwhalkampfes im Juni 2007. Damals lag sie eineinhalb Prozent unter dem bisherigen Wahlergebnis. Sie legte indessen vor allem im Hauptwahlkampf und während der Mobilisierungsphase nochmals kontinuierlich zu.
Die Grünen stiegen zwischen Oktober 2005 und Frühsommer 2007 praktisch kontinuierlich an; damals lagen sie fast drei Prozent über dem Resultat von 2o03. Die Ereigenisse während der Legislatur und im Vorwahlkampf halten ihr. Im Hauptwahlkampf und während der Schlussmobilisierung sank sie jedoch wieder etwas ab.
Die CVP war durchs Band mehr oder minder stabil, aber fast immer leicht über dem Ergebnis von 2003.
Die FDP verlor vor allem während der Legislatur, sank um fast zwei Prozentpunkte. Sie startete im Frühling jedoch verbessert in den Vorwahlkampf, und machte wieder eineinhalb Prozentpunkte wett. Sie konnte dies im Hauptwahlkampf indessen nicht halten, sackte nochmals 2 Prozente ab, um mit der Schlussmobilisierung rund die Hälfte davon auszugleichen.
Die SP schliesslich hielt sich während der Legislatur gut, sank aber ab Frühling 2007 fast kontinuierlich an. Die Zürcher Wahlen waren da der Wendepunkt. Sie hatte einzig im Monat August ein kleines Zwischenhoch, das jedoch nicht anhielt. Sie verlor in der Mobilisierungsphase des Wahlkampfs nochmals deutlich.
Wer diese Leseweise als artifiziell abqualifiziert, studiere mal den Wahlkampf, die Ereignisse, den Mitteleinsatz, und beweise, dass das alles gar nie gar keinen Einfluss gehabe habe.
Wir bleiben unseren analytischen Einschätzungen vor der Wahl, die wir der SRG vermittelten:
. SP und FDP “verlieren”,
. CVP hat “gewinnt leicht”,
. Grüne und SVP “gewinnen”.
. Der SVP verhiessen wir gar einen Rekordgewinn.
Auch das traf dann ein!