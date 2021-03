Massive Aufmerksamkeit für Stanford-Studie

Mittlerweile wurden mehr als 26.000 Tweets gezählt, die sich darauf bezogen, und der sogenannte "Altmetric score" liegt derzeit bei über 17.000. Dieser Gradmesser erhebt die Aufmerksamkeit und Resonanz, die eine Studie erhält, wobei nicht nur - wie bei konventionellen Impakt-Erhebungen - Zitate aus der akademischen Welt berücksichtigt werden, sondern beispielsweise auch Erwähnungen in Medien und auf Web-Plattformen. Zum Vergleich: Keine Cochrane-Publikation überschritt je eine Punktezahl von 5000.



Als selbst praktische Ärzte immer öfter ratlos waren, weil zornige und der Lockdowns überdrüssige Patienten triumphierend mit der Stanford-Studie wedelten, ersuchten sie Cochrane um eine fachliche Bewertung des vermeintlich allen bisherigen Annahmen widersprechenden Papers. Das Ergebnis wurde nun in der "Zeitschrift für Allgemeinmedizin" veröffentlicht und besagt, dass die Arbeit der US-Kollegen schlicht wertlos ist: Die Studie liefere "keine belastbare Evidenz für oder gegen die Wirksamkeit von restriktiven nicht-pharmakologischen Maßnahmen". Die Autoren sind also gar nicht in der Lage, die eigene Frage zu beantworten, ob Lockdowns nützlich sind oder nicht, weil ihre Methoden dafür nicht geeignet sind.



Nun könnte man einwenden, verschiedene Experten verträten einfach unterschiedliche Ansichten, und es sei letztlich Interpretationssache, welcher davon man eher zuneige. Das trifft aber nicht zu: Damit es eben nicht Geschmacks- oder Meinungsfrage bleiben muss, welcher Position man den Vorzug gibt, hat sich über lange Zeit ein rigides, staubtrockenes Bewertungsraster durchgesetzt, das heute allgemein akzeptiert ist. Damit lässt sich beurteilen, ob die international geforderten Qualitätsstandards im Design einer Studie erfüllt wurden oder nicht. Dazu zählen zum Beispiel folgende Kriterien: Ist die Datenerhebung nachvollziehbar? Werden Methoden und statistische Modelle hinlänglich erläutert? Sind die verglichenen Daten überhaupt vergleichbar? Oder werden gleichsam Äpfel Birnen gegenübergestellt? Werden Lücken in den Daten berücksichtigt oder lässig ignoriert? All das kann gravierende Verzerrungen ergeben. In Summe wird keine Aussage über die Inhalte einer Studie getroffen, sondern über die handwerkliche Qualität.

Verzerrungsrisiko "hoch"

Im konkreten Fall nahm das Forscherteam eine Bewertung in sieben Kategorien vor. In vier davon wurde das Verzerrungsrisiko - also die Anfälligkeit für Fehler und Trugschlüsse - als "hoch" eingestuft, in einer als "moderat", zwei Mal wurde wegen Datenmangels "unzureichende Information" notiert. Einige Kritikpunkte beziehen sich auf die Vergleiche von Lockdown-Maßnahmen verschiedener Länder im Frühjahr 2020, was aber ein schwieriges Unterfangen ist, da Art und Ausmaß dieser Maßnahmen von Land zu Land teils sehr unterschiedlich waren - genauso wie die Bereitschaft der jeweiligen Bevölkerung, die Maßnahmen mitzutragen. Wenn man solche lokalen Unterschiede - etwa zwischen Deutschland, Südkorea und dem Iran - aber nicht sauber herausrechnet , ist das Ergebnis wenig gehaltvoll. Warum, andererseits, wurden eher willkürlich zehn Länder ausgewählt, aber just jene ausgespart, die nach harten Lockdowns die Pandemie nahezu erstickt haben, etwa Neuseeland und Australien? Und wenn man schon Schweden einbezieht, warum dann kein Vergleich mit anderen skandinavischen Ländern wie Dänemark oder Norwegen? Hinzu kamen formale Einwände: fehlende Daten, unzureichende Definition von Lockdown-Maßnahmen, nicht existentes Studienprotokoll, statistische Störfaktoren. Insofern sei die abschließende Aussage der Stanford-Forscher unzulässig, wonach man "keine signifikanten Vorteile auf das Fallwachstum" durch harte Maßnahmen gefunden habe.



Etwas verstörend ist, dass die Arbeit unter Patronanz eines der renommiertesten Epidemiologen entstand: John Ioannidis, der als ausgewiesene Koryphäe auf seinem Gebiet gilt und vor Jahren sogar von Cochrane zu Vorträgen nach Österreich eingeladen wurde. "Man versteht nicht, wie er in so ein Fahrwasser geraten ist, denn grundsätzlich schätze ich ihn sehr", sagt Gartlehner. Allerdings fiel Ioannidis schon vor einigen Monaten durch Arbeiten zur Coronavirus-Pandemie auf, die von Kollegen wegen fragwürdiger Methodik scharf kritisiert wurden. Womöglich treibt auch solch eine Kapazität der zutiefst menschliche Wunsch, alles sei ohnehin halb so wild und die gegenwärtige missliche Situation daher gar nicht erforderlich.



Treppenwitz der Geschichte: Erstmals weltweit bekannt wurde Ioannidis 2005 mit einer Methodenkritik an der Arbeit der restlichen Fachwelt. Sein damaliger Artikel trug den passenden Titel: "Why Most Published Research Findings are False."