Betere gegevens nodig, onmiddellijk, voordat we domme beslissingen nemen over het Coronavirus

Het ontbreken van data is niet nodig*. Het is een kwestie van prioriteit geven aan het verzamelen van gegevens, bereid zijn om gegevens te delen en vervolgens het juiste soort analytische modellering te doen.

Dr. Eline van den Broek
Een week geleden kondigde president Trump een verbod op Europese vluchten aan om de verspreiding van het coronavirus te verminderen. In de zeven dagen die volgden, rapporteerden de media statistieken over huis-tuin-en-keuken variëteiten en is de besluitvorming gebaseerd op infographics in plaats van op betrouwbare en nationaal representatieve gegevens. Het is tijd voor nauwkeurige, onbevooroordeelde gegevens om de wiskunde opnieuw te doen.


Welke gegevens zijn de afgelopen zeven dagen gerapporteerd en wat weten we? Hier een kort overzicht:

  • Aantal gerapporteerde / bevestigde covid-19-gevallen. Per stad, staat, land, regio en wereldwijd.
  • Gerapporteerde sterfgevallen door covid-19. Per stad, staat, land, regio en wereldwijd.
  • Aantal landen die gevallen melden.
  • Gegevens uit China over infectiepercentages en sterfgevallen.
  • Beelden van overweldigde ziekenhuizen in Noord-Italië.
  • De bepalende afbeelding van de covid-19-pandemie, 'Flatten the Curve'.
De eerste drie bulletpoints kunnen worden samengevat met de woorden 'gerapporteerd / bevestigd'. In de afgelopen zeven dagen hebben we een grote hoeveelheid aan nieuwsberichten zien verschijnen, zoals: " 200 nieuwe gevallen ", "in totaal 1.900 gevallen " en "nog eens twee aan coronavirus sterven ".


Maar hoe verhoudt het aantal gevallen covid-19 zich bijvoorbeeld tot de huidige griepgevallen? We weten het niet. Zijn cijfers aangepast voor populatie om vergelijkingen gemakkelijker en zinvoller te maken? De media rapporteert eenvoudig nieuwe gevallen zonder context en waarschuwt het publiek om thuis te blijven om de verspreiding van het virus te stoppen.

Ons huidige verhaal mist cruciale gegevens
We hebben tot op zekere hoogte gegevens uit China en Italië. Toch zijn er veel vragen over de juistheid van die gegevens, vooral gezien de aanvankelijke ontkenning van de ziekte door de Chinese overheid. Toch zijn daar gegevens aangeleverd en deze werden snel gerapporteerd in wetenschappelijke tijdschriften.

Papers die normaal gesproken maanden in beslag nemen, zorgvuldig worden gecontroleerd, geaccepteerd en uitgegeven, worden nu met opmerkelijke snelheid gepubliceerd. Minder dan een jaar geleden publiceerde BMC Public Health een artikel waarin werd geconcludeerd dat vergelijkingen tussen studies en landen moeilijk zijn, omdat er verschillende methoden worden gebruikt om de belangrijkste maatregelen te berekenen. Maar statistici doen nog steeds de precieze vergelijkingen waartegen ze worden gewaarschuwd, omdat in het covid-19-tijdperk alles is toegestaan en de basiskennis van de ziekte zo beperkt is.

In Italië lijkt de crisis (voorlopig) gelokaliseerd in Noord-Italië, voornamelijk in de regio Lombardije. Waarom? Waarom worden patiënten niet overgeplaatst naar andere regio's? Zijn er ook andere regio's in Italië in crisis?

Er zijn verklaringen waarom Lombardije harder wordt getroffen dan andere regio's, maar daarover wordt nauwelijks wetenschappelijk gerapporteerd. In Italië vertellen de media hartverscheurende verhalen over zorgverleners die over dood en leven moeten beslissen wegens een gebrek aan bedden voor intensieve zorg. Maar er zijn nauwelijks rapportages die iets zeggen over het verhaal achter de ruwe data van ziekte- en sterftegevallen.

Het is het beeld van stervende mensen dat beslissingen drijft. De "instorting van het ziekenhuis" in Noord-Italië is schokkend en verontrustend, maar hoeft niet per se verontrustend te zijn voor de rest van de wereld. Noord-Italië is hard getroffen, maar de rest van Italië wacht net als wij grotendeels thuis af met wat er gaat gebeuren.

Het idee van 'De curve afvlakken'
De curve die vorige week viraal ging, is gebaseerd op een idee, niet op gegevens. Het idee is eenvoudig en intuïtief: "Handen wassen of thuisblijven als u ziek bent, kan nieuwe ziektegevallen vertragen, zodat de eindige hulpbronnen van ons gezondheidszorgsysteem een ​​meer gestage stroom van zieke patiënten aankunnen dan een plotselinge zondvloed." Dus we doen het.

Dan bevinden we ons plotseling weer thuis na nieuwsberichten over " aandelen daalden maandag bijna 13 procent ", de " recessie zal nu dieper gaan dan de financiële crisis " en " Dit is hoe het coronavirus de economie zal vernietigen ". Tegelijkertijd sturen de media video's van ' overweldigde ziekenhuizen in Italië ' naar onze huiskamer, wat een multiplicatoreffect creëert voor de beweging 'Blijf thuis - het kan levens redden', waardoor we denken dat we het juiste doen.

Simulatie modellering
The New York Times meldt dat in de Verenigde Staten en het Verenigd Koninkrijk de nationale quarantainebesluiten sterk worden beïnvloed door een rapport van het Imperial College dat de mogelijke gevolgen van de pandemie en de impact op het gezondheidszorgsysteem van elk land simuleerde. De simulatie werd uitgevoerd op basis van de best beschikbare gegevens - uit Italië en China - maar er moesten veel aannames worden gedaan omdat er zoveel onbekenden factoren zijn.

We telden ongeveer twintig van dergelijke aannames die nog moeten worden bewezen. De belangrijkste onbekende factoren waren:

  • Hoe besmettelijk is de ziekte in de Verenigde Staten en het Verenigd Koninkrijk
  • De lengte van de incubatietijd
  • Of individuen op korte termijn immuun zijn voor herinfectie
  • Het aantal mensen dat kritieke zorg nodig heeft
  • Het percentage mensen op de intensive care dat aan de ziekte zal overlijden
Deze modelleer-oefening gaat ervan uit dat de aantallen van China en Italië a) nauwkeurig gerapporteerd is en b) van toepassing is op de Verenigde Staten. Maar het is onbekend hoe landspecifieke factoren zoals bevolkingsdichtheid, gebruik van openbaar vervoer, afvalverwerking, de prijs van een pakje sigaretten, leeftijdsverdeling van de bevolking en andere variabelen de toepasbaarheid van de gegevens op de Verenigde Staten beïnvloeden.

Zelfs als ze nauwkeurig worden gerapporteerd, zullen de aantallen uit Italië en China niet precies weergeven wat er in de Verenigde Staten zal gebeuren. Vraag is of ze accuraat genoeg is zodat onze huidige beslissingen op basis van die gegevens correct zijn.

Dat is een empirische vraag, die snel kan én moet worden beantwoord. Recent bewijs uit Duitsland suggereert inderdaad dat de input van belangrijke modellen mogelijk niet van toepassing is in Duitsland, aangezien Duitsland een lager sterftecijfer heeft dan andere landen. Gedraagt ​​het virus zich in Duitsland dan anders? Nee, waarschijnlijker is dat de noemer (aantal exacte gevallen) van de sterftecijfers anders is, aangezien Duitsland agressiever heeft getest.

Enorme behoefte aan nauwkeurigere gegevens
Welke gegevens hebben we de komende zeven dagen nodig? Als de afgelopen zeven en meer dagen het doe de wiskunde-tijdperk waren, zouden de volgende zeven en meer dagen ongeveer de wiskunde opnieuw moeten doen tijdperk worden. Dat is mogelijk. Epidemiologie, statistiek, gezondheidseconomie zijn allemaal gebaseerd op gegevens. Met de juiste data kunnen we betere beslissingen nemen.

Betere gegevens zouden ons het volgende opleveren:

  • Aantal werkelijke covid-19-gevallen, per stad, staat, land, regio en wereldwijd.
  • Werkelijke sterfgevallen als gevolg van covid-19, per stad, staat, land, regio en wereldwijd.
  • Curven en afbeeldingen op basis van werkelijke gegevens - hoeveel moet de curve worden afgevlakt om het lot van Noord-Italië te vermijden?
Dit vereist geen massale landelijke tests, zoals Duitsland deed. In de Verenigde Staten kunnen we snel nieuwe steekproeven uit het hele land doen of een van de vele grote representatieve steekproeven gebruiken van lopende onderzoeken zoals de Current Population Survey (CPS) of de Medical Expenditure Panel Survey.

Het moet mogelijk zijn om deze bestaande panels te gebruiken en covid-19-tests uit te voeren met representatieve steekproeven van de bevolking. Onderzoekers kunnen indien nodig stratificeren of oversampelen in grootstedelijke gebieden of een specifieke regio.

De Centers for Disease Control and Prevention zouden tests kunnen doen met representatieve monsters en deze de komende weken elke drie dagen herhalen. Het relatief kleine aantal tests dat werd omgeleid om gegevens te verzamelen, zou geen zinvolle afbreuk doen aan de lopende behandeling. Gezien het biljoen-dollar hulppakket dat in het Congres is voorgesteld, is het redelijk om wat belastinggeld te besteden aan testen en waardevolle gegevens te verzamelen.

We moeten de wiskunde opnieuw doen
Met betere gegevens is het gemakkelijk om de wiskunde nauwkeurig opnieuw uit te voeren. We zouden curven kunnen tekenen op basis van werkelijke gegevens, incidentiecijfers kunnen berekenen op basis van werkelijke data, en het zouden vooral gegevens zijn die zijn getrokken uit een representatieve steekproef van de Amerikaanse bevolking.

Daarom kunnen we risicofactoren en individuele kenmerken beter analyseren op basis van mensen die in ons land wonen en ons gezondheidszorgsysteem gebruiken. Als we slim genoeg zijn om dezelfde methodologie in verschillende landen te gebruiken en aantekeningen over de hele wereld te vergelijken, komen we misschien wel op een plek waar betere besluitvorming mogelijk is, en snel. 

Europese landen hebben equivalenten van de Centers for Disease Control en de meesten van hen hebben lopende onderzoeken met nationaal representatieve monsters.

Het ontbreken van gegevens is niet nodig. Het is een kwestie van prioriteit geven aan het verzamelen ervan; bereid zijn om gegevens te delen en vervolgens het juiste soort analytische modellering te doen. Ten slotte hebben we de media nodig om te rapporteren op basis van gegevens in plaats van het verhaal.

'Zonder data ben je gewoon een andere persoon met een mening.' Woorden van W. Edwards Deming , die hielp bij het ontwikkelen van de steekproeftechnieken die nog steeds worden gebruikt door het Amerikaanse ministerie van volkstelling en het Bureau of Labor Statistics.

Zijn woorden benadrukken het soort schade dat maatschappelijke naïviteit en meningen kunnen aanrichten. Het is tijd voor statistici, gezondheidseconomen, gegevenswetenschappers, epidemiologen en andere wetenschappers om zich te verenigen en te zeggen: "Het is tijd voor betere gegevens zodat we de wiskunde opnieuw kunnen doen."

* Dit artikel is eerder gepubliceerd in 'The Federalist': https://thefederalist.com/2020/03/21/the-united-states-needs-better-data-immediately-before-we-make-stupid-decisions-about-coronavirus/

----

Eline van den Broek-Altenburg, PhD, was journalist onder andere op Curaçao en adviseur gezondheidsbeleid in het Nederlandse en Europese parlement en is momenteel assistent-professor aan het Larner College of Medicine aan de Universiteit van Vermont. Volg haar op Twitter op @E_line en #ReDoTheMath. 

Adam Atherly, PhD, is een professor en directeur van het Center for Health Services Research aan het Larner College of Medicine aan de Universiteit van Vermont.