Het ontbreken van data is niet nodig*. Het is een
kwestie van prioriteit geven aan het verzamelen van gegevens, bereid zijn om
gegevens te delen en vervolgens het juiste soort analytische modellering te
doen.
Een week geleden kondigde president Trump een verbod op
Europese vluchten aan om de verspreiding van het coronavirus te
verminderen. In de zeven dagen die volgden, rapporteerden de media
statistieken over huis-tuin-en-keuken variëteiten en is de besluitvorming gebaseerd op
infographics in plaats van op betrouwbare en nationaal representatieve
gegevens. Het is tijd voor nauwkeurige, onbevooroordeelde gegevens om de
wiskunde opnieuw te doen.
Dr. Eline van den Broek |
Welke gegevens zijn de afgelopen zeven dagen
gerapporteerd en wat weten we? Hier een kort overzicht:
- Aantal
gerapporteerde / bevestigde covid-19-gevallen. Per stad, staat, land,
regio en wereldwijd.
- Gerapporteerde
sterfgevallen door covid-19. Per stad, staat, land, regio en
wereldwijd.
- Aantal
landen die gevallen melden.
- Gegevens
uit China over infectiepercentages en sterfgevallen.
- Beelden
van overweldigde ziekenhuizen in Noord-Italië.
- De
bepalende afbeelding van de covid-19-pandemie, 'Flatten the Curve'.
De eerste drie bulletpoints kunnen worden samengevat met de
woorden 'gerapporteerd / bevestigd'. In de afgelopen zeven dagen hebben we
een grote hoeveelheid aan nieuwsberichten zien verschijnen, zoals: " 200
nieuwe gevallen ", "in totaal
1.900 gevallen " en "nog eens twee
aan coronavirus sterven ".
We zien ook pop-ups als 'Staat
x kan 16 infecties meer hebben dan officieel gemeld ',
'Sterftecijfer van
coronavirus is
nog steeds onzeker omdat milde gevallen niet worden gemeld ' ,
'Beperkte
gegevens over coronavirus kunnen verkeerde veronderstellingen zijn',
en 'Land
x rapporteert mogelijk coronavirus nummers . '
Maar hoe verhoudt het aantal gevallen covid-19 zich bijvoorbeeld tot
de huidige griepgevallen? We weten het niet. Zijn cijfers aangepast
voor populatie om vergelijkingen gemakkelijker en zinvoller te maken? De
media rapporteert eenvoudig nieuwe gevallen zonder context en waarschuwt het
publiek om thuis te blijven om de verspreiding van het virus te stoppen.
Ons huidige verhaal mist cruciale gegevens
We hebben tot op zekere hoogte gegevens uit China en
Italië. Toch zijn er veel vragen over de juistheid van die gegevens, vooral gezien de aanvankelijke ontkenning van de ziekte door de Chinese
overheid. Toch zijn daar gegevens aangeleverd en deze werden snel
gerapporteerd in wetenschappelijke tijdschriften.
Papers die normaal gesproken maanden in beslag nemen,
zorgvuldig worden gecontroleerd, geaccepteerd en uitgegeven, worden nu met
opmerkelijke snelheid gepubliceerd. Minder dan een jaar geleden
publiceerde BMC
Public Health een artikel waarin werd geconcludeerd dat vergelijkingen tussen studies en landen moeilijk zijn, omdat er verschillende methoden worden gebruikt om de belangrijkste maatregelen te berekenen. Maar
statistici doen nog steeds de precieze vergelijkingen waartegen ze
worden gewaarschuwd, omdat in het covid-19-tijdperk alles is
toegestaan en de basiskennis van de ziekte zo beperkt is.
In Italië lijkt de crisis (voorlopig) gelokaliseerd in
Noord-Italië, voornamelijk in de regio Lombardije. Waarom? Waarom
worden patiënten niet overgeplaatst naar andere regio's? Zijn er ook
andere regio's in Italië in crisis?
Er zijn verklaringen waarom Lombardije harder wordt getroffen dan andere regio's, maar daarover wordt nauwelijks wetenschappelijk gerapporteerd. In Italië vertellen de media hartverscheurende verhalen over
zorgverleners die over dood en leven moeten beslissen wegens een gebrek
aan bedden voor intensieve zorg. Maar er zijn nauwelijks rapportages die iets zeggen over het verhaal achter de ruwe data van ziekte- en sterftegevallen.
Het is het beeld van stervende mensen dat beslissingen
drijft. De "instorting van het ziekenhuis" in Noord-Italië is
schokkend en verontrustend, maar hoeft niet per se verontrustend te zijn voor
de rest van de wereld. Noord-Italië is hard getroffen, maar de rest van
Italië wacht net als wij grotendeels thuis af met wat er gaat gebeuren.
Het idee van 'De curve afvlakken'
De curve die vorige week viraal ging, is gebaseerd op
een idee, niet op gegevens. Het idee is eenvoudig en
intuïtief: "Handen wassen of thuisblijven als u ziek bent, kan nieuwe
ziektegevallen vertragen, zodat de eindige hulpbronnen van ons gezondheidszorgsysteem
een meer gestage stroom van zieke patiënten aankunnen dan een plotselinge
zondvloed." Dus we doen het.
Dan bevinden we ons plotseling weer thuis na nieuwsberichten
over " aandelen
daalden maandag bijna 13 procent ", de " recessie
zal nu dieper gaan dan de financiële crisis " en " Dit
is hoe het coronavirus de economie zal vernietigen ". Tegelijkertijd
sturen de media video's van ' overweldigde
ziekenhuizen in Italië ' naar onze huiskamer, wat een
multiplicatoreffect creëert voor de beweging 'Blijf thuis - het kan levens
redden', waardoor we denken dat we het juiste doen.
Simulatie modellering
The New York Times meldt dat in de Verenigde Staten en het
Verenigd Koninkrijk de nationale quarantainebesluiten sterk worden beïnvloed
door een rapport van het Imperial College dat de mogelijke gevolgen van de
pandemie en de impact op het gezondheidszorgsysteem van elk land
simuleerde. De simulatie werd uitgevoerd op basis van de best
beschikbare gegevens - uit Italië en China - maar er moesten veel
aannames worden gedaan omdat er zoveel onbekenden factoren zijn.
We telden ongeveer twintig van dergelijke aannames die nog moeten
worden bewezen. De belangrijkste onbekende factoren waren:
- Hoe
besmettelijk is de ziekte in de Verenigde Staten en het Verenigd
Koninkrijk
- De
lengte van de incubatietijd
- Of
individuen op korte termijn immuun zijn voor herinfectie
- Het
aantal mensen dat kritieke zorg nodig heeft
- Het
percentage mensen op de intensive care dat aan de ziekte zal overlijden
Deze modelleer-oefening gaat ervan uit dat de aantallen van China en
Italië a) nauwkeurig gerapporteerd is en b) van toepassing is op de Verenigde
Staten. Maar het is onbekend hoe landspecifieke factoren zoals
bevolkingsdichtheid, gebruik van openbaar vervoer, afvalverwerking, de prijs van een pakje sigaretten, leeftijdsverdeling van de bevolking en andere variabelen de toepasbaarheid van de gegevens op de Verenigde Staten beïnvloeden.
Zelfs als ze nauwkeurig worden gerapporteerd, zullen de
aantallen uit Italië en China niet precies weergeven wat er in de Verenigde
Staten zal gebeuren. Vraag is of ze accuraat genoeg is zodat onze huidige
beslissingen op basis van die gegevens correct zijn.
Dat is een empirische vraag, die snel kan én moet worden
beantwoord. Recent bewijs uit Duitsland suggereert inderdaad dat de input
van belangrijke modellen mogelijk niet van toepassing is in Duitsland,
aangezien Duitsland een lager sterftecijfer heeft dan andere
landen. Gedraagt het virus zich in Duitsland dan anders? Nee,
waarschijnlijker is dat de noemer (aantal exacte gevallen) van de sterftecijfers anders is, aangezien Duitsland
agressiever heeft getest.
Enorme behoefte aan nauwkeurigere gegevens
Welke gegevens hebben we de komende zeven dagen
nodig? Als de afgelopen zeven en meer dagen het doe de
wiskunde-tijdperk waren, zouden de volgende zeven en meer dagen ongeveer
de wiskunde opnieuw moeten doen tijdperk worden. Dat is mogelijk. Epidemiologie, statistiek, gezondheidseconomie zijn
allemaal gebaseerd op gegevens. Met de juiste data kunnen we betere
beslissingen nemen.
Betere gegevens zouden ons het volgende opleveren:
- Aantal
werkelijke covid-19-gevallen, per stad, staat, land, regio en wereldwijd.
- Werkelijke
sterfgevallen als gevolg van covid-19, per stad, staat, land, regio en
wereldwijd.
- Curven
en afbeeldingen op basis van werkelijke gegevens - hoeveel moet de curve
worden afgevlakt om het lot van Noord-Italië te vermijden?
Dit vereist geen massale landelijke tests, zoals Duitsland
deed. In de Verenigde Staten kunnen we snel nieuwe steekproeven uit het
hele land doen of een van de vele grote representatieve steekproeven gebruiken van lopende onderzoeken zoals de Current
Population Survey (CPS) of de Medical Expenditure Panel Survey.
Het moet mogelijk zijn om deze bestaande panels te gebruiken
en covid-19-tests uit te voeren met representatieve steekproeven van de
bevolking. Onderzoekers kunnen indien nodig stratificeren of oversampelen
in grootstedelijke gebieden of een specifieke regio.
De Centers for Disease Control and Prevention zouden tests
kunnen doen met representatieve monsters en deze de komende weken elke drie
dagen herhalen. Het relatief kleine aantal tests dat werd omgeleid om
gegevens te verzamelen, zou geen zinvolle afbreuk doen aan de lopende
behandeling. Gezien het biljoen-dollar hulppakket dat in het Congres is
voorgesteld, is het redelijk om wat belastinggeld te besteden aan testen en
waardevolle gegevens te verzamelen.
We moeten de wiskunde opnieuw doen
Met betere gegevens is het gemakkelijk om de wiskunde
nauwkeurig opnieuw uit te voeren. We zouden curven kunnen tekenen op basis
van werkelijke gegevens, incidentiecijfers kunnen berekenen op basis van
werkelijke data, en het zouden vooral gegevens zijn die zijn getrokken uit
een representatieve steekproef van de Amerikaanse bevolking.
Daarom kunnen we risicofactoren en individuele kenmerken
beter analyseren op basis van mensen die in ons land wonen en ons
gezondheidszorgsysteem gebruiken. Als we slim genoeg zijn om dezelfde
methodologie in verschillende landen te gebruiken en aantekeningen over de hele
wereld te vergelijken, komen we misschien wel op een plek waar betere
besluitvorming mogelijk is, en snel.
Europese landen hebben equivalenten
van de Centers for Disease Control en de meesten van hen hebben lopende onderzoeken
met nationaal representatieve monsters.
Het ontbreken van gegevens is niet nodig. Het is een
kwestie van prioriteit geven aan het verzamelen ervan; bereid zijn om
gegevens te delen en vervolgens het juiste soort analytische modellering te
doen. Ten slotte hebben we de media nodig om te rapporteren op basis van
gegevens in plaats van het verhaal.
'Zonder data ben je gewoon een andere persoon met een
mening.' Woorden van W. Edwards Deming ,
die hielp bij het ontwikkelen van de steekproeftechnieken die nog steeds worden
gebruikt door het Amerikaanse ministerie van volkstelling en het Bureau of
Labor Statistics.
Zijn woorden benadrukken het soort schade dat
maatschappelijke naïviteit en meningen kunnen aanrichten. Het is tijd voor
statistici, gezondheidseconomen, gegevenswetenschappers, epidemiologen en
andere wetenschappers om zich te verenigen en te zeggen: "Het is tijd voor
betere gegevens zodat we de wiskunde opnieuw kunnen doen."
* Dit artikel is eerder gepubliceerd in 'The Federalist': https://thefederalist.com/2020/03/21/the-united-states-needs-better-data-immediately-before-we-make-stupid-decisions-about-coronavirus/
* Dit artikel is eerder gepubliceerd in 'The Federalist': https://thefederalist.com/2020/03/21/the-united-states-needs-better-data-immediately-before-we-make-stupid-decisions-about-coronavirus/
----
Eline van den Broek-Altenburg, PhD, was journalist onder andere op Curaçao en adviseur
gezondheidsbeleid in het Nederlandse en Europese parlement en is momenteel
assistent-professor aan het Larner College of Medicine aan de Universiteit van
Vermont. Volg haar op Twitter op @E_line en #ReDoTheMath.
Adam
Atherly, PhD, is een professor en directeur van het Center for Health Services
Research aan het Larner College of Medicine aan de Universiteit van Vermont.