Datawetenschappers TU/e voorspellen groei coronabesmettingen per land

Door populatiegroeimodellen los te laten op wereldwijde coronadata zijn Eindhovense datawetenschappers in staat om het te verwachten aantal nieuwe besmettingen en doden als gevolg van het Covid-19 virus te berekenen voor de nabije toekomst. Voor de vier landen met het hoogste aantal besmettingen - China, Zuid-Korea, Iran en Italië - is een nauwkeurige voorspelling mogelijk van drie dagen vooruit, en een schatting van het maximaal aantal infecties. Op korte termijn wordt dit ook voor andere landen mogelijk, zoals Nederland en de Verenigde Staten. Deze pagina geeft telkens een update van hun laatste voorspellingen.

Het aantal infecties en doden China blijft ook de komende dagen stabiel, volgens de onderzoekers. In Zuid-Korea en Iran vlakt de groei in aantal infecties de komende dagen verder af. Het uiteindelijke maximum voor beide landen schatten de onderzoekers momenteel rond de respectievelijk 8.600 en 10.800 besmettingen. In Italië zet de forse stijging naar verwachting verder door, met een voorspeld totaal aan infecties na vandaag van 14.500 (17% meer dan gisteren) en 1.100 doden (34% toename sinds gisteren). Ook doen de onderzoekers voor Italië een voorzichtige eerste schatting van het uiteindelijk maximum met ongeveer 32.000 infecties.

Kijk hier voor een gedetailleerd overzicht van alle voorspellingen.

“We zijn data scientists, hier moesten we iets mee.”
“Wereldwijd zijn onderzoekers bezig de groei van coronabesmettingen te analyseren, maar het daadwerkelijk doen van nauwkeurige voorspellingen is vrij lastig”, stelt Edwin van den Heuvel, hoogleraar statistiek aan de TU Eindhoven. Samen met twee collega’s laat hij zijn kennis van statistiek en groeicurves los op de coronadata om deze zeer gewilde berekeningen te maken. “We zijn data scientists, hier moesten we iets mee.”

Het lijkt misschien triviaal om de lijn van besmettingen door te trekken, maar volgens Van den Heuvel komt hier echt wel het nodige bij kijken. “De vraag is steeds wanneer de toename gaat afvlakken, waar zit het maximum?”

Voor China, Zuid-Korea en Iran zijn ze nu in staat een inschatting te maken voor het aantal nieuwe besmettingen door het virus voor de eerstvolgende drie dagen, met een nauwkeurigheid van ruim 81%. Voor Italië lukt dit vooralsnog één dag vooruit, met meer data kan verder vooruit worden gekeken. Van den Heuvel verwacht echter dat hij binnen enkele dagen ook voor landen als Verenigde Staten en Nederland genoeg betrouwbare data heeft om dit te doen.

“We blijven ons model verbeteren, zodat we nog verder vooruit kunnen voorspellen”, zegt Van den Heuvel. Ook gaan ze kijken naar het effect van maatregelen en de opbouw van de bevolking in China. “Hiermee hopen we sneller te kunnen voorspellen waar het maximum zit, zodat we weten hoeveel mensen er in totaal besmet zullen raken of overlijden als gevolg van het virus”, aldus Van den Heuvel. Ook hopen we hiermee inzichten te krijgen welke factoren het aantal besmettingen en doden beinvloeden.

Populatiemodellen Verhulst
Van den Heuvel baseerde zich op de beroemde logistische functie, ontwikkeld door de Belgische wiskundige Pierre Francois Verhulst rond 1845. Deze functie beschrijft hoe een populatie groeit door de tijd, en heeft een S-vorm: in het begin groeit de bevolking langzaam, gevolgd door een steeds sterker wordende stijging, die vervolgens afvlakt tot een maximum.

Dit populatiemodel pasten ze eerst toe op de data uit China. “Het totaal aantal besmettingen voor iedere provincie in China bleek heel precies die logistische groei te volgen”, zegt Van den Heuvel. Met de Chinese data konden ze zodoende hun voorspellingsmodel kalibreren, om vervolgens onderschattingen voor het maximaal aantal nieuwe besmettingen en doden in andere landen te corrigeren. “Die voorspellingen bleken goed te kloppen voor Iran, Italië en Zuid-Korea.”