Forskere ved Northeastern University bruker Google Cloud Platform til å modellere spredningen av zikaviruset

MoBs-laboratoriet (Modeling of Biological and Socio-technical Systems) ved Northeastern University trengte en metode for rask modellering av zikaviruset. Ved hjelp av GCE og avbrytbare virtuelle maskiner har MoBS kjørt mer enn ti millioner simuleringer og analysert data langt raskere enn tidligere.

I 2015, da det myggbårne zikaviruset spredte seg raskt over hele det amerikanske kontinentet, ble det innført reiseforbud og karantener, og mange tok til orde for å avlyse OL 2016 i Brasil. Da Verdens helseorganisasjon erklærte dette som en internasjonal folkehelsekrise, hadde myndighetene i de berørte landene behov for detaljert innsikt for å kunne forutse omfanget og forekomsten av nye smittetilfeller. Fordi kun 20 prosent av zikatilfellene er symptomatiske, er dette viruset særdeles vanskelig å forutse.

I januar 2016 startet teamet på MoBS-laboratoriet ved Northeastern University – med støtte fra Center for Inference and Dynamics of Infectious Diseases – prosjektet for zikamodellering («Zika Modeling Project») for å hjelpe offentlige myndigheter og forskere med å få bedre innsikt i utviklingen og spredningen av viruset.

«Ved hjelp av verktøy for håndtering av store datamengder samt nærmest ubegrenset tilgang til datakraft håper vi å kunne hjelpe forskere og folkehelseaktører.»

Matteo Chinazzi, Northeastern University, vitenskapelig medarbeider

GCP: essensielle prognoseverktøy, analyseverktøy med mer

Ved hjelp av Google Cloud Platform (GCP) har teamet brukt matematiske og beregningsbaserte metoder til å studere ulike mulige scenarioer for spredning av zikaviruset, for deretter å anslå hvordan ulike befolkninger blir berørt. Modellen er basert på den innledende spredningen av zika i Brasil, der viruset brøt ut i 2015. Forskerne kan nå forutse virkningen av nye smittetilfeller i andre områder ved å legge inn flere datalag, for eksempel temperatur, antall mygg, befolkningsstørrelse og reisemønstre.

Med GCP kan teamet kjøre flere parallelle simuleringer samt analysere terabyte med data som genereres av de modellerte scenarioene. «Vi bruker flere GCP-produkter», sier Matteo Chinazzi, som er forsker ved Northeastern University. «Alle modelleringsdataene våre lagres i Google Cloud Storage, som også er vert for nettstedet. Google Compute Engine (GCE) og avbrytbare virtuelle maskiner kjører simuleringer av virusspredning. Google BigQuery brukes til å undersøke de simulerte scenarioene, som hver omfatter variabler, for eksempel datoer og infeksjonsnumre. Hittil har vi jobbet oss gjennom enorme mengder data – til sammen hundrevis av terabyte – og alt lagres i Google Cloud Storage.»

Raske resultater og skalering etter behov

Ved hjelp av GCE og avbrytbare virtuelle maskiner har MoBS kjørt mer enn ti millioner simuleringer. Med CGE og BigQuery har de kunnet utføre simuleringer og analysere data langt raskere enn tidligere. (Begge prosessene tar nå timer i stedet for uker.) «Vi har fleksibiliteten til å oppskalere til flere tusen uavhengige virtuelle forekomster parallelt», forteller Chinazzi, «slik at vi kan generere en full analyse for ett og samme epidemi-scenario – som kan bestå av opptil 250 000 uavhengige simuleringer – på mindre enn en dag.»

Med denne modellen kan forskere få bedre innsikt i spredningen av zikaviruset, men i tillegg kan modellen brukes som en mal for analyse av andre epidemier, for eksempel denguefeber. Selv om Verdens helseorganisasjon ikke lenger definerer zika som en internasjonal krise, er det fortsatt mye å gjøre for å forhindre utbrudd av myggbårne sykdommer. Ved hjelp av verktøy for håndtering av store datamengder samt nærmest ubegrenset tilgang til datakraft håper MoBS-teamet å kunne hjelpe forskere og folkehelseaktører med å lykkes i dette arbeidet.

«Tiden er knapp når sykdomsutbrudd skal håndteres», sier Chinazzi, «og GCP gir oss verktøyene vi trenger for å arbeide raskt – uansett hvor store datamengder det dreier seg om.»

Hvis du vil lese mer om MoBS-laboratoriets forskning og analyser angående zikaviruset, kan du se artikkelen «Spread of Zika virus in the Americas», som er publisert av PNAS (Proceedings of the National Academy of Sciences of the United States of America).

«Vi har fleksibiliteten til å oppskalere til flere tusen uavhengige virtuelle forekomster parallelt, slik at vi kan generere en full analyse for ett og samme epidemi-scenario – som kan bestå av opptil 250 000 uavhengige simuleringer – på mindre enn en dag.»

Matteo Chinazzi, Northeastern University, vitenskapelig medarbeider

Organisasjonsprofil

Forskerne ved MoBS-laboratoriet (Modeling of Biological and Socio-technical Systems) ved Northeastern University arbeider med å utvikle datadrevne modeller for spredning av smittsomme sykdommer. De ser blant annet nærmere på menneskelig og sosial atferd og modellerer utvikling av komplekse sosiale og teknologiske nettverk, utvinner data om bruks- og trafikkmønstre i teknologiske nettverk, for eksempel Internett, samt studerer forholdet mellom sosial dynamikk og atferd på nettet.

Produktene som ble brukt

Takk for at du registrerte deg!

Fortell oss mer om det du er interessert i.