Corona-viruset

hvor mange kommer til å smittes og dø?

Opprinnelig publisert 1. mars 2020; oppdatert 28. mars 2020

Vi har samlet tall fra WHOs situasjonsrapporter og skal lage prognose. Vårt tallmateriale kan du laste ned her: corona_virus.txt. Første kolonne er dato, annen kolonne samlede antall smittede i hele verden, og tredje kolonne samlede antall smittede utenfor Kina.

Dette er altså kumulative tall. Ved å ta differensen mellom morgendagens tall og dagens får vi smitteraten: antall nye smittede per døgn i dag. Vi skal bruke følgende modell for smitteraten:

ρ ( t ) = 1 2 π N σ e x p ( 1 2 ( t μ ) 2 σ 2 )

Det er altså simpelthen normalfordelingen ganget med N. Vi har at:

ρ ( t ) d t = N

Det betyr at N er det totale antall individer som vil bli smittet før epidemien er over. Sett:

C = N 2 π

Da er:

N = 2 π C

Vi vil nå beregne logaritmen til ρ(t):

l n ρ ( t ) = l n C σ 1 2 ( t μ ) 2 σ 2 = ( l n C σ 1 2 μ 2 σ 2 ) + ( μ σ 2 ) t + ( 1 2 1 σ 2 ) t 2

Det er altså et annengradspolynom i t hvor koeffisientene er funksjoner av C, μ og σ. Planen er nå å bruke dataene til å utføre lineær regresjon og estimere disse koeffisientene a0, a1, a2. Når det er gjort får vi et system av tre ligninger:

l n C σ 1 2 μ 2 σ 2 = a 0
μ σ 2 = a 1
1 2 1 σ 2 = a 2

Løser tredje ligning og finner...

1 σ 2 = 2 a 2

Løser annen ligning og finner...

μ = 1 2 a 1 a 2

Da kan vi løse første ligning også og finner...

l n C σ = a 0 1 4 a 1 2 a 2

Hvilket gir:

C 2 = 1 2 1 a 2 e x p ( 2 a 0 1 2 a 1 2 a 2 )

Da er vi fremme og har funnet C, μ og σ uttrykt ved a0, a1, a2. Når vi har estimert disse koeffisientene kan vi derfor regne ut C, μ og σ. C gir oss N så vi får vite hvor mange som kommer til å smittes alt i alt. Legg merke til at μ og σ ikke avhenger av a0. Det er viktig som du nå skal se.

Dataene vi har brukt bygger for det meste på laboratorie-prøver. Men den 13. februar gikk Kina over til å rapportere kliniske diagnoser også. Da så vi et sprang oppover på nærmere tyve tusen fall. Vi må også regne med at det finnes flere smittede enn som er undersøkt av lege. Det er altså klart at vi må korrigere dataene oppad med en viss faktor k. Hvilken virkning har det på koeffisientene? Vi regner og finner...

l n ( k ρ ( t ) ) = l n k + l n ρ ( t ) = l n k + ( a 0 + a 1 t + a 2 t 2 ) = ( a 0 + l n k ) + a 1 t + a 2 t 2

Virkningen blir altså å legge ln(k) til a0. Men siden μ og σ ikke avhenger av a0 forandres de ikke. Det er gunstig, for μ er epidemiens høydepunkt, mens σ gir oss dens varighet. Disse egenskapene påvirkes ikke av underrapportering, bare den er konsekvent!

For Kina brukte vi k = 1.5 og regnet ut μ = 18.56, σ = 8.07, N = 86705. Vi definerer farsottens varighet som et 95 % sentralt konfidensintervall. Det ble [2.74, 34.39]. Tidens nullpunkt er 21. januar. Så farsotten begynte rundt den 24. januar og sluttet 21 + 34.39 - 31 = 24. februar. Ja, det stemmer, farsotten i Kina er over for denne gang. Den varte i 34.39 - 2.74 = 32 dager omtrent. Den nådde sitt høydepunkt omkring 21 + 18.56 - 31 = 9. februar. Med k = 1.5 ble totalt N = 86705 kinesere smittet. Men denne verdien av k er selvfølgelig usikker så dette vet vi egentlig ikke. Den kan for alt vi vet ligge mye høyere. Sykdommens dødelighet globalt er omlag 3.65 % så vi anslår antall døde kinesere til 86705 * 0.0365 = 3164. Men det er som sagt ikke stort mer enn en gjetning.

At farsotten er slutt i Kina er godt nytt! Men de må passe seg så de ikke opphever karantenene for snart, for da kan den blusse opp igjen. Hva så med Europa? Her befinner farsotten seg tildels i den eksponensielt voksende fasen så det er umulig å se enden på det, men noen land kan vi lage prognose for: Italia, Frankrike, Tyskland. Hvis forløpet i Kina er noe å holde seg til kan vi forvente at farsotten vil rase hele mars og et stykke inn i april før den er utmattet. Men Kina tydde til ekstreme virkemidler for å demme opp for smittespredning; i Europa gjorde regimene ingenting før begivenhetene til slutt tvang dem. Så vi må nok regne med at dette vil vare lengre og kreve flere ofre i Europa enn i Kina, i forhold til folketallene. Alt kommer an på adferden til europeiske folk: Hvis de trosser dumme råd fra regimene og helsebyråkratiene og satser på sikkerhet går det godt; i motsatt fall kan det føre til en katastrofe vi sent vil glemme.

Oppdatering 28. mars 2020. Vi er nå i stand til å lage prognoser for andre land enn Kina. Til dette skal vi benytte datasettet fra Johns Hopkins University som tilrettelagt på humdata.org. Det er time_series-ncov-Confirmed.csv vi bruker (ikke oppdatert). Det ligger der tidsserier for mange land. Vi skal se på de tre hardest rammede landene, foruten Kina: Sør-Korea, Iran og Italia. Etterhvert også andre europeiske land: Spania, Frankrike, Tyskland og Norge.

landhøydepunktsmittedebegynnersluttervarighet
korea.csv2. mars756418. februar14. mars25
iran.csv19. mars419612. mars4. april33
italia.csv25. mars1538754. mars15. april42
spania.csv1. april22928514. mars19. april36
frankrike.csv29. mars8621011. mars17. april37
tyskland.csv2. april19392614. mars21. april38
norge.csv23. mars54336. mars9. april34

Her betyr "smittede" totalt antall smittede når farsotten er over. Det er altså en prognose. Begynnelse og slutt er som sagt definert som endepunktene i et sentralt 95 % konfidensintervall. Når det er slutt i et land kommer bare 2.5 % til å smittes etter dette.

Vi ser at farsotten er over i Sør-Korea, hvor den varte i 25 dager. Det er kortere tid enn i Kina, men ikke like imponerende som før (de begynte på 20 dager). Det lave antall smittede (i forhold til folketallet) er dog meget imponerende. Den N vi fant er unøyaktig da smittetallet i dag (17. mars) er 8320. Det kan være fordi modellen passer måtelig godt i dette tilfelle. Men vi bruker k = 1.0, altså ingen korreksjon. Dødeligheten er 81 / 8320 = 1.0 %. Det er mye bedre enn Kina som ligger på 3213 / 80880 = 4.0 %. Vi avslutter dekningen av Sør-Korea i dag 17. mars; tallene blir ikke oppdatert mer etter dette.

Iran har sklidd mer og mer og slutten lar vente på seg. Dødelighet: 2517 / 35408 = 7.1 %. Det er høyere enn alle land vi følger, unntatt Italia og Spania.

Italia har stabilisert seg og nådde toppen for 3 dager siden. Nå skal smitteraten begynne å synke. Dødeligheten fortsetter å stige: 10023 / 92472 = 10.8 %. Vi spår at 153875 * 0.108 = 16618 italienere mister livet.

I Spania går det riktig ille. Landet ser ut til å overgå alle andre i ulykke. Dødelighet: 5982 / 73235 = 8.2 % hvilket nå er høyere enn Iran. Vi spår 229285 * 0.082 = 18801 døde spanjoler når det er forbi. Som vi tidlig forutså blir katastrofen i Spania værre enn noe annet sted.

Utviklingen i Frankrike var i lang tid gunstig og det ligger an til å klare seg bedre enn nabolandene, men de siste dagene har det sklidd mer og mer. Toppen nås i morgen. Dødeligheten er 2314 / 37575 = 6.2 %.

Tyskland har stabilisert seg. Som ventet er det omtrent like ille der som i Spania. Men Tysklands store fordel er at de har klart å holde dødeligheten nede: 433 / 57695 = 0.8 %. Hvor lenge kan dette holde? Med slik vekst kommer uvegerlig gamle tyskere til å smittes, hvilket vil få dødeligheten til å skyte i været. Den har begynt å klatre; riktignok sakte.

Så var det Norge da. Alt så lyst ut for noen dager siden, men så mørknet bildet mer og mer. Avslutningsfesten er utsatt til april. Dødeligheten er fortsatt lav: 23 / 4032 = 0.6 %. Hold dere unna andre mennesker inntil farsotten er forbi!

Dekningen av USA er i gang. Utviklingen de siste dagene har gjort at vi ikke lenger kan se enden på det. Må avvente med prognose. Men det er nå klart at USA rammes meget hardt. Dødelighet: 2229 / 124665 = 1.8 %.

Som vi ser varierer dødeligheten svært fra land til land, med Norge på bunnen med bare 0.6 % opp til Italia på 10.8 %. Hva kan forklare denne gigantiske forskjellen? I land hvor farsotten kom sent i gang har mange syke ennå ikke rukket å dø. Det sies at det tar 14 dager å dø av sykdommen; i alle fall tar det noen dager. Land som ikke har nådd toppen kommer nok til å stige i dødelighet etterhvert. Men dette forklarer ikke hvorfor Sør-Korea ligger så mye lavere enn Kina, for begge steder er det forbi. Italia hadde høyest dødelighet av alle land lenge før det nådde toppen. I Frankrike og Tyskland begynte det samtidig, men Frankrike ligger mye høyere enn Tyskland. Vi ser at fasen i farsotten har begrenset forklaringsevne; det er noe annet også. Har noen land vært flinkere til å beskytte sårbare grupper - gamle og syke - mot smitte enn andre?

Hvis du kikker på statistikken til worldometers ser du at barn i alderen 0-9 år har null dødelighet. Siden er den 0.2 % opp til 40 år. Over det vokser den bratt med alderen opp til 14.8 % i den høyeste aldersgruppen 80+ år. Hos coronavirusupdate angir de 0.2 % for alle aldersgrupper opp til 40 år. Vi mistenker derfor at aldersfordelingen blant smittede forklarer mye av forskjellen på landenes dødelighet. Hvis det er slik at nesten alle smittede i Tyskland og Norge er unge mennesker så forklarer det vår felles lave dødelighet på under 1 %. Er mange av de smittede i Iran og Italia gamle? Andreas Backhaus utredet dette spørsmålet for noen dager siden (Coronavirus: Why it’s so deadly in Italy). Der beviser han at svaret er ja: Italia kjennetegnes av en særdeles høy andel gamle blant smittede. I Sør-Korea er de fleste smittede unge, og i Tyskland enda yngre. Frankrike ligger et sted midt på treet. Vi tror vi kan godta dette som en fyldestgjørende forklaring.

Men hvorfor er så mange gamle mennesker smittet i Italia, i motsetning til Sør-Korea og Tyskland? Har noen land kultur for å pleie sine gamle hjemme i familien, mens andre parkerer dem på gamlehjem og sykehjem? Hvis de er samlet på pleiehjem er det lettere å isolere dem fra unge aktive smittebærende mennesker. Backhaus foreslår en annen forklaring: I Sør-Korea tar man prøver av alle mennesker; i Italia kun av personer med symptomer. Men mange unge smittede mennesker er lenge tilnærmet symptomfrie, og likevel smitter de andre. De er en vandrende dødsfelle for gamle. Når man ikke tester dem tillater man dem å spre smitten vidt og bredt slik at den når gamle.

Det påstås ofte på internett at Covid-19 ikke er farligere enn vanlig influensa. Hvordan er det med det? CDC estimates that so far this season there have been at least 38 million flu illnesses, 390,000 hospitalizations and 23,000 deaths from flu. (kilde). Dødeligheten er svært lav: 23 000 / 38 millioner = 0.06 %. Sammenlign det med dødeligheten for Covid-19 beregnet ovenfor i ulike land. Selv svineinfluensaen i 2009 forårsaket bare 18631 dødsfall i hele verden, i følge WHO. I Covid-19 ligger Spania an til å nå det tallet alene. Covid-19 er altså langt farligere enn alt annet som rammet oss i vår levetid. Derfor burde myndighetene i Europa ha gjort alt for å hindre smittespredning, men de gjorde ingenting før det var for sent. Nå må hele samfunnet stenges ned og folk låses inn for at regimet nektet å stenge grensene mot utsatte grupper! Alle kan se globalismens galskap og regimets ondskap.

Vår prognose bygger på få datapunkter - bare siden 20. februar - så den er usikker. La oss håpe at det lysner i dagene som kommer. For Europas skyld, og vår egen. Helhetsbildet er dermed dette: I det fjerne Østen er farsotten over. I Iran er den over om en uke. I Europa vil den trolig vare til Hitlers fødselsdag. I USA er det uvisst hva som kommer til å skje.

Vi skal oppdatere prognosen hver dag inntil farsotten er over. Følg med!

Rønnaug og Erlend