Noël en pandémie

Attachez vos tuques qu'ils disaient

Publié par Bruno Gauthier le December 19, 2021 · 5 mins read

La COVID s’invite à Noël

Le réveil est brutal à la lecture de La Presse ce matin.

Foo

On pourrait se croire en 2020 à pareil date l’an dernier. Mais est-ce que nous suivons la même tendance ?

Quelle vague déjà ?

L’analyse préliminaire présentée dans ma publication précédente nous a permis de démontrer les tendances entre les provinces durant la 2e vague, qui couvrait la période des Fêtes 2020.

Nous nous intéressons maintenant à la situation au Québec en 2021 comparée à 2020.

Nous utilisons encore une fois les données de l’INSPQ, mais seulement pour le Québec.

Le Code R créé pour cette publication est disponible sur mon Github.

Dates et données couvertes

Les dates utilisées pour bâtir le graphique sont les suivantes :

Année Début Fin
2020 2020-09-01 2021-03-20
2021 2021-09-01 2021-12-16

Étant donné que la période 2021 est plus courte que celle 2020, nous avons ce nombre de données disponibles pour bâtir notre graphique :

Anné Nombre de jours
2020 201
2021 107


Distribution des cas québécois - 2020 vs 2021

Si nous superposons les 2 années sur un même graphique, nous pouvons comparer la tendance 2020 vs 2021.

Nous pouvons bien voir que l’automne 2021 était sous un meilleur contrôle, mais que la courbe s’accélère dans les derniers jours, avec une pente plus élevée qu’à pareille date l’an dernier.

Analyse statistique

Le but de l’analyse est de déterminer si :

   Ho : la moyenne de 2020 est la même que celle 2021
   Ha : les 2 moyennes diffèrent
   Alpha : 5%

Nous pouvons effectuer une analyse statistique afin de comparer les 2 années pour les période où les données sont disponibles, tel que le graphique suivant.

Nous voyons bien que la variance des 2 périodes est différentes. Nous pouvons aussi croire que ce type de données ne suivent pas une distribution normale.

Transformation par rang

Pour être en mesure de réaliser la comparaison entre les 2 périodes, il faut utiliser une approche non paramétrique appelée la transformation par rang.

Aligned Rank Transform ANOVA

COVID_stats$Cas_Rang <- rank(COVID_stats$Cas)

headTail(COVID_stats)
##         Date Annee     Cas Cas_Rang
## 1 2021-09-01  2020  115.77        2
## 2 2021-09-01  2021  556.57       54
## 3 2021-09-02  2020  114.06        1
## 4 2021-09-02  2021  570.29       64
## 5       <NA>  <NA>     ...      ...
## 6 2021-12-15  2020 1789.77      211
## 7 2021-12-15  2021 1900.39      213
## 8 2021-12-16  2020 1813.78      212
## 9 2021-12-16  2021 2033.32      214

Suite à la transformation, la distribution des cas quotidiens devient : :

Nous pouvons voir que la largeur de la boîte s’est uniformisée.

Réalisation de l’ANOVA à 1 facteur sur les cas transformés

Avec les cas transformés par rang, nous pouvons réaliser la vérification des conditions de normalité des résidus et d’homogénéité de la variance.

Nous pouvons aussi réaliser les tests formels d’Anderson-Darling, pour la normalité des résidus.

##  Anderson-Darling normality test
##
## data:  residuals(ANOVA_rang)
## A = 1.0138, p-value = 0.01116

Et celui de Levene, pour l’homogénéité de la variance.

## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value   Pr(>F)
## group   1  6.8225 0.009646 **
##       212
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La normalité des résidus et l’homogénéité de la variance ne sont toujours pas atteints (visible graphiquement et par les tests formels (Pr < 5%) ), mais nous pouvons utiliser des tests adaptés après cette transformation en rang.

Le test Oneway est une ANOVA non-paramétrique adaptée pour des variances inégales.

La normalité des résidus n’est plus nécessaire après la transformation en rang pour réaliser cette analyse.

##  One-way analysis of means (not assuming equal variances)
##
## data:  Cas_Rang and Annee
## F = 16.416, denom df = 196.08, p-value = 7.326e-05

Nous constatons que P < 0.001 et nous pouvons donc rejeter l’hypothèse nulle Ho, c’est à dire que les moyennes des 2 années diffèrent.

Calcul des moyennes de cas 2020 vs 2021

Nous pouvons donc calculer les moyennes de cas quotidiens au Québec et leurs intervalles de confiance à 95%.

Année Limite Sup Moyenne Limite inf
2020 1035 948 861
2021 813 749 685


Conclusion

Nous avons pu confirmer que la différence de moyenne de cas déclarés de COVID au Québec entre l’automne 2020 et l’automne 2021 est statistiquement significative.

La Santé Publique a déclaré 749 cas quotidiens en 2021 plutôt que 949 en 2020. Nous pouvons sûrement y voir l’effet de l’immunité de la population causée par la vaccination.

Par contre, nous avons pu voir avec le graphique des données dans le temps que la tendance actuelle au Québec s’accélère rapidement. Le nouveau variant Omicron a su donner un 2e (ou 3e ?) souffle au virus.

Espérons qu’il sera possible de renverser la tendance dans les prochaines semaines. Sinon, ma lecture matinale de La Presse risque d’être encore déprimante en 2022…