Le réveil est brutal à la lecture de La Presse ce matin.
On pourrait se croire en 2020 à pareil date l’an dernier. Mais est-ce que nous suivons la même tendance ?
L’analyse préliminaire présentée dans ma publication précédente nous a permis de démontrer les tendances entre les provinces durant la 2e vague, qui couvrait la période des Fêtes 2020.
Nous nous intéressons maintenant à la situation au Québec en 2021 comparée à 2020.
Nous utilisons encore une fois les données de l’INSPQ, mais seulement pour le Québec.
Le Code R
créé pour cette publication est disponible sur mon
Github.
Les dates utilisées pour bâtir le graphique sont les suivantes :
Année | Début | Fin |
---|---|---|
2020 | 2020-09-01 | 2021-03-20 |
2021 | 2021-09-01 | 2021-12-16 |
Étant donné que la période 2021 est plus courte que celle 2020, nous avons ce nombre de données disponibles pour bâtir notre graphique :
Anné | Nombre de jours |
---|---|
2020 | 201 |
2021 | 107 |
Si nous superposons les 2 années sur un même graphique, nous pouvons comparer la tendance 2020 vs 2021.
Nous pouvons bien voir que l’automne 2021 était sous un meilleur contrôle, mais que la courbe s’accélère dans les derniers jours, avec une pente plus élevée qu’à pareille date l’an dernier.
Le but de l’analyse est de déterminer si :
Ho : la moyenne de 2020 est la même que celle 2021
Ha : les 2 moyennes diffèrent
Alpha : 5%
Nous pouvons effectuer une analyse statistique afin de comparer les 2 années pour les période où les données sont disponibles, tel que le graphique suivant.
Nous voyons bien que la variance des 2 périodes est différentes. Nous pouvons aussi croire que ce type de données ne suivent pas une distribution normale.
Pour être en mesure de réaliser la comparaison entre les 2 périodes, il faut utiliser une approche non paramétrique appelée la transformation par rang.
COVID_stats$Cas_Rang <- rank(COVID_stats$Cas)
headTail(COVID_stats)
## Date Annee Cas Cas_Rang
## 1 2021-09-01 2020 115.77 2
## 2 2021-09-01 2021 556.57 54
## 3 2021-09-02 2020 114.06 1
## 4 2021-09-02 2021 570.29 64
## 5 <NA> <NA> ... ...
## 6 2021-12-15 2020 1789.77 211
## 7 2021-12-15 2021 1900.39 213
## 8 2021-12-16 2020 1813.78 212
## 9 2021-12-16 2021 2033.32 214
Suite à la transformation, la distribution des cas quotidiens devient : :
Nous pouvons voir que la largeur de la boîte s’est uniformisée.
Avec les cas transformés par rang, nous pouvons réaliser la vérification des conditions de normalité des résidus et d’homogénéité de la variance.
Nous pouvons aussi réaliser les tests formels d’Anderson-Darling, pour la normalité des résidus.
## Anderson-Darling normality test
##
## data: residuals(ANOVA_rang)
## A = 1.0138, p-value = 0.01116
Et celui de Levene, pour l’homogénéité de la variance.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 6.8225 0.009646 **
## 212
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La normalité des résidus et l’homogénéité de la variance ne sont toujours pas atteints (visible graphiquement et par les tests formels (Pr < 5%) ), mais nous pouvons utiliser des tests adaptés après cette transformation en rang.
Le test Oneway est une ANOVA non-paramétrique adaptée pour des variances inégales.
La normalité des résidus n’est plus nécessaire après la transformation en rang pour réaliser cette analyse.
## One-way analysis of means (not assuming equal variances)
##
## data: Cas_Rang and Annee
## F = 16.416, denom df = 196.08, p-value = 7.326e-05
Nous constatons que P < 0.001 et nous pouvons donc rejeter l’hypothèse nulle Ho, c’est à dire que les moyennes des 2 années diffèrent.
Nous pouvons donc calculer les moyennes de cas quotidiens au Québec et leurs intervalles de confiance à 95%.
Année | Limite Sup | Moyenne | Limite inf |
---|---|---|---|
2020 | 1035 | 948 | 861 |
2021 | 813 | 749 | 685 |
Nous avons pu confirmer que la différence de moyenne de cas déclarés de COVID au Québec entre l’automne 2020 et l’automne 2021 est statistiquement significative.
La Santé Publique a déclaré 749 cas quotidiens en 2021 plutôt que 949 en 2020. Nous pouvons sûrement y voir l’effet de l’immunité de la population causée par la vaccination.
Par contre, nous avons pu voir avec le graphique des données dans le temps que la tendance actuelle au Québec s’accélère rapidement. Le nouveau variant Omicron a su donner un 2e (ou 3e ?) souffle au virus.
Espérons qu’il sera possible de renverser la tendance dans les prochaines semaines. Sinon, ma lecture matinale de La Presse risque d’être encore déprimante en 2022…