Exercice 35 : Chiffres d'affaires

Dans cet exercice, on va s'intéresser aux performances de l'ensemble des petites et moyennes entreprises (PME) de deux pays fictifs notés P1 et P2 en 2004 et 2005 en analysant leurs chiffres d'affaires (exprimés dans une même unité).
Partie I Dans cette partie, on s'intéresse uniquement au chiffre d'affaires moyen des PME du pays P1 et plus précisément à son évolution au cours des années 2004 et 2005. Ne pouvant pas interroger l'ensemble des PME, on ne pourra disposer que des chiffres d'affaires sur un échantillon de PME. On commence par recueillir pour 2004 et 2005, les chiffres d'affaires de 20 PME (ce sont les mêmes PME que l'on suit de 2004 à 2005). Les données sont stockées dans les vecteurs $\mathtt{y04}$ et $\mathtt{y05}$. On propose de noter $\mu^{04}$ et $\mu^{05}$ les chiffres d'affaires annuels moyens de l'ensemble des PME du pays P1 en 2004 et 2005.
(1) Peut-on penser que le chiffre d'affaires annuel moyen des PME en 2004 est supérieur à 80 unités ?
R> y04
 [1] 84.03 95.47 88.89 93.09 87.24 90.00 86.85 86.61 73.24 73.88 97.20 96.47
[13] 85.61 64.47 67.98 78.20 86.76 81.73 74.35 83.55
R> mean(y04)
[1] 83.781
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 1.827336
R> qt(c(0.9,0.95,0.975,0.99),19)
[1] 1.327728 1.729133 2.093024 2.539483

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{04}=80\) vs \(\mathbf{H}_1:\) \(\mu^{04}>80\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{04},80} }\left({\mathbf{ { Y^{04} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{04} }\left({\mathbf{ { Y^{04} } }}\right)-80}{ \widehat{ \sigma_{\widehat{ \mu^{04}}} }\left({\mathbf{ { Y^{04} } }}\right) }} \leadsto \mathcal{S}t(20-1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{\mu^{04},80} }\left({\mathbf{ { y^{04} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{\mu^{04},80} }\left({\mathbf{ { y^{04} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(y04)-80)/seMean(y04)}\simeq 1.827336\\& > \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qt(1-.05,19)}\simeq1.729133 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le chiffre d'affaires annuel moyen des PME en 2004 est supérieur à 80 unités.

(2) Peut-on penser que le chiffre d'affaires annuel moyen a augmenté entre 2004 à 2005 de 10 unités ?
R> y05
 [1]  98.83  96.56  86.08  84.08  93.68 106.74  93.42 104.04  99.24  87.47
[11] 117.65 115.26 109.33  92.71 105.48  93.09 106.59  82.92  96.31  87.99
R> mean(y05)
[1] 97.8735
R> mean(y04-y05)
[1] -14.0925
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> pt(deltaEst.H0,19)
[1] 0.06435257

Réponse
Préliminaire : puisque \(\mathtt{(mean(y04-y05)--10)}\simeq-4.0925\) est du même signe (i.e. positif que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • variable d'intérêt : \(Y^{D}=Y^{04}-Y^{05}\)
  • paramètre d'intérêt : \(\mu^{D}\)=moyenne de \(Y^{D}\)=\(\mu^{04}-\mu^{05}\)

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=-10\) vs \(\mathbf{H}_1:\) \(\mu^{D}<-10\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{D},-10} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-(-10)}{ \widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right) }} \leadsto \mathcal{S}t(20-1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(y04-y05)-(-10))/seMean(y04-y05),19)} \simeq 6.44\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le chiffre d'affaires annuel moyen des PME a augmenté entre 2004 et 2005 de 10 unités.

(3) On décide de compléter les précédents jeux de données en interrogeant 20 PME supplémentaires et en recueillant leur chiffres d'affaires en 2004 et 2005. Les jeux de données sont toujours notés $\mathtt{y04}$ et $\mathtt{y05}$. Que peut-on dire de l'assertion d'intérêt de la question précédente ?
R> y04
 [1]  84.03  95.47  88.89  93.09  87.24  90.00  86.85  86.61  73.24  73.88
[11]  97.20  96.47  85.61  64.47  67.98  78.20  86.76  81.73  74.35  83.55
[21]  85.15  76.67  87.75  84.52 104.08  72.72 101.80  87.52  86.61  89.96
[31]  76.96  95.11  70.88  89.79  87.29  83.36  73.73  79.94  91.97 100.07
R> y05
 [1]  98.83  96.56  86.08  84.08  93.68 106.74  93.42 104.04  99.24  87.47
[11] 117.65 115.26 109.33  92.71 105.48  93.09 106.59  82.92  96.31  87.99
[21]  99.77 111.22 106.49 100.80 109.97  96.91  83.39 101.57 100.10 110.07
[31]  94.03 114.85 105.30 106.50  88.68 100.94  98.40 101.98 112.11  79.68
R> mean(y04)
[1] 85.0375
R> mean(y05)
[1] 99.50575
R> mean(y04-y05)
[1] -14.46825
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> pnorm(deltaEst.H0)
[1] 0.01285186

Réponse
Préliminaire : puisque \(\mathtt{(mean(y04-y05)--10)}\simeq-4.46825\) est du même signe (i.e. positif que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • variable d'intérêt : \(Y^{D}=Y^{04}-Y^{05}\)
  • paramètre d'intérêt : \(\mu^{D}\)=moyenne de \(Y^{D}\)=\(\mu^{04}-\mu^{05}\)

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=-10\) vs \(\mathbf{H}_1:\) \(\mu^{D}<-10\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{D},-10} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-(-10)}{ \widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(y04-y05)-(-10))/seMean(y04-y05))} \simeq 1.29\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le chiffre d'affaires annuel moyen des PME a augmenté entre 2004 et 2005 de 10 unités.

Partie II Dans cette partie, on va comparer les chiffres d'affaires des PME en 2005. Pour simplifier les notations, on propose de noter par $\mu^{P1}$ et $\sigma^2_{P1}$ (respectivement par $\mu^{P2}$ et $\sigma^2_{P2}$) la moyenne et la variance des chiffres d'affaires de l'ensemble des PME du pays $P_1$ (respectivement du pays $P_2$) en 2005.
(1) Peut-on penser que le chiffre d'affaires annuel moyen des PME du pays P1 est de plus de 20 unités supérieur à celui du pays P2 ?
R> yP2
 [1] 63.89 72.36 88.48 74.28 71.63 82.45 67.42 76.01 74.33 77.81 71.67 72.38
[13] 80.33 77.67 67.29 73.98 65.97 76.65 74.02 88.96 71.19 81.90 75.03 80.35
[25] 86.16 73.15 73.94 63.95 79.94 59.04 67.50 77.15 74.01 77.45 78.13 74.46
[37] 96.59 80.00 78.19 72.97
R> mean(yP2)
[1] 75.467
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> pnorm(deltaEst.H0)
[1] 0.9825057

Réponse

Préliminaire : puisque \(\mathtt{(mean(yP1)-mean(yP2)-20)}\simeq4.03875\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{P1}-\mu^{P2}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right)=\widehat{ \mu^{P1} }\left({\mathbf{ { Y^{P1} } }}\right)-\widehat{ \mu^{P2} }\left({\mathbf{ { Y^{P2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=20\) vs \(\mathbf{H}_1:\) \(d_\mu>20\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_\mu,20} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right)-20}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yP1)-mean(yP2)-20)/seDMean(yP1,yP2))} \simeq 1.75\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le chiffre d'affaires annuel moyen des PME du pays P1 est de plus de 20 unités supérieur à celui du pays P2.

(2) Peut-on penser que les hétérogénéités (mesurées par les variances) des chiffres d'affaires annuels des PME des deux pays diffèrent ?
R> var(yP1)
[1] 94.55306
R> var(yP2)
[1] 52.20786
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> pnorm(deltaEst.H0)
[1] 0.9748944

Réponse

Préliminaire : puisque \(\mathtt{(var(yP1)-var(yP2)-0)}\simeq42.3452\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_{\sigma^2}=\sigma^2_{P1}-\sigma^2_{P2}\)
  • sa future estimation : \(\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right)=\widehat{ \sigma^2_{P1} }\left({\mathbf{ { Y^{P1} } }}\right)-\widehat{ \sigma^2_{P2} }\left({\mathbf{ { Y^{P2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_{\sigma^2}=0\) vs \(\mathbf{H}_1:\) \(d_{\sigma^2}\neq0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right) = {\displaystyle \frac{\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_{\sigma^2}}} }\left({\mathbf{ { Y^{P1},Y^{P2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (biltatérale) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{2*(1-pnorm((var(yP1)-var(yP2)-0)/seDVar(yP1,yP2)))} \simeq 5.02\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les hétérogénéités des chiffres d'affaires annuels des PME des deux pays diffèrent.

(3) En analysant plus précisément les résultats de la question précédente, ne peut-on pas affirmer une certaine assertion d'intérêt ? (Rédaction abrégée)
Réponse

Préliminaire : puisque \(\mathtt{(var(yP1)-var(yP2)-0)}\simeq42.3452\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a : $d_{\sigma^2}=\sigma^2_{P1}-\sigma^2_{P2}$
Affirmation d'intérêt : \(\mathbf{H}_1:\) \(d_{\sigma^2}>0\) avec \(d_{\sigma^2}=\sigma^2_{P1}-\sigma^2_{P2}\)
Application numérique : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((var(yP1)-var(yP2)-0)/seDVar(yP1,yP2))} \simeq 2.51\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que les hétérogénéités des chiffres d'affaires annuels des PME des deux pays diffèrent.