Exercice 25 : Pilote

Un pilote de course en Formule 1 hésite entre deux équipes. Il fait alors des essais dans chacune des deux équipes pour savoir laquelle est la plus performante.

(1) Pour l'équipe 1, le pilote commence par faire 20 premiers tours. Les données des temps effectués par tour sont exprimées en secondes et stockées dans le vecteur $\mathtt{y1}$. Au vu des données peut-on montrer que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R> mean(y1)
[1] 50.21973
R> sd(y1)
[1] 2.276776
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> pt(deltaEst.H0,19)
[1] 0.07092418

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E1}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E1}<51\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { Y^{E1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-51}{ \widehat{ \sigma_{\widehat{ \mu^{E1}}} }\left({\mathbf{ { Y^{E1} } }}\right) }} \leadsto \mathcal{S}t(20-1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(y1)-51)/seMean(y1),19)} \simeq 7.09\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes.

(2) Le pilote effectue 20 tours supplémentaires (les données sont toujours stockées dans le vecteur $\mathtt{y1}$ ). Même question que précédemment avec ce nouveau jeu de données complétées.
R> y1
 [1] 47.89674 50.04087 54.53240 54.36718 48.80645 51.44077 49.72669 44.81843
 [9] 50.37910 48.32037 53.55150 50.38611 50.37899 49.44585 50.47262 50.66881
...
[33] 48.83423 51.93978 49.19886 52.67034 49.21360 48.35678 49.43116 48.95199
R> mean(y1)
[1] 50.39458
R> sd(y1)
[1] 1.965069
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -1.948534

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E1}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E1}<51\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { Y^{E1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-51}{ \widehat{ \sigma_{\widehat{ \mu^{E1}}} }\left({\mathbf{ { Y^{E1} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { y^{E1} } }}\right) < \delta^-_{lim,5\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { y^{E1} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(y1)-51)/seMean(y1)}\simeq -1.948534\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes.

(3) Avec la voiture de l'équipe 2, le pilote effectue 50 tours. Les données des temps effectués par tour sont exprimées en secondes et stockées dans le vecteur $\mathtt{y2}$. Au vu des données peut-on montrer que le temps moyen de la voiture de l'équipe 2 est inférieur à 51 secondes avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R> y2
 [1] 51.89371 51.35814 52.16305 51.83228 52.97653 51.43513 50.89370 51.50756
 [9] 51.54468 52.22917 51.21122 52.96252 51.61797 52.40225 50.21097 51.73468
...
[49] 53.55974 52.44708
R> mean(y2)
[1] 52.02422
R> sd(y2)
[1] 0.8670206
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 8.353126
R> pnorm(deltaEst.H0)
[1] 1

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E2}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E2}<51\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{E2},51} }\left({\mathbf{ { Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E2} }\left({\mathbf{ { Y^{E2} } }}\right)-51}{ \widehat{ \sigma_{\widehat{ \mu^{E2}}} }\left({\mathbf{ { Y^{E2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(y2)-51)/seMean(y2))} \simeq 100.0\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 2 est inférieur à 51 secondes.

(4) Quel est l'ordre de grandeur de la p$-$valeur du précédent test ? Donc à la vue des sorties R précédentes, les données permettent-elles de laisser penser qu'une certaine assertion d'intérêt (à préciser) est vraie ?
Réponse
Affirmation d'intérêt : \(\mathbf{H}_1:\) \(\mu^{E2}>51\)
Application numérique : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(y2)-51)/seMean(y2))} \simeq 0.0\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 2 est supérieur à 51 secondes.

(5) Au vu des données peut-on montrer que le temps moyen de l'équipe 1 est inférieur à celui de l'équipe 2 avec un risque d'erreur de première espèce fixé à \(5\%\) ?
Cela est-il surprenant au regard le la conclusion de la question précédente ?
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -4.878811

Réponse

Préliminaire : puisque \(\mathtt{(mean(y1)-mean(y2)-0)}\simeq-1.629639\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) , on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{E1}-\mu^{E2}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)=\widehat{ \mu^{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-\widehat{ \mu^{E2} }\left({\mathbf{ { Y^{E2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) < \delta^-_{lim,5\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(y1)-mean(y2)-0)/seDMean(y1,y2)}\simeq -4.878811\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de l'équipe 1 est inférieur à celui de l'équipe 2.
Cela n'est pas surprenant au regard des questions précédentes puisque nous avions conclu que l'on pouvait plutôt penser que le temps de l'équipe 1 (resp. 2) était inférieur (resp. supérieur) à 51 secondes.

(6) Au vu des données peut-on montrer que la variance des temps de l'équipe 2 est inférieure à celle de l'équipe 1 avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 3.161661

Réponse

Préliminaire : puisque \(\mathtt{(var(y1)-var(y2)-0)}\simeq3.109772\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) , on a :
  • paramètre d'intérêt : \(d_{\sigma^2}=\sigma^2_{E1}-\sigma^2_{E2}\)
  • sa future estimation : \(\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)=\widehat{ \sigma^2_{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-\widehat{ \sigma^2_{E2} }\left({\mathbf{ { Y^{E2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_{\sigma^2}=0\) vs \(\mathbf{H}_1:\) \(d_{\sigma^2}>0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_{\sigma^2}}} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(y1)-var(y2)-0)/seDVar(y1,y2)}\simeq 3.161661\\& > \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qnorm(1-.05)}\simeq1.644854 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(5\%\)) que la variance des temps de l'équipe 2 est inférieure à celle de l'équipe 1.

(7) Exprimez littéralement les deux conclusions des deux tests précédents. Si vous étiez le pilote, quelle équipe choisiriez-vous ?
Réponse
Au regard des deux questions précédentes, on peut plutôt penser au vu des données que la voiture de l'équipe 1 est plus performante (en moyenne) que celle de l'équipe 2. En revanche cette dernière est plus régulière que la voiture de l'équipe 1. Le choix entre les deux équipes est donc un choix à faire entre performance moyenne et régularité.