Un diététicien affirme que son régime alimentaire permet une perte de poids rapide. On observe la répartition d'un échantillon de $10$ femmes ayant suivi ce régime pendant $2$ semaines.
$$
\begin{array}{|c|c:c:c:c:c:c:c:c:c:c|}\hline
\text{Poids avant AV} &
64 & 67 & 68 & 76 & 72 & 69 & 62 & 65 & 64 & 73 \\\hline
\text{Poids après AP} &
65 & 61 & 64 & 69 & 65 & 66 & 60 & 59 & 61 & 68 \\\hline
\text{Perte de poids } Y^D &
-1 & 6 & 4 & 7 & 7 & 3 & 2 & 6 & 3 & 5 \\\hline
\end{array}
$$
Voici les données préliminairement saisies et placées dans deux vecteurs ${\mathbf{ AV }}$ et ${\mathbf{ AP }}$. Le vecteur ${\mathbf{ y }}$ est obtenu en faisant une différence élément par élément :
(1) En supposant que $Y\leadsto N\left( \mu ,\sigma \right) $, éprouver
l'affirmation du diététicien au seuil de signification $5\%$.
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 5.25R> pt(deltaEst.H0,9)
[1] 0.9997362
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=0\) vs \(\mathbf{H}_1:\) \(\mu^{D}>0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{D},0} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right)
}} \leadsto \mathcal{S}t(10-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pt((mean(AV-AP)-0)/seMean(AV-AP),9)} \simeq 0.03\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que le régime alimentaire du diététicien permet une perte de poids.
(2) Fort de ce constat, le diététicien aimerait un titre plus accrocheur et souhaiterait montrer avec le même jeu de données ${\mathbf{ y }}$ que son régime permet une perte de deux kilos par semaine. éprouvez cette nouvelle affirmation au seuil de $5\%$.
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 0.25R> pt(deltaEst.H0,9)
[1] 0.5958998
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=4\) vs \(\mathbf{H}_1:\) \(\mu^{D}>4\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{D},4} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-4}{
\widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right)
}} \leadsto \mathcal{S}t(10-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pt((mean(AV-AP)-4)/seMean(AV-AP),9)} \simeq 40.41\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le régime alimentaire du diététicien permet une perte de poids.
(3) Pas désappointé pour autant par la précédente analyse, le diététicien décide de soumettre 40 femmes supplémentaires à son régime, et complète ainsi son précédent vecteur ${\mathbf{ y }}$ correspondant aux pertes de poids. Il obtient finalement le jeu de données suivant :
a) que pensez-vous alors de l'hypothèse faite précédemment affirmant : $Y\leadsto N\left( \mu ,\sigma \right) $ ?
Réponse
Cette hypothèse n'est plus nécessaire car on dispose maintenant de suffisamment de données pour que les résultats dans le cadre asymptotique soient valides.
b) pensez-vous avec ce nouveau jeu de données que la nouvelle affirmation du diététicien est vraie (à un risque d'erreur de première espèce fixé à $5\%$) ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 2.044722R> pnorm(deltaEst.H0)
[1] 0.9795589
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=4\) vs \(\mathbf{H}_1:\) \(\mu^{D}>4\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{D},4} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-4}{
\widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yD)-4)/seMean(yD))} \simeq 2.04\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que le régime alimentaire du diététicien permet une perte de poids de 2 kilos par semaine.
c) Qu'expriment les erreurs standard ($\mathtt{seMean(y)}$) pour $n=10$ et $n=50$ ? Expliquez alors pourquoi on a pu accepter l'assertion d'intérêt du diététicien pour $n=50$.
Réponse
L'erreur standard $\widehat{ \sigma_{\widehat{\mu^D}} }\left({\mathbf{ { y^D } }}\right)$ calculé en $\mathtt{R}$ par l'instruction $\mathtt{seMean(y)}$ mesure la qualité estimée (à partir du jeu de données de taille $n=10$ ou $50$) du remplaçant du paramètre d'intérêt $\mu^D$. On pourra noter que pour le jeu de données initial de taille $n=10$ on a $\widehat{ \mu^D }\left({\mathbf{ { y^D } }}\right) =4.2$ et $\widehat{ \sigma_{\widehat{\mu^D}} }\left({\mathbf{ { y^D } }}\right)=0.8$ et que pour le jeu de données complété de taille $n=50$, $\widehat{ \mu^D }\left({\mathbf{ { y^D } }}\right) =4.5$ et $\widehat{ \sigma_{\widehat{\mu^D}} }\left({\mathbf{ { y^D } }}\right)\simeq 0.24$. Ainsi, on peut remarquer qu'avec les deux jeux de données les estimations du paramètre d'intérêt sont sensiblement équivalentes, en revanche la seconde estimation semble à peu près trois fois plus précise que la première. C'est la raison pour laquelle l'assertion d'intérêt a pu être acceptée (avec un risque de $5\%$) au vu du jeu de données complété.