Partie I: compétence d'un technicien
Un service de contrôle d'une entreprise de métallurgie s'intéresse à savoir si un technicien (Alfred) est suffisamment précis au niveau des mesures qu'il effectue sur des minerais de fer. Le technicien sera d'autant plus précis que l'écart entre deux mesures d'un même minerai (sans qu'il le sache) est faible. La précision serait théoriquement mesurée par la variance d'une infinité d'écarts entre deux mesures. On notera $\sigma^2_A$ (comme Alfred) cette variance. Le service de contrôle décide qu'un technicien est compétent si ce paramètre d'intérêt est inférieur à $0.1$.
(1) On commence par soumettre Alfred à $n^A=20$ échantillons de minerai de fer. Le jeu de données est stocké dans le vecteur $\mathtt{yA}$ dans $\mathtt{R}$. Peut-on montrer au seuil de $5\%$ qu'Alfred est compétent ? (précisez l'hypothèse mathématique faite sur la nature des données)
R>yA
[1] 0.144679560.308391020.165071840.08100885-0.15048984-0.02163446
[7] -0.255587940.098715360.59275135-0.22962500-0.21676732-0.09707208
[13] 0.17050529-0.057323660.653375140.178024690.29278735-0.16514972
[19] -0.300802210.32129752R> var(yA)
[1] 0.07325571R> sd(yA)
[1] 0.2706579R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 13.91858R> qchisq(c(0.01,0.025,0.05,0.1,0.9,0.95,0.975,0.99),19)
[1] 7.6327308.90651610.11701311.65091027.20357130.14352732.852327
[8] 36.190869R> pchisq(deltaEst.H0,19)
[1] 0.2115835
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{A}=0.1\) vs \(\mathbf{H}_1:\) \(\sigma^2_{A}<0.1\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\sigma^2_{A},0.1} }\left({\mathbf{ { Y^{A} } }}\right) = {\displaystyle (20-1)\frac{\widehat{ \sigma^2_{A} }\left({\mathbf{ { Y^{A} } }}\right)}{0.1}} \leadsto \chi^2(20-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pchisq((20-1)*var(yA)/0.1,19)} \simeq 21.16\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que Alfred est compétent.
(2) On complète le jeu de données précédent en soumettant le technicien à 30 nouveaux échantillons. Le jeu de données est toujours stocké dans le vecteur $\mathtt{yA}$. Peut-on maintenant montrer au seuil de $5\%$ que le technicien est compétent ?
R>yA
[1] 0.1446795640.3083910200.1650718440.081008851-0.150489836
[6] -0.021634458-0.2555879430.0987153560.592751352-0.229624997...
[41] 0.262084534-0.2157533000.173626815-0.200160681-0.255138748
[46] 0.125329351-0.3260495450.2075177500.070438920-0.303221493R> var(yA)
[1] 0.06362229R> sd(yA)
[1] 0.2522346R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -2.762438R> pnorm(deltaEst.H0)
[1] 0.002868572
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{A}=0.1\) vs \(\mathbf{H}_1:\) \(\sigma^2_{A}<0.1\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\sigma^2_{A},0.1} }\left({\mathbf{ { Y^{A} } }}\right) = {\displaystyle \frac{\widehat{ \sigma^2_{A} }\left({\mathbf{ { Y^{A} } }}\right)-0.1}{
\widehat{ \sigma_{\widehat{ \sigma^2_{A}}} }\left({\mathbf{ { Y^{A} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yA)-0.1)/seVar(yA))} \simeq 0.29\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que Alfred est compétent.
Partie II : comparaison de deux techniciens
(1) On s'intéresse à un second technicien (Bernard) dont on cherche à montrer qu'il est compétent. Bernard a été soumis à $n^B=20$ échantillons de minerai; les données relatives à ses écarts de mesure sont stockées en $\mathtt{R}$ dans le vecteur $\mathtt{yB}$. Peut-on montrer qu'il est compétent au seuil de $5\%$ ?
R>yB
[1] 0.0248301620.0937913290.145188006-0.049699994-0.153214255
[6] 0.120875740-0.112933043-0.345291716-0.0071062780.122016115
[11] -0.191976511-0.3684244360.188209329-0.119061948-0.202052804
[16] 0.249518927-0.3013963930.1123033130.2164801110.239335084R> var(yB)
[1] 0.03921612R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 7.451062
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{B}=0.1\) vs \(\mathbf{H}_1:\) \(\sigma^2_{B}<0.1\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\sigma^2_{B},0.1} }\left({\mathbf{ { Y^{B} } }}\right) = {\displaystyle (20-1)\frac{\widehat{ \sigma^2_{B} }\left({\mathbf{ { Y^{B} } }}\right)}{0.1}} \leadsto \chi^2(20-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{\sigma^2_{B},0.1} }\left({\mathbf{ { y^{B} } }}\right) < \delta^-_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\sigma^2_{B},0.1} }\left({\mathbf{ { y^{B} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(20-1)*var(yB)/0.1}\simeq 7.451062\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qchisq(.05,19)}\simeq10.11701
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que Bernard est compétent.
(2) Peut-on montrer (toujours au seuil de $5\%$) qu'Alfred est moins précis que Bernard ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 1.622351R> qf(c(0.01,0.025,0.05,0.1,0.9,0.95,0.975,0.99),49,19)
[1] 0.43503850.49548260.55466750.63258321.71290412.00086462.2983466
[8] 2.7135032
Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}>1\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { Y^{A},Y^{B} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{A},Y^{B} } }}\right)}{1}} \leadsto \mathcal{F}(50-1,20-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { y^{A},y^{B} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { y^{A},y^{B} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(yA)/var(yB))/1}\simeq 1.622351\\&\ngtr \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qf(1-.05,49,19)}\simeq2.000865
\end{aligned}$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que Alfred est moins précis que Bernard.
(3) Alfred et Bernard critiquent le précédent résultat et proposent de refaire le même test à taille d'échantillon identique (i.e. $n=20$). Que peut-on dire à la vue de l'instruction ci-dessous ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pf(deltaEst.H0,19,19)
[1] 0.9088193
Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}>1\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { Y^{A},Y^{B} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{A},Y^{B} } }}\right)}{1}} \leadsto \mathcal{F}(20-1,20-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pf((var(yA)/var(yB))/1,19,19)} \simeq 9.12\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que Alfred est moins précis que Bernard.
(4) On complète alors le jeu de données du second technicien, en soumettant Bernard à 40 nouveaux échantillons (les données sont toujours stockées en $\mathtt{R}$ dans le vecteur $\mathtt{yB}$). Peut-on cette fois-ci montrer qu'Alfred est moins précis que Bernard ?
R>yB
[1] 0.0248301620.0937913290.145188006-0.049699994-0.153214255
[6] 0.120875740-0.112933043-0.345291716-0.0071062780.122016115...
[51] 0.296275243-0.1621413740.0607928740.0909769150.119856496
[56] 0.310565975-0.1467854940.061968269-0.182127778-0.187890277R> var(yB)
[1] 0.03442929R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 2.037317
Réponse
Préliminaire : puisque \(\mathtt{(var(yA)-var(yB)-0)}\simeq0.029193\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) , on a :