Exercice 28 : Premier tour Election

Situons le contexte de cette étude pour laquelle toute ressemblance avec une situation ou des personnages ayant réellement existé serait purement fortuite : nous sommes un peu \textbf{avant le premier tour} des élections présidentielles de 2001. Parmi l'ensemble des candidats, nous nous intéresserons aux trois principaux : Racchi, Pinjos et Penle. On notera dans l'ordre $p^{C1}$, $p^{C2}$ et $p^{C3}$ les proportions d'électeurs (parmi tout l'électorat) ayant voté pour ces trois candidats. Un journaliste interroge ces trois candidats séparément et leur demande le score que chacun pense faire au premier tour. Racchi pense réaliser un score autour de $20\%$, Pinjos autour de $19\%$ et Penle $18\%$. Le journaliste n'ayant pas confiance sur la façon dont sont construits les sondages se crée un échantillon de $n=1000$ (choisis au hasard dans l'électorat français) et obtient les trois estimations $\widehat{ p^{C1} }\left({\mathbf{ { y } }}\right)=20\%$, $\widehat{ p^{C2} }\left({\mathbf{ { y } }}\right)=15.4\%$ et $\widehat{ p^{C3} }\left({\mathbf{ { y } }}\right)=18.3\%$ stockés en $\mathtt{R}$ respectivement dans les variables $\mathtt{pC1Est}$, $\mathtt{pC2Est}$ et $\mathtt{pC3Est}$.
(1) Au vu des a priori des trois candidats et de ce que semblent penser les médias et la population, le journaliste veut alors savoir si la proportion d'électeurs votant pour
  1. Racchi est au moins de $17.5\%$.
  2. Pinjos est au moins de $17.5 \%$.
  3. Penle est inférieure à $17.5 \%$.
Formez les trois tests d'hypothèses répondant à ces questions pour un risque d'erreur de première espèce qui n'excède pas 5\%. Rédigez sous forme standard le premier test.
R> 200/1000
[1] 0.2
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 2.080626
R> pnorm(deltaEst.H0)
[1] 0.9812659

R> 154/1000
[1] 0.154
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -1.747726
R> pnorm(deltaEst.H0)
[1] 0.04025576

R> 183/1000
[1] 0.183
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 0.6658003
R> pnorm(deltaEst.H0)
[1] 0.7472306

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(p^{C1}=17.5\%\) vs \(\mathbf{H}_1:\) \(p^{C1}>17.5\%\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{p^{C1},17.5\%} }\left({\mathbf{ { Y^{C1} } }}\right) = {\displaystyle \frac{\widehat{ p^{C1} }\left({\mathbf{ { Y^{C1} } }}\right)-17.5\%}{ \sqrt{\frac{17.5\%\times (1-17.5\%)} {1000}} }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((200/1000-0.175)/sqrt(0.175*(1-0.175)/1000))} \simeq 1.87\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que la proportion d'électeurs votant pour Racchi est au moins de $17.5\%$.
Hypothèses de test : \(\mathbf{H}_0:\) \(p^{C2}=17.5\%\) vs \(\mathbf{H}_1:\) \(p^{C2}>17.5\%\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{p^{C2},17.5\%} }\left({\mathbf{ { Y^{C2} } }}\right) = {\displaystyle \frac{\widehat{ p^{C2} }\left({\mathbf{ { Y^{C2} } }}\right)-17.5\%}{ \sqrt{\frac{17.5\%\times (1-17.5\%)} {1000}} }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((154/1000-0.175)/sqrt(0.175*(1-0.175)/1000))} \simeq 95.97\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la proportion d'électeurs votant pour Pinjos est au moins de $17.5\%$.
Hypothèses de test : \(\mathbf{H}_0:\) \(p^{C3}=17.5\%\) vs \(\mathbf{H}_1:\) \(p^{C3}<17.5\%\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{p^{C3},17.5\%} }\left({\mathbf{ { Y^{C3} } }}\right) = {\displaystyle \frac{\widehat{ p^{C3} }\left({\mathbf{ { Y^{C3} } }}\right)-17.5\%}{ \sqrt{\frac{17.5\%\times (1-17.5\%)} {1000}} }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((183/1000-0.175)/sqrt(0.175*(1-0.175)/1000))} \simeq 74.72\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la proportion d'électeurs votant pour Penle est inférieure à $17.5\%$.

(2) Pour les candidats Pinjos et Penle (qui ne sont pas sur un bateau) peut-on montrer le contraire des affirmations respectives (justifiez en rédigeant succinctement) ?
(3) La situation semblant plus préoccupante pour Pinjos et Penle, le journaliste tente de les départager en proposant de vérifier à partir du même jeu de données les affirmations suivantes mais au seuil de $\alpha=20\%$ (réponse sous la forme de rédaction abrégée) :
  1. le score de Pinjos est inférieur à $16.5\%$
  2. le score de Penle est supérieur à $16.5\%$
R> 154/1000
[1] 0.154
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -0.9371465

R> 183/1000
[1] 0.183
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 1.533512

Réponse

Hypothèses de test : \(\mathbf{H}_0:\) \(p^{C2}=16.5\%\) vs \(\mathbf{H}_1:\) \(p^{C2}<16.5\%\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{p^{C2},16.5\%} }\left({\mathbf{ { Y^{C2} } }}\right) = {\displaystyle \frac{\widehat{ p^{C2} }\left({\mathbf{ { Y^{C2} } }}\right)-16.5\%}{ \sqrt{\frac{16.5\%\times (1-16.5\%)} {1000}} }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{p^{C2},16.5\%} }\left({\mathbf{ { y^{C2} } }}\right) < \delta^-_{lim,20\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{p^{C2},16.5\%} }\left({\mathbf{ { y^{C2} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(154/1000-.165)/sqrt(.165*(1-.165)/1000)}\simeq -0.9371465\\& < \delta^-_{lim,20\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.2)}\simeq-0.8416212 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(20\%\)) que le score de Pinjos est inférieur à $16.5\%$.
Hypothèses de test : \(\mathbf{H}_0:\) \(p^{C3}=16.5\%\) vs \(\mathbf{H}_1:\) \(p^{C3}>16.5\%\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{p^{C3},16.5\%} }\left({\mathbf{ { Y^{C3} } }}\right) = {\displaystyle \frac{\widehat{ p^{C3} }\left({\mathbf{ { Y^{C3} } }}\right)-16.5\%}{ \sqrt{\frac{16.5\%\times (1-16.5\%)} {1000}} }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si \(\widehat{ \delta_{p^{C3},16.5\%} }\left({\mathbf{ { y^{C3} } }}\right) > \delta^+_{lim,20\%}\)
Conclusion : puisqu'au vu des données, $$\begin{aligned} \widehat{ \delta_{p^{C3},16.5\%} }\left({\mathbf{ { y^{C3} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(183/1000-.165)/sqrt(.165*(1-.165)/1000)}\simeq 1.533512\\& > \delta^+_{lim,20\%} \overset{\mathtt{R}}{=} \mathtt{qnorm(1-.2)}\simeq0.8416212 \end{aligned}$$ on peut (plutôt) penser (avec un risque de \(20\%\)) que le score de Penle est supérieur à $16.5\%$.