Exercice 6 : Lancer d'un dé
(1) Proposer le Schéma de Formalisation pour la variable aléatoire correspondant à un futur lancer de dé.
(2) Quelle expérimentation mettriez-vous en oeuvre pour vérifier qu'un dé est rigoureusement non pipé (i.e. parfaitement équilibré) ?
- On doit lancer le dé un nombre $m$ de fois avec
- Pensez-vous qu'il existe un tel type de dé ?
(3) Application: Un expérimentateur propose l'expérience suivante avec un dé (en théorie vendu) équilibré et un autre dont il a volontairement légèrement déséquilibré une ou plusieurs de ses faces. Les résultats des deux dés sont fournis dans un ordre arbitraire dans les tableaux ci-dessous. Sauriez-vous reconnaître les deux dés et, en particulier, déterminer les probabilités d'apparition des faces (sachant que, pour chaque dé, il n'y a en théorie pas plus de 2 choix possibles pour celles-ci) ? A partir de combien de lancers ($m$) êtes-vous en mesure de faire votre choix ?
| $m$ | $\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}}\right)}_{ m}$ |
| 100 | $21\%$ | $14\%$ | $15\%$ | $22\%$ | $16\%$ | $12\%$ | $3.34$ |
| 1000 | $15.5\%$ | $16.8\%$ | $17.3\%$ | $17.1\%$ | $15.9\%$ | $17.4\%$ | $3.533$ |
| 10000 | $16.46\%$ | $16.43\%$ | $16.45\%$ | $17.23\%$ | $16.46\%$ | $16.97\%$ | $3.5171$ |
| 100000 | $16.4\%$ | $16.52\%$ | $16.28\%$ | $17.05\%$ | $16.83\%$ | $16.92\%$ | $3.5214$ |
| 1000000 | $16.47\%$ | $16.52\%$ | $16.49\%$ | $16.85\%$ | $16.77\%$ | $16.89\%$ | $3.5161$ |
| $m$ | $\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}}\right)}_{ m}$ |
| 100 | $13\%$ | $13\%$ | $16\%$ | $21\%$ | $23\%$ | $14\%$ | $3.7$ |
| 1000 | $16.1\%$ | $18.1\%$ | $15.6\%$ | $17.3\%$ | $18.6\%$ | $14.3\%$ | $3.471$ |
| 10000 | $16.92\%$ | $17\%$ | $16.47\%$ | $16.91\%$ | $17.13\%$ | $15.57\%$ | $3.4704$ |
| 100000 | $16.73\%$ | $16.64\%$ | $16.53\%$ | $16.59\%$ | $16.88\%$ | $16.63\%$ | $3.5015$ |
| 1000000 | $16.68\%$ | $16.66\%$ | $16.68\%$ | $16.67\%$ | $16.71\%$ | $16.61\%$ | $3.499$ |
(4) Pour comprendre comment ont été déterminés les résultats des tableaux précédents, proposer les instructions R permettant d'obtenir (avec yy désignant les 100 premiers lancers du dé équilibré):
- Proportion de face 1 :
Résultat - Proportion de face 2 :
Résultat - Proportion des faces 2 ou 3 :
Résultat - Moyenne des faces :
Résultat - Proportion des faces entre 2 et 5 inclus :
Résultat - Proportion des faces entre 2 et 5 exclus :
Résultat
(5) Ayant à présent identifié (du moins nous l'espérons!) le dé équilibré, sauriez vous compléter le tableau suivant correspondant à l'éventuelle dernière ligne du tableau précédent lui correspondant :
| $m$ | $\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}}\right)}_{ m}$ | $\infty$ |
1/6
|
1/6
|
1/6
|
1/6
|
1/6
|
1/6
|
3.5
|
(6) Considérons le dé (théoriquement) équilibré. Observons les expressions dans le tableau ci-dessous obtenues par le mathématicien (A.M.P.). Sauriez-vous les calculer (N.B. : c'est une question personnelle et il est donc possible de répondre NON) ? On rappelle (pour votre culture) les formules d'obtentions de la moyenne (ou espérance) de $Y$ : $$ \mathbb{E}\left( Y \right)=\sum_{k=1}^6 k\times\mathbb{P}\left( Y=k \right) $$ ainsi que celle de la variance $$ \mathbb{V}ar\left( Y \right)=\sum_{k=1}^6 (k-\mathbb{E}\left( Y \right))^2\times\mathbb{P}\left( Y=k \right)=\mathbb{E}\left( Y^2 \right)-\mathbb{E}\left( Y \right)^2=\sum_{k=1}^6 k^2\times\mathbb{P}\left( Y=k \right)-\mathbb{E}\left( Y \right)^2 $$
| $\mathbb{P}\left( Y\in [2,4[ \right)$ | $\mathbb{E}\left( Y \right)$ | $\mathbb{V}ar\left( Y \right)$ | $\sigma({Y})$ | $q_{ 5\%}\left( { Y} \right)$ | $q_{ 50\%}\left( { Y} \right)$ | $q_{ 95\%}\left( { Y} \right)$ |
| $33.33\%$ | $3.5$ | $2.9167$ | $1.7078$ | $1$ | $3.5$ | $6$ |
(7) Comprenons comment ces quantités peuvent être obtenues (ou intreprétées) par l'expérimentateur en les confrontant à ses résultats sur $m=1000000$ lancers (A.E.P.). Proposez aussi les instructions R ayant permis de les construire sachant que ces résultats ont été stockés dans le vecteur yy en R.
| $\overline{\left({ y_{[\cdot]}\in [2,4[}\right)}_{ m}$ | $\overline{\left({ y_{[\cdot]}}\right)}_{ m}$ | $ {\overleftrightarrow{\left({ y_{[\cdot]}}\right)}_{ m}}^2$ | ${\overleftrightarrow{\left({ y_{[\cdot]}}\right)}_{ m}}$ | $q_{ 5\%}\left( \left( y_{[\cdot]} \right)_{ m} \right)$ | $q_{ 50\%}\left( \left( y_{[\cdot]} \right)_{ m} \right)$ | $q_{ 95\%}\left( \left( y_{[\cdot]} \right)_{ m} \right)$ |
| $33.34\%$ | $3.499$ | $2.9145$ | $1.7072$ | $1$ | $3$ | $6$ |
(8) Quelle approche (A.M.P. ou A.E.P.) vous semble être la plus facile à appréhender ? Comprenez-vous les intérêts propres à chacune d'entre elles ?
Exercice 7 : Moyenne de deux dés
(1) Soient $Y_V$ et $Y_R$ deux variables aléatoires correspondant aux faces de 2 dés (Vert et Rouge) à lancer. Définissons $\overline Y=(Y_V+Y_R)/2$ correspondant à la moyenne, ici la demi-somme de deux faces. Proposez le Schéma de Formalisation pour $\overline Y$.
(2) Comparez $\mathbb{P}\left( \overline Y=1 \right)$, $\mathbb{P}\left( \overline Y=6 \right)$ et $\mathbb{P}\left( \overline Y=3.5 \right)$. Sauriez-vous les évaluer ?
(3) Que peut-on espérer en moyenne sur la valeur de $M$ ? (cette quantité rappelons-le est notée $\mathbb{E}\left( \overline Y \right)$).
(4) Un joueur se propose de lancer $m=5000$ fois deux dés. A chaque lancer, il note la moyenne et stocke l'ensemble des informations dans un vecteur noté ym en R. Voici quelques résultats d'instructions R :
R> ym [1] 4.0 4.0 4.0 4.5 2.5 2.0 2.0 2.0 1.5 3.0 3.5 1.0 1.5 5.0 3.0 1.0 3.0 4.5 [19] 1.0 4.5 6.0 3.5 5.0 6.0 1.5 2.5 4.5 3.0 3.0 3.5 3.5 3.0 3.5 4.0 4.5 4.0 ... [4969] 3.0 5.0 4.5 4.5 4.5 5.5 3.5 3.5 5.0 3.0 3.0 6.0 2.0 4.5 3.5 4.5 5.0 1.0 [4987] 4.0 4.5 3.5 3.5 3.5 2.0 4.0 3.5 6.0 4.0 5.0 5.5 3.0 4.5 R> mean(ym==1) [1] 0.0314 R> mean(ym==3.5) [1] 0.1698 R> mean(ym==6) [1] 0.0278 R> mean(ym) [1] 3.5031 R> var(ym) [1] 1.468134 R> sd(ym) [1] 1.211666Pourriez-vous proposer les notations mathématiques (norme CQLS) correspondant aux résultats obtenus dans la sortie R ci-dessus ? Cette approche expérimentale confirme-t-elle le résultat du mathématicien affirmant que pour toute modalité $s/2$ de $\overline Y$ avec $s=2,\cdots,12$ (les modalités de la somme $S=2× \overline Y$ des 2 dés), $$ \mathbb{P}\left( \overline Y=s/2 \right)= \mathbb{P}\left( 2× \overline Y=s \right) = \left\{ \begin{array}{ll} \frac{s-1}{36} & \text{ si } s\leq 7 \\ \frac{13-s}{36} & \text{ si } s \geq 7 \end{array} \right. $$ Voici les résultats de l'A.M.P. présentés dans le tableau suivant (que vous pouvez vérifier si vous avez l'âme d'un mathématicien) :
| $\mathbb{P}\left( \overline Y=1 \right)$ | $\mathbb{P}\left( \overline Y=3.5 \right)$ | $\mathbb{P}\left( \overline Y=6 \right)$ | $\mathbb{E}\left( \overline Y \right)$ | $\mathbb{V}ar\left( \overline Y \right)$ |
| $2.78\%$ | $16.67\%$ | $2.78\%$ | $3.5$ | $1.4583$ |
(5) Pourriez-vous aussi vérifier la validité des formules sur l'espérance et variance de la moyenne de variables aléatoires réelles en s'appuyant sur les résultats de l'A.M.P. fournis ci-après.
Exercice 8 : Réel au hasard sur l'intervalle unité
(1) Soit $Y_1$ une variable aléatoire suivant une loi uniforme sur $[0,1]$ (en langage math., $Y_1\leadsto \mathcal{U}([0,1])$), correspondant au choix ``au hasard'' d'un réel dans l'intervalle $[0,1]$. L'objectif est l'évaluation (exacte ou approximative) des probabilités suivantes $\mathbb{P}\left( Y_1=0.5 \right)$ et $\mathbb{P}\left( 0.25 < Y_1 < 0.5 \right)$, le chiffre moyen $\mathbb{E}\left( Y_1 \right)$ (espéré), l'écart-type $\sigma(Y_1)$ ainsi que la variance $\mathbb{V}ar\left( Y_1 \right)$ ? Parmi ces quantités, lequelles sauriez-vous intuitivement (i.e. sans calcul) déterminer ?
(2) Via A.E.P. : Un expérimentateur réalise cette expérience en choisissant 10000 réels au hasard (par exemple en tapant 10000 fois sur la touche RAND d'une calculatrice). Il stocke les informations dans son logiciel préféré (libre et gratuit) R dans un vecteur noté y1. Déterminez approximativement les quantités de la première question.
R> y1 [1] 0.6739665526 0.7397576035 0.7916111494 0.6937727907 0.6256426109 [6] 0.4411222513 0.8918520729 0.4331923584 0.4213763773 0.6879929998 ... [9991] 0.3117644335 0.1422109089 0.4964213229 0.6349032705 0.3718051254 [9996] 0.2839202243 0.7170524562 0.7066086838 0.9236146978 0.7250815830 R> mean(y1) [1] 0.4940455 R> mean(y1==0.5) [1] 0 R> mean(0.25 <y1 & y1<0.5) [1] 0.254 R> var(y1) [1] 0.08296901 R> sd(y1) [1] 0.2880434 R> sd(y1)^2 [1] 0.08296901
(3) Via A.M.P. : Un mathématicien obtient par le calcul les résultats suivant pour une variable aléatoire $Y$ représentant un chiffre au hasard dans l'intervalle $[a,b]$ (i.e. $Y\leadsto\mathcal{U}([a,b])$) :
- pour tout $a\leq t_1 \leq t_2\leq b$, $\mathbb{P}\left( t_1\leq Y \leq t_2 \right)=\frac{t_2-t_1}{b-a}$.
- $\mathbb{E}\left( Y \right)=\frac{a+b}2$
- $\mathbb{V}ar\left( Y \right)=\frac{(b-a)^2}{12}$
(4) Question optionnelle : lesquels de ces résultats vous semblent intuitifs (i.e. déterminables sans calcul) ? Déterminez exactement les quantités de la première question.
R> 1/12 [1] 0.08333333 R> sqrt(1/12) [1] 0.2886751
(5) L'A.E.P. confirme-t'elle les résultats théoriques de l'A.M.P. ?
Exercice 9 : Moyenne de deux réels au hasard dans l'intervalle unité
(1) On se propose maintenant d'étudier la variable $\overline Y=(Y_1+Y_2)/2$ où $Y_1$ et $Y_2$ sont deux variables aléatoires indépendantes suivant une loi uniforme sur $[0,1]$. Quel est l'ensemble des valeurs possibles (ou modalités) de $\overline Y$ ? Pensez-vous que la variable $\overline Y$ suive une loi uniforme ? Nous nous proposons d'évaluer (excatement ou approximativement) les probabilités $\mathbb{P}\left( 0< \overline Y \leq \frac14 \right)$, $\mathbb{P}\left( \frac38< \overline Y \leq \frac58 \right)$, $\mathbb{P}\left( \frac34< \overline Y \leq 1 \right)$, la moyenne $\mathbb{E}\left( \overline Y \right)$, l'écart-type $\sigma(\overline Y)$ et la variance $\mathbb{V}ar\left( \overline Y \right)$. Lesquelles parmi ces quantités sont déterminables intuitivement ou via un simple calcul mental ? Etes-vous capable de comparer les trois probabilités précédentes ?
(2) Via A.E.P. : Un expérimentateur réalise à nouveau l'expérience de choisir 10000 réels entre 0 et 1. Les informations sont stockées dans le vecteur y2. Déterminez approximativement les quantités de la premire question.
R> y2 [1] 7.050965e-01 7.167117e-01 8.085787e-01 5.334738e-01 1.126156e-01 ... [9996] 8.175774e-01 5.379471e-01 4.259207e-01 7.629429e-01 9.217997e-01 R> ym<-(y1+y2)/2 R> mean(0<ym & ym <=1/4) [1] 0.1361 R> mean(3/8<ym & ym<=5/8) [1] 0.4262 R> mean(3/4<ym & ym<=1) [1] 0.1244 R> mean(ym) [1] 0.4953725 R> var(ym) [1] 0.04274204 R> sd(ym) [1] 0.2067415 R> 1/sqrt(24) [1] 0.2041241 R> 7/16 [1] 0.4375
(3) Via l'A.M.P. : Par des développements plutôt avancés, le mathématicien obtient pour tout réel $t$ : $$ \mathbb{P}\left( \overline Y\leq t \right)=\mathbb{P}\left( S:=2\times \overline Y\leq 2×t \right)= \left\{ \begin{array}{ll} 0 & \text{ si } t\leq 0 \\ 2t^2 & \text{ si } 0\leq t\leq 1/2 \\ 4t-1-2t^2& \text{ si } 1/2 \leq t \leq 1 \\ 1 & \text{ si } t\geq 1 \end{array} \right.. $$ Etes-vous en mesure de déterminer les valeurs exactes de la première question ?
(4) L'A.E.P. confirme-t'elle les résultats théoriques de l'A.M.P. ?
Exercice 10 : Représentation graphique A.E.P.
Comme souligné en Cours, le principal pouvoir de l'A.E.P. est de proposer un décodeur visuel de l'A.M.P. Voilà les représentations graphiques A.E.P. pour $m=100$ et $m=1000000$ pour les mêmes expériences que les exercices précédents.- Lancer d'une dé:
- Moyenne de 2 lancers de dés:
- Réel au hasard entre 0 et 1:
- Moyenne de 2 réels au hasard entre 0 et 1:
(1) Pour tous les graphiques avec $m=1000$:
(2) Pour tous les graphiques avec $m=1000000$:
(3) Pour tous les graphiques avec $m=\infty$:
(4) Représentations graphiques pour $m=\infty$
WebR Console
Introduction
Taper votre code R dans l'éditeur de texte du bas, exécuter-le et voir la sortie dédiée:
- Editeur de texte du haut pour l'obtention des résultats
- Plot dans la partie de droite
Exécuter code
Click sur
ou [Ctrl] + [R]
Effacer toutes les sorties
Click sur
Effacer la première sortie
Click sur
Sélection Jeu de données
Sélectionner un jeu de données dans le menu déroulant
Une fois sélectionné le jeu de données est exécuté dans la console WebR.