s2 - stat2var - diapos · 2020. 3. 16. · 2. corrélation linéaire après remplacement 3. modèle...
TRANSCRIPT
TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères
⇓Pour chaque individu :
un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles
valeurs inconnues
Etude
⇓Série de données :
2 variables 12
?
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
1. Introduction 1.2 Mises en forme
� Séries « listes »
quantité d'engrais
production recueillie
parcelle n°
X (kg.ha-1) Y (q.ha-1)
1 150 462 80 373 120 464 220 515 100 43
X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118
Série chronologique
� Tableaux de contingence
X : âge
20 40 50 60
Y : acuité
3/10 1 5 10 20
6/10 8 12 25 18
9/10 55 26 14 6
TC – Mathématiques – S2
� Séries
« listes »
X : année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Y : dépense 41 60 55 66 87 61 90 95 82 120 125 118
Série de données xi et yi
Ensemble de points Mi(xi ; yi)
« nuage de points »
1. Introduction 1.3 Nuage de points
TC – Mathématiques – S2
1. Introduction 1.3 Nuage de points
� Tableaux de contingence
X : âge
20 40 50 60
Y : acuité
3/10 1 5 10 20
6/10 8 12 25 18
9/10 55 26 14 6
TC – Mathématiques – S2
2. Test d’indépendance du Khi-deux
Exemple d’approche
1. Résultats d’un échantillon
de 8 hommes et 12 femmes :
Evaluer la différence entre observation et théorie par un paramètre global : χ²calc
Ce paramètre est le χ²calc de
l’expérience.Calculer un χ² : (obs – th)² / th
Deux variables sont croisées.
Ex : Hypothèse à tester, H0 : « genre et QI sont indépendants (dans la population) »
<100 >100
F 3 9 12
H 6 2 8
9 11 20
2. Résultats théoriquement
attendus (sous H0) :
<100 >100
F 12
H 8
9 11 20
5,4 6,6
3,6 4,4
3. Différences :
χ² partiels et χ² total
<100 >100
F
H
1,067 0,873
1,6 1,309
L’hypothèse à tester est celle de leur indépendance.
4,85
TC – Mathématiques – S2
Quelle que soit l’expérience et sous l’hypothèse nulle « H0 » (ex : « sexe et QI indépendants »),
on sait donner la probabilité que telle valeur du χ² soit (ou ne soit pas) dépassée.
densité de
probabilité
valeurs possibles
du χ² d’un
échantillon en cas
d’indépendance
0 4,85
97,23 %
2,77 %
notre exemple
La loi du χ²
la réalité
densité de
probabilité
valeurs
possibles
du χ²0 4,85
? %
? %
notre
exemple
vos possibilités
6,6
4
1%
5,4
1
2%
3,8
4
5%
2,7
1
10%
2. Test d’indépendance du Khi-deux
TC – Mathématiques – S2
1. On teste l’hypothèse nulle d’indépendance « H0 » (ex : « sexe et QI indépendants »).
densité de
probabilité
0 χ²calc
2. Le χ² de l’expérience décrite est calculé : χ²calc.
3. On situe notre χ²calc en probabilité grâce au formulaire.
Objectif : peut-on se permettre de la rejeter ?
Objectif : évaluer son importance, dans l’hypothèse H0
Objectif : le comparer aux χ² donnés par le formulaire
Test d’indépendance à r lignes et k colonnes :
ddl = (r – 1)(k – 1)
4. Selon le seuil de risque α choisi, une
décision est prise (rejet ou non-rejet de H0).
Méthodologie
2. Test d’indépendance du Khi-deux
5,3
χ²calc
TC – Mathématiques – S2
1. Hypothèse nulle « H0 » : sexe et rapport au tabac sont indépendants.
densité de probabilité
0
??
2. χ²calc =
3. nombre de ddl : (3-1)(2-1) = 2
valeurs du formulaire
9,2
1
1%
7,8
2
2%
5,9
9 5%
4,6
1
10%
4. Au seuil de 10% , on peut rejeter H0.
seuil de risque : α = 10%
χ²lim = 4,61
5,3
Sh Sf
Tj 12 23Tf 31 26Ta 8 17
35
57
25
11751 66
Sh Sf
Tj 35
Tf 57
Ta 25
51 66 117
distribution observée distribution théorique sous H0
15,26
10,9032,1514,10
24,8519,74
Sh Sf
Tj
Tf
Ta
valeurs des χ²
0,695071,524170,77038
0,537101,177770,59529
5,300
4,6
1
10%
Exercice 1
2. Test d’indépendance du Khi-deux
3.1 Moyennes mobiles
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 6
x : 1 à 16
3. Ajustement, Mayer
3.2 Problématique de l’ajustement linéaire
Une infinité de formes possibles pour un nuage de points.
Parfois, une droite le représente correctement. « ajustement linéaire »
Dans d’autres cas, c’est une courbe. « ajustement non linéaire »
TC – Mathématiques – S2
3.2 Problématique de l’ajustement linéaire
Une fois une droite tracée :
Dans le nuage de points :
Par définition du point Mi,
xi et yi sont associés.
xi
yi
y’i
A xi est associé y’i = axi + b
Définition : on appelle résidu le nombre ei = yi – y’i
ei
ei > 0 : Mi au-dessus de la droite ei < 0 : Mi en-dessous de la droite
(D) : droite de régression (ou d’ajustement) ; déterminer (D) : faire un ajustement linéaire.
TC – Mathématiques – S2
3. Ajustement, Mayer
1. Partager équitablement le nuage (de gauche à
droite)
2. Déterminer G1 et G2, points moyens des demi-
nuages
3. (D) = (G1G2)
3.3 Méthode de Mayer
Principe de Mayer :1
0n
i
i=
=∑e
Equivalent à : G ∈ (D)
Méthode de Mayer (trouver une droite cohérente) :
G1
G2
GG
A noter :
Dans tous les
cas, G ∈ (G1G2).
Ainsi, (D) est une
droite de Mayer.
(D)
TC – Mathématiques – S2
3. Ajustement, Mayer
3.3 Méthode de Mayer
1
1
80 100 120100
3
37 43 4642
3
x
y
+ += =
+ += =
G
G
engrais récolte
(kg.ha-1) (q.ha-1)
1 150 46
2 80 37
3 120 46
4 220 51
5 100 43
80
100
120
x : engrais
(kg/ha)
y : récolte
(q/ha)
40
80 150
60
50
30220120
×
×
×
×
××
G1
×
G2
DM
2
2
150 220185
2
46 5148,5
2
x
y
+= =
+= =
G
G
;1 1
48,5 420,07647 34,35
185 100y x
−= ≈ = − ≈− G G
a b a
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 7
3.3 Méthode de Mayer
Droite de Mayer
...
...
1
1
1 2 84,5
8
28 45 4040
8
x
y
+ + += =
+ + += =
G
G
...
...
2
2
9 10 1612,5
8
28 46 3941,125
8
x
y
+ + += =
+ + += =
G
G
TC – Mathématiques – S2
3. Ajustement, Mayer
Exercice 8
×
G1
×
G2
N N+1 N+2 N+3
tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4 tri1 tri2 tri3 tri4
(M€) 28 45 49 36 30 44 48 40 28 46 52 37 31 42 54 39
4.1 Paramètres des séries à deux variables
TC – Mathématiques – S2
Moyennesn
i
i
x
xn
==∑
1
n
i
i
y
yn
==∑
1
Variances
( )
r
i
i
x
X xn
== −∑
2
21V
( )2
1 2V
k
j
j
y
Y yn
== −∑
Covariance
( ), 1
n
i i
i
x y
Cov X Y x yn
== −∑
Ecarts types
( ) ( )VX Xσ =
( ) ( )VY Yσ =
Sur calculatrice
X : List 1
Y : List 2
(nij : List 3)
Saisir CALC >
SET
CALC >
2Var
CALC >
Stat2Var L1,L2(,L3)
Résultats
, , , ,
, , , ,
2
2
X
Y
x x x
y y y n
xy
σ
σ∑ ∑
∑ ∑
∑
4. Ajustement, moindres carrés
4.1 Paramètres des séries à deux variables
Cov(X,Y) = 203,6
TC – Mathématiques – S2
4. Ajustement, moindres carrés
Exercice 9
engrais récolte
(kg.ha-1) (q.ha-1)
1 150 46
2 80 37
3 120 46
4 220 51
5 100 43
YX [15 ; 25[ [25 ; 50[ 50 et plus
aucune 4 6 13
1 à 11 10 16 15
12 à 23 13 8 4
≥ 24 6 3 2
E(X) = 134
Σx = 670
Σx² = 101700
σX = 48,826
V(X) = 2384
E(Y) = 44,6
Σy = 223
Σy² = 10051
σY = 4,5869
V(Y) = 21,04
Σxy = 30900
E(X) = 39,375
Σx = 3937,5
Σx² = 182006,25
σX = 16,422
V(X) = 269,67
E(Y) = 10,795
Σy = 1079,5
Σy² = 23388,25
σY = 10,833
V(Y) = 117,35
Cov(X,Y) = -56,15
Σxy = 36890
A. La droite de régression est unique
B. Dans tous les cas, G ∈ (D)
C.
4.2 Méthode des moindres carrés
Principe :
n
i
i=∑
2
1
e Equivalent à : formules de a et b
Résultats :
G
est minimale
( )( )
,Cov X Y
X=
Va y x= −b a
(D)
TC – Mathématiques – S2
4. Ajustement, moindres carrés
4.2 Méthode des moindres carrés
V(X) =
1 2 3 4 5 6 7 8 9 10 11 12année (1 : 2006)
dépense
(k€)
120
100
80
60
40 +
++
+
+
+
++
+
++
+
CALC >
REG > X
CALC >
LinReg L1,L2
11,91667 V(Y) = 701,3889
Cov(X,Y) = 84,1667
( )( )
,Cov X Y
X= ≈ 7,0629
Va ≈ 37,42b
(D) : y = 7,0629x + 37,42
(D)
TC – Mathématiques – S2
4. Ajustement, moindres carrés
Exercice 10
4.3 Coefficient de corrélation linéaire
0.75 < r < 1
( )( ) ( )
,X Y
X Yρ
σ σ= = =
Covr R
0 < r < 0.5 -0.75 < r < -0.5 -0.5 < r < 0
-1 < r < -0.75 -0.5 < r < 0.5 0.5 < r < 0.75 0 < r < 0.5
TC – Mathématiques – S2
4. Ajustement, moindres carrés
4.3 Coefficient de corrélation linéaire
TC – Mathématiques – S2
4. Ajustement, moindres carrés
TC – Mathématiques – S2
5. Ajustement non linéaire
1. remplacement
de X ou Y par une
autre variable
(T ou U)
Etude ⇒ X, Y
2. corrélation linéaire
après remplacement
3. modèle final de la
relation entre X et Y
Méthodologie
3.
(DY/T) : y = 1.02526 t + 3.856
y = 1.02526 x² + 3.856
X 2 3 5 8Y 9 13 28 70
1. On propose le changement de variable T = X².
Exemple
T 4 9 25 64Y 9 13 28 70
2. Ici, il s’agit de déterminer une équation de droite de type y = at + b.
Ex avec la méthode des moindres carrés, calculatrice en mode Stat :
TC – Mathématiques – S2
5. Ajustement non linéaire
1. remplacement
de X ou Y par une
autre variable
(T ou U)
Etude ⇒ X, Y
2. corrélation linéaire
après remplacement
3. modèle final de la
relation entre X et Y
Méthodologie
X 10 20 30 40 50 60 70 80 90
T
Y 15.2 11.6 9.3 7.8 7 6.6 6.9 8 9.6
2500 1600 900 400 100 0 100 400 9001.
2.
3.
(DY/T) : y = 0.00336 t + 6.535
y = 0.00336 (x – 60)² + 6.535
Exercice 15
TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères
⇓Pour chaque individu :
un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles
valeurs inconnues
Etude
⇓Série de données :
2 variables 12
?
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
6. Estimation
1. Trouver l’équation d’une droite (ou courbe) de régres-sion : y’ = ax + b (ou y’ = f(x))
Etude ⇒ X, Y
2. Lire la nouvelle donnéex0 (ou y0)
3. Avec l’équation, calculer sa valeur associée
y’0 (ou x’0)
Méthodologie
1.
2.
3.
6.1 Estimation ponctuelle
Exercice 10
y’ = 7.0629x + 37.42
x0 = 14
y’0 = 136.3 k€
1.
2.
3.
Exercice 7
y’ = 0.07647x + 34.35
y’0 = 60 q/ha
x’0 = 335.4 kg/ha
1.
2.
3.
Exercice 15
y’ = 0.00336 (x – 60)² + 6.535
x0 = 100 km/h
y’0 = 11.91 L/100km
Exercice 19
TC – Mathématiques – S2
1. Introduction
3 5 10
Y : recette (k€)
150
120
100
80
1.1 Objectifs
2 caractères⇓
Pour chaque individu :un couple (x, y)
de valeurs
� X et Y sont-elles liées ? � Modéliser la relation � Estimer de nouvelles valeurs inconnues
Etude
⇓Série de données :
2 variables 12
y’0
« corrélation »
« prévision »
« ajustement »,
« régression »
X : dépense (k€)
TC – Mathématiques – S2
6. Estimation
Droite
R > 0
y’0
2d
eam
plif
.
Amplification : il faut calculer un écart type RELATIF
À l’aide des rapports z = y / y’
2de amplification : l’intervalle bleu donne une estimation à un degré de confiance trop moyen (68,3%). On doit l’amplifier par un facteur u relié à un niveau de confiance plus élevé (ex : 95%)
6. Estimation
1. a. Calculer les valeurs y’iassociées aux xi du tableau
b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z
c. Obtenir la moyenne et l’écart type de Z
Méthodologie 1. a.
6.2 Intervalle de confiance
Exercice 10
4. Intervalle : par la formule
3. Avec le niveau de confiance, donner le coefficient u
2. Calculer l’estimation
ponctuelle y’0
b.
1. c. z = 1.000971
σZ = 0.125286
2. y’0 = 136.3 k€
3. niveau de confiance : 95% u = 1.96
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
4.
[136.3(1.000971 – 1.96×0.125286) ;
136.3(1.000971 + 1.96 × 0.125286)]
= [102,8 ; 169,8]
TC – Mathématiques – S2
Exercice 20
6. Estimation
1. a.
6.2 Intervalle de confiance
Exercice 7
b.1. c. z = 0,9991106
σZ = 0,0472554
2. y’0 = 0,07647x + 34,35= 57,29
3. niveau de confiance : 99% u = 2.58
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
4.
[57,29(0,9991 – 2,58×0,047255) ;
57,29(0,9991 + 2,58×0,047255)]
= [50,25 ; 64,22]
TC – Mathématiques – S2
1. a. Calculer les valeurs y’iassociées aux xi du tableau
b. Calculer les valeurs zi = yi/y’id’une nouvelle variable Z
c. Obtenir la moyenne et l’écart type de Z
Méthodologie
4. Intervalle : par la formule
3. Avec le niveau de confiance, donner le coefficient u
2. Calculer l’estimation
ponctuelle y’0
Exercice 21
TC – Mathématiques – S2
6. Estimation
204050602040506020405060
0.30.30.30.30.60.60.60.60.90.90.90.9
xiyj nij
15
10208
1225185530146
y’ = -0.008430x + 1.0424List5List1 List2 List3 List4
y’i zi z = y/y’
z = 0.9989 σZ = 0.2962
y’0 = -0.008430x + 1.0424 = 0.368
niveau de confiance : 99% u = 2.58
( ) ( );z z
y z u y z uα ασ σ′ ′− + 0 0
= [0.0864 ; 0.6488]
x0 = 80
[0.368(0.9989 – 2.58×0.2962) ;
0.368(0.9989 + 2.58×0.2962)]
Exercice 226.2 Intervalle de confiance
0,8738
0,7052
0,6209
0,5366
0,8738
0,7052
0,6209
0,5366
0,8738
0,7052
0,6209
0,5366
0,3433
0,4254
0,4832
0,5591
0,6867
0,8508
0,9664
1,1182
1,03
1,2763
1,4495
1,6772