100% ont trouvé ce document utile (1 vote)
343 vues25 pages

Algérie Linéaire Et Probabilité

Transféré par

Khawla khawla
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
343 vues25 pages

Algérie Linéaire Et Probabilité

Transféré par

Khawla khawla
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Algèbre linéaire

Matrices Matrices usuelles Multiplication matricielle


Une matrice carrée d'ordre n est dite
Une matrice est un tableau de nombres diagonale lorsque, pour tout i ≠ 𝑗, on a
disposés en m lignes et n colonnes. Soit A de Le produit de deux matrices A et B (noté AB) 2 −2 1 −1 5
𝑎𝑖𝑗 = 0 n’est défini que si le nombre de colonnes de
taille (m, n) : −2 0 0 𝐴 = (−3 6 8) 𝑒𝑡 𝐵 = ( 1 2) 𝑎𝑙𝑜𝑟𝑠
A est égal au nombre de lignes de B. 5 2 1 3 4
𝐴 = ( 0 −3 0)
𝑎11 ⋯ 𝑎1𝑛
0 0 5 C’est-à-dire A doit être de taille (m, p) et B de −1 10
𝐴 = (𝑎𝑖𝑗 )𝑖=1,…,𝑚 = ( ⋮ ⋱ ⋮ )
taille (p, n). Alors AB est de taille (m, n). 𝐶 = 𝐴𝐵 = ( 33 29)
𝑗=1,…,𝑛 𝑎𝑚1 ⋯ 𝑎𝑚𝑛 La matrice unité 𝐼𝑛 est la matrice 0 33
diagonale telle que (∀ 𝑖 = 1, … , 𝑛 ; 𝑎𝑖𝑖 = 1) De plus, soient 𝑎𝑖𝑗 et 𝑏𝑖𝑗 les termes généraux
Le terme 𝑎𝑖𝑗 est situé à la 𝑖 è𝑚𝑒 ligne de la 𝑗 è𝑚𝑒 respectifs de A et B, alors le terme général de En effet, l’élément qui se trouve au croisement de
colonne de la matrice A. 1 0 0 C = AB est 𝑐𝑖𝑗 défini par : la ième ligne et la jème colonne est :
𝐼3 = (0 1 0) 𝑝
𝑝 𝑐𝑖𝑗 = ∑𝑘= 1 𝑎𝑖𝑘 𝑏𝑘𝑗 ; par exemple
Exemples 0 0 1
On considère : 𝑐𝑖𝑗 = ∑ 𝑎𝑖𝑘 𝑏𝑘𝑗 𝑐2,1 = (−3) × (−1) + 6 × 1 + 8 × 3
−2 1 −2 𝑘= 1
𝐴 = ( 8 −3) ; 𝐵 = (−3)
1 3 5 Le produit matriciel n’est pas commutatif
3 −1
𝐶 = (3 −1 6) ; 𝐷 = ( )
4 −3 Propriétés
A est une matrice de taille (3, 2). Le produit est distributif par rapport à l’addition. C’est-à-dire :
B est une matrice de taille (3, 1).
Opérations de Base
𝐴 (𝐵 + 𝐶 ) = 𝐴𝐵 + 𝐵𝐶
C est une matrice de taille (1, 3). {
Soient A et B deux matrices de même ( 𝐵 + 𝐶 )𝐴 = 𝐵𝐴 + 𝐶𝐴
D est une matrice de taille (2, 2).
taille (m, n) de termes généraux respectifs Le produit est associatif, c’est-à-dire : ABC = A(BC) = (AB)C.
Une matrice (m, 1) est dite matrice colonne. 𝑎𝑖𝑗 et 𝑏𝑖𝑗 et λ un nombre réel.
Une matrice (1, n) est dite une matrice ligne. Si A est une matrice carrée d’ordre n alors 𝐴𝐼𝑛 = 𝐼𝑛 𝐴 = 𝐴.
Une matrice (n, n) est dite une matrice A = B si et seulement si 𝑎𝑖𝑗 = 𝑏𝑖𝑗 pour tous
Le produit de deux matrices peut être nul sans qu’aucune des deux matrices ne soit la matrice
carrée d’ordre n. i, j 1 2 −2 10
nulle, exemple : ( )×( ).
2 4 1 −5
On appelle transposée de A (et on note La somme de A et B est la matrice de
𝐴𝑡 ou 𝐴′), la matrice dont les lignes sont les terme général 𝑎𝑖𝑗 + 𝑏𝑖𝑗
colonnes de A, et dont les colonnes sont les Systèmes linéaires Inverse
Le produit de A par λ est la matrice de
lignes de A.
Exemples terme général λ𝑎𝑖𝑗 . Grâce au produit matriciel, on peut représenter un système linéaire par Une matrice
une équation matricielle. carréeInverse
A d’ordre n
−2 1 Exemples
−2 8 1 Soit le système linéaire de n équations et p inconnues est dite inversible
𝐴= (8 −3) => 𝐴𝑡 = ( ) 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑝 𝑥𝑝 = 𝑏1 lorsqu’il existe B
1 −3 3 5 2 −4 1
1 3 𝐴= ( );𝐵 = ( ); λ = 3 𝑎21 𝑥1 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑝 𝑥𝑝 = 𝑏2 telle que :
6 1 1 −3
Propriétés 𝐴𝐵 = 𝐵𝐴 = 𝐼𝑛 .
{𝑎𝑛1 𝑥1 + 𝑎𝑛2 𝑥2 + ⋯ + 𝑎𝑛𝑝 𝑥𝑝 = 𝑏𝑛
B est alors notée
( 𝐴 + 𝐵 )𝑡 = 𝐴𝑡 + 𝐵𝑡 1 3 15 6 On peut le représenter par AX = B.
𝐴+𝐵 = ( ) 𝑒𝑡 λA = ( ) 𝑎11 ⋯ 𝑎1𝑝 𝑥1 𝑏1 𝐴−1 : inverse de A
7 −2 18 3
( 𝐴𝐵 )𝑡 = 𝐵𝑡 𝐴𝑡 𝐴= ( ⋮ ⋱ ⋮ ) ;𝑋 = ( ⋮ ) ;𝐵 = ( ⋮ )
𝑎𝑛1 ⋯ 𝑎𝑛𝑝 𝑥𝑝 𝑏𝑛
Algèbre linéaire
Déterminant Matrice symétrique Orthogonalité
Soit A = (𝑎𝑖𝑗 ) une matrice carrée d'ordre 2. Le Deux vecteurs x et y sont dits orthogonaux si <x,y> = 0. On note x ⊥ y.
Une matrice carrée A d'ordre n est
déterminant de A est le réel noté det(A) tel
symétrique lorsque 𝐴𝑡 = 𝐴. Une famille de vecteurs 𝑥𝑖 est dite orthogonale si tous ses vecteurs sont deux à deux
que :
𝑎11 𝑎12 Si A est symétrique, alors : orthogonaux. Toute famille orthogonale (𝑥𝑖 )𝑖={1,…,𝑝} vérifie le théorème de Pythagore :
𝑑𝑒𝑡(𝐴) = |𝑎 | = 𝑎11 𝑎22 − 𝑎12 𝑎21 - A a des valeurs propres réelles.
21 𝑎22
- A est diagonalisable. 2
𝑛 𝑛
Soient A = (𝑎𝑖𝑗 ) et B = (𝑏𝑖𝑗 ) deux matrices - Il existe P telle que 𝑃 −1 = 𝑃 𝑡 et ||∑ 𝑥𝑖 || = ∑ ||𝑥𝑖 ||2
carrées d'ordre n et λ ∈ 𝑹. On a : 𝐴 = 𝑃𝐷𝑃 −1 . 𝑖=1 𝑖=0
- det(AB) = det(A) det(B) = det (BA)
- det(𝐴𝑡 ) = det(A) Produit scalaire Soit E un espace muni d'un produit scalaire et X une partie de E. On appelle orthogonal de X et
- det(λ A) = λn det(A) on note 𝑋 ⊥ l'ensemble : 𝑋 ⊥ = {𝑦 ∈ 𝐸| (∀𝑥 ∈ 𝑋), < 𝑥, 𝑦 > = 0}.
- Si A est diagonale, alors Soit x, y, z trois vecteurs de 𝑅𝑛 et λ un
det(A) = 𝑎11 𝑎22 … 𝑎𝑛𝑛 . scalaire. On définit par produit scalaire On dit que (𝑒𝑖 )𝑖={1,…,𝑝} est une base orthonormée de E si et seulement si :
- det(𝐼𝑛 ) = 1 (qu'on note <.,.>) toute application qui
- A est inversible si et seulement si - si 𝑎1 𝑒1 + 𝑎2 𝑒2 + ⋯ + 𝑎𝑛 𝑒𝑛 = 0, 𝑎𝑙𝑜𝑟𝑠 ∀ 𝑖 ∈ {1, … , 𝑛}, 𝑎𝑖 = 0
vérifie les propriétés suivantes :
det(A) ≠ 0
1 - (∀𝑥 ∈ 𝐸)(∃ 𝑎1 , 𝑎2 , … , 𝑎𝑛 ∈ 𝑹), 𝑥 = 𝑎1 𝑒1 + 𝑎2 𝑒2 + ⋯ + 𝑎𝑛 𝑒𝑛
- Si det(A) ≠ 0, alors det(𝐴−1 ) = - <x+ λy, z> = <x,z> + λ <y,z>
det (𝐴)
- <x,y+ λ z> = <x,z> + λ <x,z> - 𝑒𝑖 est orthogonal à 𝑒𝑗 pour tout i ≠ j.
Diagonalisation - <x,y> = <y,x>
- <x,x> ≥ 0 - ∀ 𝑖 ∈ {1, … , 𝑛}, ||𝑒𝑖 || = 1
VALEUR PROPRE / VECTEUR PROPRE - <x,x> = 0 => x = 0 Projection orthogonale Matrice orthogonale
Une valeur propre de A est un scalaire λ Le produit scalaire canonique et usuel est : Soit M une matrice carrée d'ordre n.
tel qu'il existe un vecteur colonne non nul Soit x un vecteur d'un espace muni d'un
V vérifiant : AV = λ V 𝑛 On dit que M est une matrice orthogonale
produit scalaire E.
< 𝑥, 𝑦 > = ∑ 𝑥𝑖 ∗ 𝑦𝑖 si elle vérifie :
V est alors appelé vecteur propre de A 𝑖=1 Soit F un sous-espace vectoriel de E, x
associé à λ. 𝑀 × 𝑀𝑡 = 𝑀𝑡 × 𝑀 = 𝐼𝑛 .
s'écrit de façon unique sous la forme :
Norme
DIAGONALISATION Le déterminant d'une matrice orthogonale
On appelle norme associée à un produit 𝑥 = 𝑓 + 𝑓 ⊥ 𝑜ù 𝑓 ∈ 𝐹 𝑒𝑡 𝑓 ⊥ ∈ 𝐹 ⊥ .
est égal à ± 1.
Une matrice carrée A d'ordre n est scalaire, le réel ||𝑥|| = √< 𝑥, 𝑥 >.
diagonalisable lorsqu'il existe une matrice On dit que f est le projeté orthogonal de x
Elle vérifie les propriétés suivantes : L'ensemble des valeurs propres de M est
diagonale D et une matrice inversible P sur F et on note 𝑓 = 𝑃𝐹 (𝑥).
- |<x,y>| ≤||x||×||y|| (Inégalité de inclus dans l'ensemble {0,1}.
telles que : 𝐴 = 𝑃𝐷𝑃 −1
Cauchy-Schwartz) Pour x,y de E, on a <𝑃𝐹 (𝑥),y> = <x, 𝑃𝐹 (𝑦)> .
D est constituée des valeurs propres de A. - ||x+y|| ≤||x|| +||y|| (Inégalité
triangulaire) Si (𝑒1 , 𝑒2 , … , 𝑒𝑛 ) est une base orthonormée,
P est obtenue par la concaténation des alors :
- ||x|| ≥ 0 avec égalité si x = 0
vecteurs propres de A.
- || λ x|| = | λ | ||x|| 𝑝
2 2 2
𝑃𝐹 (𝑥) = ∑𝑖=1 < 𝑥𝑖 , 𝑒𝑖 > 𝑒𝑖
Si les valeurs propres de A sont distinctes, - ||x + y|| = ||x|| + ||y|| +
alors A est diagonalisable (réciproque 2 < 𝑥, 𝑦 > Notons que : ||𝑥 − 𝑃𝐹 (𝑥)|| = 𝑖𝑛𝑓𝑓∈𝐹 ||𝑥 − 𝑓||
fausse).
Un vecteur est dit unitaire ou normé si ||x||
= 1.
Fondements de probabilités
Quelques définitions Partitions Mesure Probabilité
- On appelle épreuve E toute expérience La famille d’événements forme une partition Soit E un ensemble muni d’une tribu T. On
probabiliste. de Ω si : Soit E un ensemble muni d’une tribu T. On
appelle mesure toute application
⋃𝑖∈𝐼 𝐴𝑖 = Ω et 𝐴𝑖 ∩ 𝐴𝑗 = ∅ ; ∀𝑖 ≠ 𝑗 appelle probabilité toute application
m : T →R+ telle que :
- On appelle univers de E l’ensemble, m : T →R+ telle que :
généralement noté Ω, de tous les résultats Une partition remarquable est la famille qui - m(∅)= 0
possibles de l’épreuve E (appelés contient l’événement A et son - P(∅)= 0
‘’événements élémentaires ‘’) complémentaire. - Si (𝐴𝑛 )𝑛 est une suite d’éléments de T
Lancer une paire de dés équilibrés et en - Si (𝐴𝑛 )𝑛 est une suite d’éléments de T deux
deux à deux disjoints alors :
retenir la somme est une épreuve. à deux disjoints alors :
Tribus et boréliens 𝑚(⋃𝑛 𝐴𝑛 ) = ∑𝑛 𝑚( 𝐴𝑛 ).
𝑃(⋃𝑛 𝐴𝑛 ) = ∑𝑛 𝑃( 𝐴𝑛 )
Ω= {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
COMMENT POUVONS-NOUS
QUALIFIER L’ENSEMBLE DES Tribus et boréliens
ÉVÉNEMENTS?
Une tribu est une famille T de parties de l’ Soient A et B deux événements. Les
ensemble Ω qui vérifie les propriétés propriétés suivantes sont toujours vraies:
suivantes : 1- ̅) = 1 − P(A)
P(A
Événements — Ω∈T ̅ ∩ B)
2- P(B)=P(A ∩ B)+P(A
— Si (𝐴𝑛 )𝑛 est une suite dénombrable
Un événement est un sous-ensemble de Ω.
- L’intersection de A et B, notée A ∩ B, est un
d’éléments de T, alors ∪ 𝐴𝑛 ∈ T 3- Si A ⊂ B alors P(A) ≤P(B)
événement. Il est réalisé uniquement si A et B Si A est un élément de T, alors son
complémentaire l’est aussi
4- 0 ≤ P(A) ≤ 1
se produisent.
- La réunion de A et B, notée A∪B, est un De plus, si T est une tribu, alors: 5- P(A ∪ B)=P(A)+P(B)-P(A∩ B)
événement. Il est réalisé si A ou B se produit. — ∅ ∈ T.
— Si (𝐴𝑛 )𝑛 est une suite d’éléments de T, alors De plus, considérant une suite (𝐴𝑛 )𝑛
Deux événements remarquables sont à d’événements. On a alors :
retenir: ∩ 𝐴𝑛 ∈ T.
— L’événement certain Ω ; +∞ 𝑛
— L’événement impossible ∅ ; EXEMPLE DE TRIBUS
𝑃(⋃ 𝐴𝑘 ) = lim (𝑃 (⋃ 𝐴𝑘 ))
—Tous les éléments qui n’appartiennent pas à Commençons par le cas discret. 𝑛→+∞
𝑘=1 𝑘=1
A appartiennent à un événement que l’on On considère l’expérience "Lancer une pièce +∞ 𝑛

appelle le complémentaire de A. On le de monnaie équilibrée". 𝑃(⋂ 𝐴𝑘 ) lim (𝑃 (⋂ 𝐴𝑘 ))


𝑛→+∞
note A ̅ ou A𝐶 . On notera : P " PILE apparaît" et F " FACE 𝑘=1 𝑘=1
+∞ +∞
- On dit que deux événements A et B sont apparaît ".
incompatibles s’ils ne peuvent pas être Dans ce cas, l’univers est l’ensemble {P,F} et (𝑃(⋃ 𝐴𝑘 )) ≤ ∑ 𝑃(𝐴𝑘 )
réalisés en même temps. T ={ Ω, ∅,P,F} est une tribu. 𝑘=1 𝑘=1

Si A, B et C sont des événements de Ω, les En général, l’ensemble des parties est une
tribu (classique). Et si :
propriétés suivantes sont toujours vérifiées: 𝑛
—A ∪ A ̅ = Ω et A ∩ A
̅= ∅ Pour le cas continu, les intervalles du type
⋃ 𝐴𝑘 = Ω
— ̅̅̅̅̅̅̅
A∩B=A ̅∪ B ̅ et ̅̅̅̅̅̅̅
A∪B=A ̅ ∩B̅ (lois de [a,+∞[ ; ]a,+ ∞ [; ]- ∞,a[; ]- ∞,a] sont des
𝑘=1
De Morgan) tribus.
Alors :
— A∩ (B∪ C) = (A ∩B) ∪ (A∩C) Nous les appelons DES BORÉLIENS. 𝑛
— A∪ (B ∩C) = (A ∪ B) ∩ (A∪C) 𝑃(𝐵) = ∑ 𝑃(𝐵 ∩ 𝐴𝑘 )
𝑘=1
Fondements de probabilités
Proba Conditionnelles Indépendance Variable aléatoire
En théorie des probabilités, nous nous Deux événements A et B sont dits Une variable aléatoire est un nombre qui dépend du résultat d’une expérience aléatoire.
intéressons souvent au comportement indépendants si et seulement si : Chaque exécution de l’expérience génère une réalisation de la variable aléatoire.
d’un aléa, sachant qu’un autre événement
𝐏(𝐀 ∩ 𝐁) = 𝐏(𝐀)𝐏(𝐁) Mathématiquement, on définit une variable aléatoire X comme une fonction X : T →R qui
est déjà passé.
associe à chaque événement s, un réel X(s)
C’est ce que nous appelons Les En termes courants, deux événements sont
Probabilités Conditionnelles. Par exemple, dans une queue pour la caisse d’un magasin, le nombre de clients est
indépendants si le résultat de l’un une variable aléatoire. La durée de traitement de chaque requête aussi.
Considérant deux événements de n’influence aucunement l’aboutissement de
probabilités non nulles A et B, la l’autre. Remarquons que la première est un nombre entier. On dit qu’elle est à support
probabilité conditionnelle de A sachant discret. Alors que la deuxième est une durée (un nombre réel). On dit qu’elle est à
que B est réalisé (couramment dit A Sous condition d’indépendance de A et B, la support continu
sachant B) est : notion de la probabilité conditionnelle
tombe à l’eau, car les événements évoluent
𝐏(𝐀\𝐁) =
𝐏(𝐀 ∩ 𝐁) l’un sans se soucier de l’autre. Qu’est- ce qui caractérise une variable aléatoire ?
𝐏(𝐁) Ceci se traduit par :
Par commutativité de l’intersection nous Fonction de répartition Probabilité ponctuelle / Densité
avons : 𝐏(𝐀 ∩ 𝐁) = 𝐏(𝐁 ∩ 𝐀) 𝐏(𝐀\𝐁) = 𝐏(𝐀)
𝐏(𝐁\𝐀) = 𝐏(𝐁) Une VA traduit le résultat d’une CAS DISCRET : Probabilité ponctuelle
Et donc en utilisant la formule ci-dessus:
expérience aléatoire en nombre réel. La
𝐏(𝐁\𝐀)𝐏(𝐀) = 𝐏(𝐀\𝐁)𝐏(𝐁) fonction de répartition transporte le La probabilité ponctuelle est la fonction qui
Notons que si A est indépendant de B, il le
calcul des probabilités concernant les décrit les sauts de la fonction de répartition :
D’où alors : sera par rapport à son complémentaire
également. Et vice versa. réalisations de la VA.
𝐏(𝐀\𝐁)𝐏(𝐁) 𝐏(𝐗 = 𝐤) = 𝐏(𝐗 ≤ 𝐤) − 𝐏(𝐗 ≤ 𝐤 − 𝟏) = 𝐩𝐤
𝐏(𝐁\𝐀) =
𝐏(𝐀) C’est la fonction définie par :
En général, pour une suite 0.5

C’est ce que nous appelons : (𝐴𝑛 )𝑛 d’événements indépendants, on a :


𝐅𝐱 (𝐱) = 𝐏(𝐗 ≤ 𝐱) ∑ 𝐩𝐢 = 𝟏
0.2 0.3
LA FORMULE DE BAYES 𝐧 𝐧

𝐏(⋂ 𝐀𝐢 ) = ∏ 𝐏(𝐀𝐢 ) = 𝐏(𝐀𝟏 ) … 𝐏(𝐀𝐧 ) Propriétés :


𝐢=𝟏 𝐢=𝟏 1 3 7
∀𝒙 ; 𝟎 ≤ 𝐅𝐱 (𝐱) ≤ 𝟏
Cette formule est largement utilisée en CAS CONTINU : densité de probabilité
statistique. Fx est une fonction croissante continue à
droite (avec limites à gauche) La densité est la fonction qui décrit les
variations de la fonction de répartition :
𝐥𝐢𝐦 𝐅𝐱 (𝐱) = 𝟎 et 𝐥𝐢𝐦 𝐅𝐱 (𝐱) = 𝟏
NE PAS CONFONDRE 𝒙→−∞ 𝒙→∞
𝒅𝐅𝐱
INDÉPENDANCE ET INCOMPATIBILITÉ 𝐟𝐱 (𝒙) = (𝒙)
DES ÉVÉNEMENTS. 𝒅𝒙

Cas discret Cas continu


∫ 𝒇𝒙 = 𝟏
Fondements de probabilités
Moments Couples aléatoires À mémoriser Lois usuelles
La fonction 𝐅𝐱,𝐲 (𝐱, 𝐲) = 𝐏(𝐗 ≤ 𝐱 ∩ 𝐘 ≤ Soient U, V, X et Y des variables
ESPÉRANCE
𝐲) est dite distribution conjointe de X aléatoires et a, b, c et d des
L’espérance d’une variable aléatoire Ce tableau récapitule les lois usuelles que vous pourrez
et Y. constantes réelles.
est sa valeur attendue. C’est une Dans le cas continu, la fonction rencontrer dans différents cours du master.
mesure de localisation de la définie par : ESPÉRANCE
distribution. 𝛛𝟐 𝑬(𝒂𝑿 + 𝒃𝒀) = 𝒂𝑬(𝑿) + 𝒃𝑬(𝒀)
Dans le cas discret : 𝐟𝐱,𝐲 (𝐱, 𝐲) = 𝐅 (𝐱, 𝐲) Lois discrètes
𝛛𝐱𝛛𝐲 𝐱,𝐲 𝑬(𝒂) = 𝒂
𝐄(𝐗) = ∑ 𝐤. 𝐏(𝐗 = 𝐤) Est une densité conjointe du Loi X Support Densité E(X) V(X)
couple(X,Y). VARIANCE Bernoulli B(p) {0,1} 𝑃(𝑋 = 1) = 𝑝 = 1 − 𝑃(𝑋 = 0) p p(1-p)
𝐤∈𝐗(𝛀)
𝑽(𝑨𝑿) = 𝒂²𝑽(𝑿) Binomiale B(n,p) {0,….,n} P(X = k) = 𝐶𝑛𝑘 𝑝𝑘 (1 − 𝑝)𝑛−𝑘 np np(1-p)
Alors que dans le cas continu : On a donc : 𝑽(𝑨) = 𝟎
𝒙 𝒚 Poisson P(λ) N 𝜆𝑘 −𝜆 𝜆 𝜆
𝑽(𝑿 + 𝒀) = 𝑽(𝑿) + 𝑽(𝒀) + 𝟐𝑪𝒐𝒗(𝑿, 𝒀) 𝑃(𝑋 = 𝑘) = 𝑒
𝐄(𝐗) = ∫ 𝐱. 𝐟𝐱 (𝐱). 𝐝𝐱 𝑘!
𝐅𝐱,𝐲 (𝐱, 𝐲) = ∫ ∫ 𝐟𝐱,𝐲 (𝐭, 𝐮)𝒅𝒕𝒅𝒖 𝑽(𝑿 − 𝒀) = 𝑽(𝑿) + 𝑽(𝒀) − 𝟐𝑪𝒐𝒗(𝑿, 𝒀)
𝐱∈𝐗(𝛀)
−∞ −∞
THEOREME DE TRANSFERT COVARIANCE
Dans le cas discret, on définit la
𝑬(𝝋(𝑿)) = ∑ φ(𝐤). 𝐏(𝐗 = 𝐤) fonction de fréquences conjointes : 𝑪𝒐𝒗(𝑿, 𝒀) = 𝑪𝒐𝒗(𝒀, 𝑿)
𝐤∈𝐗(𝛀) 𝑷(𝑿 = 𝒙𝒊 , 𝒀 = 𝒚𝒋 ) = 𝒑𝒊𝒋 𝑪𝒐𝒗(𝒂𝑿 + 𝒃, 𝒄𝒀 + 𝒅) = 𝒂𝒄𝑪𝒐𝒗(𝑿, 𝒀)
Lois continues
Loi X Support Densité E(X) V(X)
𝑬(𝝋(𝑿)) = ∫ φ(𝐱). 𝐟𝐱 (𝐱). 𝐝𝐱 Et on a donc : 𝑪𝒐𝒗(𝒂𝑿 + 𝒃𝒀, 𝑼) = 𝒂𝑪𝒐𝒗(𝑿, 𝑼) + 𝒃𝑪𝒐𝒗(𝒀, 𝑼)
Uniforme U[a,b] [a,b] 1 𝑎+𝑏 (𝑏 − 𝑎)2
𝑓(𝑥) = 1 (𝑥)
𝐱∈𝐗(𝛀) 𝐅𝐱,𝐲 = ∑ ∑ 𝒑𝒊𝒋 𝑪𝒐𝒗(𝑿, 𝒄𝑼 + 𝒅𝑽) = 𝒄𝑪𝒐𝒗(𝑿, 𝑼) + 𝒅𝑪𝒐𝒗(𝑿, 𝑽) 𝑎 − 𝑏 [𝑎,𝑏] 2 12
VARIANCE Exponentielle E(λ) 𝑅+ 𝑓(𝑥) = 𝜆𝑒 −𝜆𝜋 1𝑅+ (𝑥) 1 1
𝒊:𝒙𝒊 ≤𝒙 𝒋:𝒚𝒋 ≤𝒚 𝑪𝒐𝒗(𝒂𝑿 + 𝒃𝒀, 𝒄𝑼 + 𝒅𝑽) = 𝒂𝒄𝑪𝒐𝒗(𝑿, 𝑼) +
λ λ2
La variance d’une variable aléatoire LOI MARGINALE 𝒂𝒅𝑪𝒐𝒗(𝑿, 𝑽) + 𝒃𝒄𝑪𝒐𝒗(𝒀, 𝑼) + 𝒃𝒅𝑪𝒐𝒗(𝒀, 𝑽) Normale N(𝜇, σ²) R 1 1 𝑥−𝜇 2 𝜇 σ²
décrit la dispersion de la variable On définit la loi marginale de X : 𝑓(𝑥) 𝑒 −2( 𝜎 )
+∞ 𝜎√2𝜋
aléatoire autour de sa valeur moyenne Chi-deux à n 𝑅+ 1 −𝑥 𝑛

𝐟𝐱 (𝐱) = ∫ 𝐟𝐱,𝐲 (𝒙, 𝒚)𝒅𝒚 𝑓(𝑥) = 𝑛 𝑛 𝑒 2 𝑥 2−1 1𝑅+ (𝑥)


(son espérance). Elle est définie par : degrés de liberté 22 Γ ( )
𝟐 ꭓ2𝑛 (n>0) 2
−∞
𝑽(𝑿) = 𝑬(𝑿𝟐 ) − (𝑬(𝑿))
dans le cas continu, ou encore : Vecteurs aléatoires Student à n R 𝑓(𝑥)
= 𝑬((𝒙 − 𝑬(𝑿)𝟐 ) degrés de liberté
=
1 𝑥 2 𝑛+1
(1 + )− 2
𝐟𝐱 (𝒙𝒊 ) = ∑ 𝒑𝒊𝒋 Un vecteur aléatoire est un n-uplet τ(n)(n>0) 1 𝑛 𝑛
Sa racine carrée est appelée écart- √𝑛𝐵 (2 , 2)
𝒋
type et notée généralement : formé de variables aléatoires. On Fisher à (p,q) 𝑅+ 𝑝
−1
dans le cas discret. 1 𝑝 𝑞 𝑥2
𝛔(𝐗) = √𝐕(𝐗) note(𝑋1 , 𝑋2 , … , 𝑋𝑛 )𝑡 degrés de liberté 𝑝 𝑞 𝑝2𝑞2 𝑝+𝑞 1𝑅 + (𝑥)
(De même on peut définir la densité F(p,q)(p,q>0) 𝐵( , ) (𝑞 + 𝑝𝑥) 2
2 2
CENTRAGE ET REDUCTION marginale de Y) L’espérance est toujours linéaire.
Le centrage consiste à localiser la Si X et Y sont indépendants, alors : Pour une suite (𝑎𝑖 )𝑖𝜖{1,..,𝑛} de réels,
distribution autour de l’origine et la 𝐟𝐱,𝐲 (𝐱, 𝐲) = 𝐟𝐱 (𝒙)𝐟𝐲 (𝒚) on a :𝐸(𝑎1 𝑋1 + 𝑎2 𝑋2 + ⋯ + 𝑎𝑛 𝑋𝑛 ) = Γ(𝑥) = ∫0
+∞ 𝑥−1 −𝑡
𝑡 𝑒 𝑑𝑡 désigne la fonction Gamma d’Euler
réduction consiste à normaliser la COVARIANCE 𝑎1 𝐸(𝑋1 ) + 𝑎2 𝐸(𝑋2 ) + ⋯ + 𝑎𝑛 𝐸(𝑋𝑛 )
dispersion. La technique est simple : La covariance mesure l’intensité de la 1 Γ(x)Γ(y)
B(x, y) = Γ(𝑥) = ∫0 𝑡 𝑥−1 (1 − 𝑡)𝑦−1 𝑑𝑡 = désigne la
𝐗 − 𝐄(𝐗) relation linéaire entre deux variables Pour les variables indépendantes, Γ(x+y)
𝐘= aléatoires X et Y. on a : V(𝑋1 +𝑋2 +. . +𝑋𝑛 )=𝑉(𝑋1 ) + fonction Béta
𝛔(𝐗)
MOMENTS D’ORDRE r: 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) ⋯ + 𝑉(𝑋𝑛 )
Si X et Y sont indépendants, alors : Nous allons souvent rencontrer les lois grisées dans les Tests
Le moment d’ordre r est défini par : statistiques. Là encore, connaître les densités ne servirait pas à
𝜇𝑟 = 𝐸(𝑋 𝑟 )
𝐶𝑜𝑣(𝑋, 𝑌) = 0 grand-chose, mais ceci nous évitera de parler de lois dont nous
Le moment centré d’ordre r est défini
Attention : La réciproque n’est pas ne connaissons pas la tête.
ainsi ̃𝑟 = 𝐸((𝑋 − 𝐸(𝑋))𝑟 )
𝜇
vraie.
Fondements de probabilités

Vecteurs Aléatoires Notions de Convergence


INDEPENDANCE DEUX A DEUX Si l’on pense à des données, vues comme réalisation de variables aléatoires
Les variables 𝑋1 , … , 𝑋2 sont deux à deux indépendantes si et 𝑋1 , … , 𝑋𝑛 . Il serait intéressant de se poser la question de savoir comment évolue
seulement si : ∀𝑖 ≠ 𝑗; 𝑋𝑖 𝑒𝑡 𝑋𝐽 sont indépendantes cette suite lorsque n tend vers l’infini.
Convergence en Loi
Convergence presque sûre Convergence en probabilité
Indépendance mutuelle
On dit que (𝑋𝑛 ) converge en
On dit que (𝑋𝑛 ) converge On dit que (𝑋𝑛 ) converge en 𝐿𝑜𝑖
Les variables 𝑋1 , … , 𝑋2 sont mutuellement indépendantes si et presque sûrement vers X et on probabilité vers X et on note loi vers X et on note 𝑋𝑛 → 𝑋 si
seulement si : 𝑝.𝑠
note 𝑋𝑛 → 𝑋 si et seulement si :
𝑝
𝑋𝑛 → 𝑋 si et seulement si :
et seulement si :
𝐅𝐗𝐧 → 𝐅𝐗
𝐧→+∞
P(𝑋1 = 𝑥1 , … , 𝑋𝑛 = 𝑥𝑛 )= P(𝑋1 = 𝑥1 ) × … × 𝑃(𝑋𝑛 = 𝑥𝑛 ) P({ 𝐥𝐢𝐦 𝑿𝒏 = 𝑿}) = 𝟏 (∀𝜺 > 𝟎); P(|𝑿𝒏 − 𝑿|> 𝜺)--> 0 Où 𝐹𝑋 dénote la fonction de
𝒏→+∞
répartition de X
L’INDÉPENDANCE MUTUELLE IMPLIQUE
L’INDÉPENDANCE DEUX À DEUX. Convergence en M.Q
LA RÉCIROQUE EST FAUSSE. On dit que (𝑋𝑛 ) converge en
moyenne quadratique vers X et
𝑚.𝑞
Si 𝑋1 , … , 𝑋𝑛 sont mutuellement indépendantes, alors pour on note 𝑋𝑛 → 𝑋 si et seulement
toute famille de fonctions réelles (𝑓𝑖 )𝑖 , on a : si :
𝐄((𝐗 𝐧 − 𝐗)𝟐 ) → 𝟎
(𝑓1 (𝑋1 ),…, 𝑓𝑛 (𝑋𝑛 )) sont indépendantes. Cette définition peut se
généraliser jusqu’à l’ordre n,
ESPÉRANCE ET VARIANCE-COVARIANCE mais nous n’en aurons pas
besoin.
Soit X=(𝑋1 , … , 𝑋2 )𝑡 un vecteur aléatoire. Dans le cas
multidimensionnel, l’espérance scalaire est remplacée par un Loi faible des Loi forte des
Théorème Central Limite
vecteur espérance. grands nombres grands nombres

E(X)= (𝐸(𝑋1 ), … , 𝐸(𝑋2 ))𝑡 Soit 𝑋1 , … , 𝑋𝑛 une suite Soit 𝑋1 , … , 𝑋𝑛 une suite Soit 𝑋1 , … , 𝑋𝑛 une suite de
de variables aléatoires de variables aléatoires variables aléatoires
La variance unidimensionnelle est remplacée par la matrice indépendantes et de
indépendantes et de indépendantes et de
symétrique de variance-covariance. Elle contient les variances même loi telle que :
même loi telle que : même loi telle que :
en diagonale et les covariances ailleurs. On la note
généralement ∑𝑥 . 𝐸(𝑋𝑖 ) = 𝜇 𝑒𝑡 𝑉(𝑋𝑖 ) = 𝜎 2 𝐸(𝑋𝑖 ) = 𝜇 𝑒𝑡 𝑉(𝑋𝑖 ) = 𝜎 2 𝐸(𝑋𝑖 ) = 𝜇 𝑒𝑡 𝑉(𝑋𝑖 ) = 𝜎 2

𝑉(𝑋1 ) … 𝐶𝑜𝑣(𝑋1 , 𝑋𝑛 ) Alors : Alors : Alors :


∑ =( ⋮ ⋱ ⋮ ) 𝟏 𝐧 𝐩 𝟏 𝒏 𝒑.𝒔
𝐗 𝐧 −𝛍 𝐋𝐨𝐢
̅̅̅̅
𝑥 𝐶𝑜𝑣(𝑋𝑛 , 𝑋1 ) ⋯ 𝑉(𝑋𝑛) ∑ 𝐗 →𝛍 ∑𝒊=𝟏 𝑿𝒊 → 𝝁 √𝐧 → 𝐍(𝟎, 𝟏)
𝐧 𝐢=𝟏 𝐢 𝒏 𝛔
*Statistique inférentielle
Echantillon / Estimateur Estimateur convergent Construction d’un estimateur
Le point de départ est un vecteur (ou un tableau
Un estimateur est dit convergent s’il Méthode du maximum de vraisemblance
dans le cas multidimensionnel) de données.
converge en probabilité vers le La méthode de maximum de vraisemblance consiste à affecter 𝜃 la valeur qui maximise la
Ces données peuvent être vues comme les paramètre à estimer : probabilité d’observer (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) lorsque l’aléa du vecteur (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) tombe. Sans trop
réalisations (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) d’une variable 𝜃̂𝑛 → 𝜃 rentrer dans la théorie de la vraisemblance, nous allons présenter un algorithme en cinq
aléatoire X qui dépend d’un certain paramètre 𝜃 étapes pour calculer cet estimateur (qui présente des propriétés assez séduisantes) :
En pratique, tout estimateur sans biais
que nous allons chercher à estimer.
et dont la variance tend vers 0 est Etape 1 : Calculer la fonction de vraisemblance :
convergent.
Pour ce faire, nous allons construire un 𝐿(𝑥, 𝜃) = ∏𝑛𝑖=1 𝑓(𝑥𝑖 ) dans le cas continu, ou 𝐿(𝑥, 𝜃) = ∏𝑛𝑖=1 𝑃(𝑋i = 𝑥𝑖 ) dans le cas discret.
échantillon de cette variable. Un échantillon
(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) est un n-uplet de variables Estimateur optimal Etape 2 : Calculer le log-vraisemblance :
aléatoires indépendantes et qui suivent tous la Il s’agit de calculer un maximum, ce qui revient à dériver. Il s’agit ici d’un produit de n facteurs
même loi (celle de X). Qualité d’un estimateur
ce qui rend la dérivation assez coriace. La fonction logarithmique présente des propriétés
La qualité d’un estimateur est mesurée à assez sympas pour faciliter cette tâche.
Ceci dit, un estimateur de 𝜃 est une fonction travers son erreur quadratique moyenne
𝜃̂ = 𝑓(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) de notre échantillon de base Etape 3 : Calculer la dérivée de la log-vraisemblance.
définie par :
et dont on connaît la loi de probabilité. Etape 4 : Résoudre l’équation d’inconnue 𝜽 ∶ :
𝐸𝑅𝑄𝑀(𝜃̂𝑛 ) = (𝑏𝑛 (𝜃̂, 𝜃))2 + 𝑉(𝜃̂𝑛 )
Lorsque l’aléa tombe, 𝜃̂ = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) est une 𝜕(ln(𝐿))
Comme nous cherchons tout le temps = 0 => 𝜃 = 𝜃0
estimation de 𝜃. Le but de ce cours est de 𝜕𝜃
construire le meilleur estimateur possible de 𝜃. (presque) des estimateurs sans biais, il reste à
Etape 5 : Vérifier qu’il s’agit d’un maximum : effectivement en s’assurant que :
comparer les variances.
Un estimateur 𝜃̂1 est meilleur que 𝜃̂2 si : 𝜕 2 (ln(𝐿))
Estimateur sans biais < 0
𝑉(𝜃̂1 ) < 𝑉(𝜃̂2 ) 𝜕𝜃
Méthode des moments
Pour que l’estimation soit bonne, il faut que 𝜃̂ Inégalité de Rao-Cramer/ Efficacité
soit proche de 𝜃. Comme 𝜃̂ = 𝑓(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) Comme le paramètre à estimer intervient dans la densité de probabilité, les moments
est une variable aléatoire, on ne peut imposer On définit la quantité d’information théoriques sont souvent en fonction de ce paramètre. Ainsi la méthode des moments consiste
de condition qu’à sa valeur moyenne. apportée par l’estimateur par : à égaliser les moments théoriques (espérance, variance) à leurs équivalents empiriques et à en
dégager une estimation ponctuelle.
2
On définit ainsi le biais : 𝜕𝐿
𝐼(𝜃̂𝑛 ) = − (𝐸 ( )) En pratique, il faut résoudre l’(les) équation(s) : 𝐸(𝑋) = ̅𝑋̅̅𝑛̅ et 𝑉(𝑋) = 𝑆𝑛2 avec :
𝑏𝑛 (𝜃̂ , 𝜃) = 𝐸(𝜃̂𝑛 ) − 𝜃 𝜕𝜃
𝑛 𝑛
1 1
Un estimateur est dit sans biais si 𝑏𝑛 (𝜃̂, 𝜃) = 0. ∏𝑛𝑖=1 𝑓(𝑥𝑖 ) ̅𝑋̅̅𝑛̅ = ∑ 𝑋𝑖 ; 𝑆𝑛2 = ∑(𝑋𝑖 − ̅𝑋̅̅𝑛̅)2
Où 𝐿(𝑥, 𝜃) = est la vraisemblance. 𝑛 𝑛
(nous reviendrons sur sa définition) 𝑖=0 𝑖=0
C’est-à-dire :
Méthode des moindres carrés
L’inégalité de Rao-Cramer postule que la
𝐸(𝜃̂𝑛 ) = 𝜃
variance d’un estimateur ne peut pas aller en Lorsqu’il s’agit de prendre une mesure 𝜃 avec un appareil doté d’une imprécision 𝜀, alors le
delà d’un certain seuil : problème d’estimation peut s’écrire : 𝑋 = 𝜃 + 𝜀

1 La méthode des moindres-carrés ordinaires consiste à trouver le paramètre 𝜃 qui minimise la


𝑉(𝜃̂𝑛 ) ≥ somme des carrées des erreurs :
𝐼(𝜃̂𝑛 )
𝑛 𝑛
Un estimateur est optimal (ou efficace) si sa 𝜃̂𝑀𝐶𝑂 = 𝑎𝑟𝑔𝑚𝑖𝑛 (∑ 𝜀𝑖2 ) = 𝑎𝑟𝑔𝑚𝑖𝑛 (∑(𝑋𝑖 − 𝜃)2 )
variance vérifie le cas d’égalité. 𝑖=0 𝑖=0
*Statistique inférentielle
Intervalles de confiance
Un intervalle de confiance [𝐴, 𝐵] de niveau 1 − 𝛼 est un intervalle qui a la probabilité 1 − 𝛼 de contenir le
paramètre à estimer 𝜃. Formellement, on écrit : 𝑃 (𝑡1 (𝜃) ≤ 𝑓(𝑋1 , … , 𝑋𝑛 ) ≤ 𝑡2 (𝜃)) = 𝑃(𝐴 ≤ 𝜃 ≤ 𝐵) = 1 − 𝛼

Test d’hypothèses

En test d’hypothèse, nous cherchons à faire valoir une hypothèse en dépit d’une autre, qui lui est contradictoire.

On appellera la première (celle dont le rejet à tort sera le plus préjudiciable) « Hypothèse nulle » et la deuxième « Hypothèse alternative ».

Réalité
𝐻0 vraie 𝐻0 fausse
Garder Risque de
1− 𝛼 𝛽
𝐻0 deuxième espèce
Décision
Rejeter
𝛼 1− 𝛽
𝐻0

Risque de Puissance du test


première espèce

Les calculs qui se cachent derrière le choix de l’hypothèse à garder sont compliqués. Mais BONNE NOUVELLE, la machine fera tour à notre place. Il suffit
juste de suivre correctement la méthode :

Etape 1 : Choisir judicieusement les hypothèses à évaluer et fixer le risque 𝛼.

Etape 2 : Choisir le test adapté à la procédure.


Etape 3 : Rentrer la commande correspondante sur R et exécuter.
Etape 4 : Lire dans les sorties la p-value . si elle est supérieure à α on accepte H0 . Si elle lui est inférieure, on rejette H0

Le tableau qui va suivre est à lire avec la plus grande des attentions !!
*Constructions d’Intervalles de confiance

Construction d’intervalles de confiance usuels


Pour les paramètres d’une loi 𝑁 (𝜇, 𝜎 2 )
Pour 𝜇 Pour 𝜎 2 Pour une proportion p
Avec 𝜎 connu Avec 𝜎 inconnu Avec 𝜇 connu Avec 𝜇 inconnu
𝑁
L’EMV de 𝜇 est : L’EMV de p est 𝑝̂ = 𝑛 , où
L’EMV de 𝜇 est : L’EMV de 𝜎 2 est : L’EMV de 𝜎 2 est : 𝑁~𝐵(𝑛, 𝑝) (loi binomiale).
2 𝑛 𝑛
1 𝜎
̅𝑋̅̅𝑛̅ = ∑𝑛𝑖=0 𝑋𝑖 , ̅𝑋̅̅𝑛̅ ~ 𝑁 (𝜇, )
2
1 ′2
1
̅𝑋̅̅𝑛̅ = 1 ∑𝑛𝑖=0 𝑋𝑖 , ̅𝑋̅̅𝑛̅ ~ 𝑁 (𝜇, 𝜎 )
2 𝑛 𝑛 𝑠𝑛 = ∑(𝑋𝑖 − 𝜇) 2
𝑠𝑛 = ∑(𝑋𝑖 − 𝑋̅𝑛 )2
𝑛 𝑛 Comme 𝜎 inconnu, on 𝑛 𝑛 − 1 Pour n assez grand (𝑛 ≥ 30), on
𝑋̅𝑛 − 𝜇 𝑖=0 𝑖=0
On a: √𝑛 𝜎 ~ 𝑁 (0, 1) l’estime avec son équivalent 𝑛𝑠𝑛2 (𝑛−1)𝑠𝑛′2 a : 𝑁 → 𝑁 (𝑛𝑝, 𝑛𝑝(1 − 𝑝))
On a: 2 ~ 𝜒𝑛 2
On a: ~ 𝜒2𝑛−1
empirique. 𝜎 𝜎2
1
Nous allons donc utiliser les 𝑠𝑛′2 = 𝑛−1 ∑𝑛𝑖=0(𝑋𝑖 − 𝑋̅𝑛 )2 Donc :
𝑋̅ − 𝜇
Nous allons donc utiliser les Nous allons donc utiliser les 𝑝̂ − 𝑝
fractiles d’une loi normale On a: √𝑛 𝑛 ′ ~𝑆𝑡 (𝑛 − 1) fractiles d’une loi de Khi- fractiles d’une loi de Khi- √𝑛 ~𝑁(0,1)
𝑠𝑛 √𝑝(1 − 𝑝)
centrée réduite. deux à n degrés de liberté. deux à n-1 degrés de liberté.
Nous allons donc utiliser les 𝑝
̂ −𝑝
𝑃 (−𝑢1−𝛼 ≤ √𝑛 ≤ 𝑢1−𝛼 ) =
̅𝑋̅̅𝑛̅ − 𝜇 fractiles d’une loi de Student 2 √𝑝(1−𝑝) 2
𝑃 (−𝑢1−𝛼 ≤ √𝑛 ≤ 𝑢1−𝛼 ) à n-1 degrés de liberté. 𝑛𝑠2𝑛 (𝑛 − 1)𝑠′2
𝑛 1−𝛼
2 𝜎 2 𝑃 (𝑐1 ≤ 2 ≤ 𝑐2 ) = 1 − 𝛼 𝑃 (𝑐1 ≤ ≤ 𝑐2 ) = 1 − 𝛼 Ceci donne :
𝜎 𝜎 2
=1−𝛼
̅𝑋̅̅𝑛̅ − 𝜇 Ceci donne : Ceci donne : 𝑝(1 − 𝑝)
Ceci donne : 𝑃 (−𝑡1−𝛼 ≤ √𝑛 ≤ 𝑡1−𝛼 ) 𝑃 (𝑝̂ − 𝑢1−𝛼 √
2 𝑛
≤𝑝
2 ′
𝑠𝑛 2
𝑛𝑠2𝑛 𝑛𝑠2 𝑛 − 1)𝑠′2 ′2
=1−𝛼 2 ≤ 𝑛 − 1)𝑠𝑛 )
𝜎 𝑝(1 − 𝑝)
𝑃 (𝑋 ̅̅̅𝑛̅ − 𝑢 𝛼 ≤ 𝜇 𝑃( ≤ 𝜎2 ≤ 𝑛 ) = 1 − 𝛼 𝑃 (
𝑛
≤ 𝜎 ≤ 𝑝̂ + 𝑢1−𝛼 √
𝑛
)
1−
2 √𝑛 Ceci donne : 𝑐2 𝑐1 𝑐2 𝑐1 2

𝜎 =1−𝛼
≤ ̅𝑋̅̅𝑛̅ + 𝑢1−𝛼 ) =1−𝛼
2 √𝑛 𝑠′𝑛 Et donc un intervalle de Comme p (à l’intérieur de
=1−𝛼 ̅̅̅𝑛̅ − 𝑡 𝛼
𝑃 (𝑋 1−
2 √𝑛
≤𝜇 confiance pour 𝜎 2 de niveau Et donc un intervalle de l’intervalle) est inconnu, on
𝑠′𝑛 de confiance 1 − 𝛼 est : confiance pour 𝜎 2 de niveau l’estime avec son équivalent
≤ ̅𝑋̅̅𝑛̅ + 𝑡1−𝛼 ) de confiance 1 − 𝛼 est :
Et donc un intervalle de 2 √𝑛 empirique 𝑝̂ .
𝑛𝑠𝑛2 𝑛𝑠𝑛2
confiance pour 𝜇 de niveau =1−𝛼 [ , ]
𝑐2 𝑐1 𝑛 − 1)𝑠𝑛′2 𝑛 − 1)𝑠𝑛′2
de confiance 1 − 𝛼 est : [ , ] Un intervalle de confiance
Et donc un intervalle de 𝑐2 𝑐1 pour p de niveau de
𝜎 𝜎 confiance pour 𝜇 de niveau Où 𝑐1 ( respectivement 𝑐2 ) est confiance 1 − 𝛼 est :
[𝑋̅𝑛 − 𝑢1−𝛼 , 𝑋̅𝑛 + 𝑢1−𝛼 ] de confiance 1 − 𝛼 est : 𝛼
2 √𝑛 2 √𝑛 le fractile d’ordre 1 − 2 Où 𝑐1 ( respectivement 𝑐2 ) est 𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑠𝑛′ 𝑠𝑛′ 𝛼 𝛼
le fractile d’ordre 1 − 2 [𝑝̂ − 𝑢1−𝛼 √ , 𝑝̂ + 𝑢1−𝛼 √ ]
[𝑋̅𝑛 − 𝑡1−𝛼 , 𝑋̅𝑛 + 𝑡1−𝛼 ] ( respectivement d’une loi ) 2 𝑛 2 𝑛
2
Où 𝑢1−𝛼 est le fractile d’ordre 2 √𝑛 2 √𝑛 𝛼
( respectivement 2 ) d’une loi
de Khi-deux à n degrés de
𝛼
2
Où 𝑡1−𝛼 est le fractile d’ordre Où 𝑢1−𝛼 est le fractile d’ordre
1 − d’une loi normale 2 liberté. de Khi-deux à n-1 degrés de
2 𝛼 2
centrée réduite. 1 − d’une loi de Student à liberté. 𝛼
1 − 2 d’une loi normale
2
n-1 degrés de liberté. centrée réduite.
Programmation sous R
Avoir
Avoir
l’aide
de l’aide Importer et exporter les données Programmation
Accéder à l’aide Import de fichiers textes BOUCLE for Condition While
?fonction : Accéder à l’aide d’une On utilise L’extension readr, qui fait partie de
fonction. tidyverse for (variable in sequence) { while (condition) {
Help.search(‘fonction’) : Chercher de Library (tidyverse) instructions} instructions}
l’aide d’une fonction. Library (readr)
Help (package = ‘MASS’) : Trouvez de - d <- read_csv("fichier.csv") : pour un fichier
l’aide pour un package. Excel séparées par des points virgule
- d <- read_csv2("fichier.csv"): pour un
Packages fichier Excel séparées par des points
virgule
CONDITION if Fonctions
install.packages (‘MASS’) : Télécharger et - fread de l’extenstion data.table : pour
installer un package. importer le plus rapidement possible des if (condition) { nom_de_fonction ← function (variable){
library (‘MASS’) : Importer un package et fichiers textes très volumineux. instructions instructions
rendre toutes ses fonctions accessibles. } else { return (nouvelle_variable) }
data (iris) : Importer un dataset de R (ici iris). Import depuis un fichier Excel Instructions différentes}
L’extension readxl, qui fait partie du
tidyverse, permet d’importer des données
directement depuis un fichier au format xls
Répertoire Ecrire et lire les données
ou xlsx.
getwd () : Trouver le répertoire de Library (readxl)
travail. -d <- read_excel("fichier.xls") Fonctions mathématiques
setwd (‘C://fichier/chemin’) : Changer le Import de fichiers SAS, SPSS et Stata
répertoire de travail courant. log (x) : Logarithme de x. sum (x) : Somme des éléments de x.
Libraray(haven)
exp (x) : Exponentielle de x. median (x) : Médiane des éléments de x.
Organiser ses Scripts ! -read_sas ou read_xpt: Pour les fichiers
max (x) : Plus grand élément de x. quantile (x) :Quantiles.
provenant de SAS
Afin d’organiser son travail et de faciliter min (x) : Plus petit élément de x. rank (x) : Rangs des éléments de x.
-read_sav ou read_por Pour les fichiers
l’accès à l’ensemble de fichiers round (x, n) : Arrondit x à n décimales. var (x) : Variance des éléments de x.
provenant de SPSS,
constitutifs d’une analyse, on commence signif (x, n) : Arrondit x à n valeurs sd (x) : Ecart-type des éléments de x
- read_dta : Pour les fichiers provenant de
notre travail sur R par la création d’Un significatives.
Stata.
projet ! corr (x, y) : Coefficient de corrélation
Export de données
Pour créer un projet, il faut aller dans le entre x et y.
- write_csv, write_csv2, read_tsv permettent
menu File puis sélectionner New project. .
d’enregistrer un data frame ou un tibble
dans un fichier au format texte délimité Conditions
- write_sas export au format SAS
- write_sav export au format SPSS a == b Est-ce que a est égal à b ?
- write_dt exporter au format Stata is.na(a) Y’a-t-il une valeur manquante dans a ?
a != b Est-ce que a est différent à b ?
NB : is.null(a) Y’a-t-il du contenu dans a ?
a > b Est-ce que a est strictement
Il n’existe pas de fonctions permettant a >= b Est-ce que a est supérieur ou égale à b ?
supérieur à b ?
d’enregistrer directement au
Selon que le dossier du projet existe format xls ou xlsx. On peut dans ce cas a < b Est-ce que a est strictement a <= b Est-ce que a est inférieur ou égal à b ?
déjà ou pas, on choisira Existing passer par un fichier CSV. inférieur à b ?
directory ou New directory
Programmation sous R
Vecteurs Matrices Data Frames Manipuler les data frames
m ← matrix ( x, nrows =3, ncols = 3)
Créer des vecteurs Créer une matrice 3x3 à partir des éléments df ← data.frame (x= 1:3, y = c(‘a’,’b’,’c’) Ajouter une colonne à un data frame
Commande Retour Commentaire de x. Un dataframe est une liste particulière où df$nouvelle_variable <- x
Rassembler des tous les éléments ont la même longueur. df[["nouvelle_variable"]] <- x
c(2,4,6) 246 éléments dans un m[2,] : Sélectionner la 2ème ligne.
df[,"nouvelle_variable"] <- x
vecteur Extraction (de listes)
2345 Créer une séquence m[,1] : Sélectionner la 1ère colonne.
2 :6
6 d’entiers
Supprimer les colonnes
Créer une séquence df$x df[[2]] df$col <- NULL
seq(2,3, 2.0 2.5 m[2,3] : Sélectionner le croisement de
entre 2 et 3 avec un pas df[,"col"] <- NULL
by=0.5) 3.0
de 0.5
la 2ème ligne et la 3ème colonne.
df[["col"]] <- NULL
rep(1:2, 1212 Répéter le vecteur 1:2 3
times = 3) 12 fois. t(m) : Transposée de m. Mieux connaître le df
Il y a aussi des fonctions
Répéter chaque
m%*%n : Multiplication matricielle. d’extraction comme subset() et View (df) : Voir le dataframe.
rep(1:2, each 1112 solve(m, n) : Résoudre l’équation mx = n.
= 3) 22
élément du vecteur 1:2 la structure attach(),detach() .. Head (df) : Voir les 6 premières lignes.
3 fois. solve(m) : Inverser m. nrow (df) : Nombre de lignes dans df.
ncol (df) : Nombre de colonnes dans df.
Listes Chaînes de Caractères dim (df) : Taille de la matrice df.
attributes(df) : voir les attributs internes
paste(x, y, sep = ’’ ) :
lst ← list ( x = 1:5, y = c(‘a’, ‘b’)) Joint les deux vecteurs x et y. Distributions
Une liste est une collection de données qui grep(pattern, x) :
peuvent ne pas être du même type. Trouve les occurrences d’une expression dans x. Combinaison Fonction Fonction
Quantile
lst[[2]] : Retourne le 2ème élément de lst. gsub(pattern, replace, x) : densité de rép.
lst[1] : Retourne une nouvelle liste avec le Remplacer les occurrences de «pattern» par Normale dnorm pnorm qnorm
1er élément de lst. «replace» dans x. Poisson dpois ppois qpois
lst$x: Retourne l’élément x de lst. .
toupper(x) : Transforme en majuscules. Binomiale dbinom pbinom qbinom
lst[‘y’]: Retourne une nouvelle liste avec tolower(x) : Transforme en minuscules. Uniforme dunif punif qunif
l’élément y de lst. toupper(x) : Transforme en majuscules. Student dt pt qt
nchar(x) :Compte le nombre de caractères dans Khi-deux dchisq pchisq qchisq
une chaîne.

Graphique Liens utiles


.
✓ https://www.linkedin.com/learning/r-pour-les-data-scientists/transformer-un-
data-frame
✓ https://openclassrooms.com/fr/courses/1393696-effectuez-vos-etudes-
statistiques-avec-r/1394024-decouvrons-de-nouvelles-fonctions
✓ https://cran.r-project.org/
✓ https://courses.edx.org/courses/course-v1:HarvardX+PH125.1x+1T2020/course/
.
*Programmation sous Python
Variables et Types Listes Librairie
a = ‘is’ Importer les librairies
Affectation
b = ‘nice’ import numpy importe la librairie Numpy.
x=5 my_list1 = [‘my’, ‘list’, a, b] Import numpy as np Importer NumPy avec un nom
Calculs my_list2 = [[4, 5, 6, 7], [3, 4, 5, 6]] Data Analysis Machine Learning
raccourci.
x+2 Addition Extraire les éléments d’une liste
my_list1[1] Extraire l’élément d’indice 1. Importation de fonctions particulières
>>> 7
x–2 Soustraction my_list1[-3] Extraire le troisième dernier élément.
from math import pi Graphiques en 2D
>>> 3 my_list1[1:3] Extraire les éléments ’indices 1 et 2. Calcul scientifique
x*2 Multiplication my_list1[1:] Extraire les éléments après l’indice 0.
my_list1[:3] Extraire les éléments avant l’indice 3. Installation de python
>>> 10
x ** 2 Puissance my_list1[:] Copier la liste.
>>>25 my_list1[1][0] Extraire le premier élément de la sous-
x%2 Reste liste d’indice 1.
>>> 1 Opérations sur les listes
x / float (2) Division my_list Concatène la liste deux fois.
>>> 2.5 my_list * 5 : Concatène la liste cinq fois.
Types et conversion Opérations avancées Platforme ouverte dédiée Environnement de Application web pour le
Par position aux sciences des données
str () Convertit en ch de caractères my_list.index(a) Extraire l’indice d’un élément. . développement développement
développée sous Python inclus dans Anaconda
int () Convertit en entiers my_list.count ( a ) Compter les occurrences d’un élément.
float () Convertit en réels my_list.append ( ‘!’ ) Ajouter un élément. my_list.remove
bool () Convertit en booléens ( ‘!’ ) Supprimer un élément. Tableaux
del ( my_list [0 : 1 ] ) Supprimer les éléments my_list = [1, 2, 3, 4]
Aide d’indices 0 et 1. my_array = np.array (my_list)
my_list.reverse ( ) Renverser la liste ( sens inverse ). my_2darray = np.array ([1, 2, 3], [4, 5, 6])
>>> help (str) my_list.pop ( -1 ) Supprimer le premier élément. Extraction d’éléments
my_list.insert ( 0 , ‘!’ ) Ajouter un élément en première my_array[1] Extraire l’élément d’indice 1.
position. my_array[0:2] Extraire les éléments ’indices 0 et 1.
my_list.sort ( -1 ) Trier la liste. my_2darray[:, 0] Extraire les éléments d’indice 1 de chaque axe du tableau.
Opérations sur les tableaux
my_array > 3 Tester si chaque élément du tableau est strictement supérieur à 3.
Chaînes de caractères array([FALSE, FALSE, FALSE, TRUE]).dtype = bool )
my_array * 2 : Calculer le double de chaque élément du tableau.
my_string = ‘ThisStringIsAwesome’
my_string [3] array([2, 4, 6, 8])
my_string
‘s’ my_array + np.array ([5, 6, 7, 8]) : Additionner les tableaux terme à terme.
‘ThisStringIsAwesome’
my_string [4:9] array([6, 8, 10, 12])
‘String’ Fonctions de tableaux
Opérations
Méthodes Par position
my_string * 2
my_string.upper Tranformer en majuscules. my_array.shape Retourne les dimensions du tableau.
‘ThisStringIsAwesomeThisStringIsAwesome’
my_string.lower Tranformer en miniscules. np.append (other_array) Ajouter de nouveaux éléments au tableau.
my_string + ‘Innit’
. my_string.count (‘w’) Compter le nombre d’apparitions np.insert(my_array, 1, 5) np.delete(my_array, [1]) Insérer/Supp des éléments au tableau.
‘ThisStringIsAwesomeInnit’
du caractère précisé ( ). np.mean(my_array) np.median(my_array) np.std(my_array) Calculer la
‘m’ in my_string
my_string.replace (‘e’, ‘i’) Remplacer des caractères. moyenne/médiane/écart type des éléments du tableau ).
TRUE
my_string.strip Enlever des espaces. my_array.corrcoef () Calculer le coefficient de corrélation.
my_list.insert ( 0 , ‘!’ ) Ajouter un élément en première position.
Traitements de données Python
Pandas Extraction
Python Manipulations de Base
Pandas est une librairie basée sur
Accéder à un élément Supprimer des éléments
NumPy. Elle fournit des structures de
données faciles à l’usage et des outils s[‘b’] s.drop([‘a’, ‘c’]) Supprimer une valeur à partir d’une ligne.
pour le traitement et la fouille des -5 s.drop(‘Country’, axis = 1) Supprimer une valeur à partir d’une colonne.
données. df[1:]
Import pandas as pd Trier & Ranger
Country Capital Pop
df.sort_index() Trier en fonction des indices / labels.
1 China Pekin 1303171035
df.sort_values(by = ‘Country’) Trier en fonction des modalités de la variable ‘Country’.
2 France Paris 87847528
Structure de Données df.rank() Affecter un rang à chaque élément.
Series
Extraire un élément Récupérer des données
Ils équivalent les listes sous R.
Une série est une structure de df.shape Retourne le nombre de lignes et de colonnes.
df.iloc[[0], [0]] Extraire un élément par ses coordonnées.
données unidimensionnelle et df.index Retourne le vecteur des indices.
‘Belgium’
indexée qui supporte tous les df.columns Retourne le vecteur des colonnes du dataframe.
df.iat[[0], [0]] Idem.
types de données. df.info() Retourne des informations sur le dataframe.
‘Belgium’
s = pd.series ([3, -5, 7, 4], df.count() Compter le nombre de données non-manquantes.
df.iloc[[0], [‘Country’]] Extraire un élément par son label.
index = [ ‘a’, ‘b’, ‘c’, ‘d’])
‘Belgium’
Data frame df.sum() Calculer la somme des valeurs.
df.at[[0], [‘Country’]] Idem.
data = {‘Country’ :[‘Belgium’, ‘China’, df.cumsum() Calculer les sommes cumulées des valeurs.
‘Belgium’
‘France’], ‘Capital’ : [‘Brussels’, ‘Pekin’, df.min() / df.max Calculer la valeur minimale / maximale.
‘Paris’], ‘Pop’ df.idmin() / df.idmax Retourne l’indice de la valeur minimale / maximale.
df.ix[2] Extraire une ligne à partir d’une série de lignes.
:[‘11190846,1303171035,207847528]} df.describe() Retourne des statistiques descriptives de base.
df.ix[:, ‘Country’] Extraire une colonne à partir d’une
df = pd.Dataframe(data, columns = df.mean() Calculer la moyenne des valeurs.
série de colonnes.
[Country’, ‘Capital’, ‘Pop’]) df.median() Calculer la médiane des valeurs.
df.ix[1:,’Country’] Extraire un croisement ligne/colonne.
Country Capital Pop s[-(s>1)] Extraire les séries où s n’est pas > 1. Fonctions
0 Belgium Brussels 11190846 s[(s<-1)|(s>2)] Extraire les séries où s est < -1 ou > 2.
1 China Pekin 1303171035 f = lambda x : x*2
df[df[‘Pop’]>12000000] Mettre un filtre au dataframe.
2 France Paris 87847528 df.apply ( f ) Appliquer une fonction.
df.applymap (f) Appliquer la fonction élément par élément.
s[‘a’] = 6 Régler a de la série s à 6.
Ecrire et lire les données Liens Utiles
Lire/Ecrire sur un csv Lire /Ecrire sur SQL https://openclassrooms.com/fr/courses/4262331-demarrez-votre-projet-avec-python/4262506-
pd.read_csv(‘fichier.csv’, header = None,
installez-python
nrow = 5) from sqlalchemy import create_engine installer python
df.to_csv(‘monDataFrame.csv’) engine = create_engine (‘sqlite :/// :memory:’) https://openclassrooms.com/fr/courses/4452741-decouvrez-les-librairies-python-pour-la-data-
pd.read_sql(‘select * from my_table;’, engine) .
science/5559646-installez-jupyter-sur-votre-propre-ordinateur
Lire/Ecrire sur un excel pd.read_sql_table(‘my_table’, engine) installer jupyter
pd.read_excel(‘fichier.xlsx’) pd.read_sql_query (‘select * from my_table;’, engine) https://www.linkedin.com/learning/python-l-analyse-de-donnees/bienvenue-dans-python-l-
pd.to_excel(‘df.xlxs’, sheet_name =’Feuil1’)
analyse-de-donnees
analyse
. de donnée sous Pandas
lire plusieurs feuilles du même fichier pd.to_sql (‘myDF’, engine)
. xlsx = pd.ExcelFile (‘fichier.xls’) https://www.datacamp.com/courses/preprocessing-for-machine-learning-in-python
Apprentissage automatique sous python
df = pd.read_excel(xslx, ‘Feuille1’)
*Programmation sous SAS
Un programme SAS Lecture des données à partir d’un fichier Sélection des colonnes
externe
Utiliser : proc import Sélection d’une colonne par nom
• Un programme SAS se compose Proc import Data selected ;
Sélection d’une
o d’étapes DATA et PROC Datafile = “C:\file.csv” Datafile est colonne par sa
Set sas.help.cars ;
o dans chaque étape, on écrit des instructions Out = outdata l’emplacement du fichier position
Keep model type ;
• Pour exécuter un programme SAS, nous pouvons utiliser Dbms = csv qu’on veut lire. Supprimer d’une colonne par
l’icône RUN ou la touche F3. Replace; DBMS : spécifie le type %Let to_keep(1:3) ;
nom
Getnames = yes; de la base à importer. Pour sélectionner les
Data selected ;
variables de 1 à 3.
Set sas.help.cars ;
Lecture des données à partir de datalines Drop model type ;
Data names; Data names; Utiliser : étape data %Let to_keep(1,3, 5) ;
Changer de label
Infile datalines delimiter = ‘,’; Infile “file-path” delimiter = ‘,’; Utiliser le infile pour Pour sélectionner les
Data selected ;
Length first last $25.; Length first last $25.; identifer le fichier externe variables de 1, 3 et 5.
Set sas.help.cars ;
Input first $ last $; Input first $ last $; à lire par un input. Label model = ‘car model’
datalines; Run; Type = ‘car type’;
Amine,Ahmidouch
Narjisse,Cheddadi Lecture des données brutes Sélection des lignes
;run;
Informats : comment lire la data. Formats : comment afficher la data Ignore les N premières observations
Dans la code data, on pourrait rajouter : Data want ;
Infile : identifie un fichier externe à lire.
Informat first $15. last $15. birthday ddmmyy10.; Set sas.help.buy (firstobs = 5) ;
Input : spécifie les variables de la nouvelle base.
format birthday date9.; Limiter le nombre de lignes à lire
Length : précise le nombre de bytes pour stocker les variables
Exemples d’informats Data want ;
Datalines : indique que des lignes de données suivent.
$w. lit des chaînes de caractères de longueur w. Set sas.help.buy (obs = 5);
Run : exécute l’étape Data.
w.d lit des données numériques de longueur w avec d chiffres en Sélectionner les lignes avec les conditions if
.
décimales
. Data want ;
Différentes options de infile : delimiter, missover, dlm, firstobs
MMDDYYw. Lit des données date dans la forme 04-11-80 Set sas.help.buy;
.
If amount >= -1000; .
Trier Conditions if Les boucles
Utiliser la procédure proc Affichage du contenu de la base
Data titles ; Data df ;
Data df ;
sort : Set names ; Do x=1, 2, 3 ;
Do x=1 to 3 ; Afficher les 5 premières observations
Proc une
Trier sort data
base= Score out =
de données If name = ‘Ali’ then y = x**2;
y = x**2;
Sorted; do; output;
output; Proc print data = sashelp.class (obs = 5);
By descending score; title = ‘Etudiant’ ; end;
. end;
Run; end; run;
run; Table des fréquences
else if name =’Karam’ then
Si on ne précise pas l’ordre,
do; Data df ; Data df ;
c’est croissant par défaut. x = 1; Proc freq data = sashelp.class;
. title = ‘Professeur’; x = 1;
Tables sex/ plots = freqplot;
end; Do while (x<4); Do until (x>3);
La procédure Sort trie la base else y = x**2; y = x**2; L’instruction end .
de données SAS par les title = ‘Salarié’; output; indique la fin de la Un résumé statistique de la base
output;
valeurs d’une ou de plusieurs x = x+1; x = x+1; boucle, comme c’est
end; visible dans les Proc means data = sashelp.iris n mean std min max q1
variables numériques ou des end;
run; exemples ci-après. Median q3;
chaînes de caractères. run;
.
.
Algèbre linéaire

Exercices d’applications
Exercice 1:
On considère les matrices suivantes:
2 1 −1 1 3
1 −2 5
𝐴 = (1 2 3), 𝐵 = ( ) , 𝐶 = (−3 0) , 𝐷 = ( ) , 𝐸 = (−1 −4 0)
−2 5 0
1 2 0 2 5

Quels sont les produits matriciels possibles ? Quelles sont les matrices carrées et les matrices symétriques ?

Exercice 2:

−1 1 1
1) Soit 𝐴 = ( 1 −1 1 ). Montrer que 𝐴2 = 2𝐼3 − 𝐴, en déduire que A est inversible et calculer 𝐴−1 .
1 1 −1

1 0 2
2) Soit 𝐴 = (0 −1 1). Calculer 𝐴3 − 𝐴. En déduire que A est inversible puis déterminer 𝐴−1.
1 −2 0

Exercice 3:

Soit A une matrice carrée d'ordre n telle que 𝐴2 = 𝐴.

1) Montrer que si 𝐴 ≠ 𝐼𝑛 alors A n'est pas inversible.

2) Montrer que si 𝐴 ≠ 𝜃𝑛 alors 𝐼𝑛 − 𝐴 n'est pas inversible.


Algèbre linéaire
Corrigés des exercices d’applications
Corrigé 1:
Les produits matriciels possibles sont : AC, AE, BD, CD, DC. La matrice carrée est E, C et D sont des matrices symétriques.

Corrigé 2:

Le calcul ne pose pas de problèmes. Il mène à:


𝐴2 +𝐴 𝐴+𝐼3 𝐴+𝐼3
= 𝐼3 ⟹𝐴 = 𝐴 = 𝐼3
2 2 2
A est inversible, et son inverse est :
𝐴 + 𝐼3
𝐴−1 =
2
1(𝐴2 −𝐼3 )
Un calcul donne. 𝐴3 − 𝐴 = 4𝐼3 . 𝐷𝑜𝑛𝑐 𝐴 ∗ 4
= 𝐼3 , ainsi A est inversible et
1 1 2 −4 2
𝐴−1 = (𝐴2 − 𝐼3 ) = (1 −2 −1)
4 4
1 2 −1

Corrigé 3:
1. Si A était inversible, on pourrait multiplier à gauche par 𝐴−1 les deux membres de l’égalité 𝐴2 = 𝐴, ainsi 𝐴 = 𝐼𝑛

2. Posons 𝐵 = 𝐼𝑛 − 𝐴, alors 𝐵2 = (𝐼𝑛 − 𝐴)2 = 𝐼𝑛 − 2𝐴 + 𝐴 = 𝐼𝑛 − 𝐴 = 𝐵. Donc d’après la question précédente, si 𝐵 ≠ 𝐼𝑛 alors B n’est pas inversible.
Autrement dit, si 𝐴 ≠ 𝜃𝑛 , alors 𝐼𝑛 − 𝐴 n’est pas inversible.
Fondements de probabilités
Exercices d’application

Exercice 1 :
Dans la salle des profs 60% sont des femmes; une femme sur trois porte des lunettes et un homme sur deux porte des lunettes : quelle est la
probabilité pour qu’un porteur de lunettes pris au hasard soit une femme ?
Exercice 2 :
Dans une entreprise deux ateliers fabriquent les mêmes pièces. L'atelier 1 fabrique en une journée deux fois plus de pièces que l'atelier 2. Le
pourcentage de pièces défectueuses est 3% pour l'atelier 1 et 4% pour l'atelier 2. On prélève une pièce au hasard dans l'ensemble de la production
d'une journée.
Déterminer :
- la probabilité que cette pièce provienne de l'atelier 1;
- la probabilité que cette pièce provienne de l'atelier 1 et est défectueuse;
- la probabilité que cette pièce provienne de l'atelier 1 sachant qu'elle est défectueuse.

Exercice 3 :
Soit F la fonction définie par :
0 𝑠𝑖 𝑥 < 0 a- Vérifier que F est bien une fonction de répartition
0,29 𝑠𝑖 − 1 ≤ 𝑥 ≤ 1 b- Soit X la variable aléatoire admettant F pour fonction de répartition ; quelle est
𝑓(𝑥) = 0,37 𝑠𝑖 1 ≤ 𝑥 ≤ 7 la loi de X ?
0,69 𝑠𝑖 7 ≤ 𝑥 ≤ 11
{ 1 𝑠𝑖 𝑥 ≥ 0

Exercice 4 :

Soit X une variable aléatoire de loi de Poisson de paramètre λ > 0. Calculer E (1 + X) −1

Exercice 5 :

Montrer que Var (X) = E(X²) - 2(E(X))²

Exercice 6 :

Le nombre X de kg de tomates récoltés dans un jardin en une semaine, est une variable aléatoire dont la loi de probabilité est la suivante :

a- Quelle est l’espérance mathématique de X et quelle est sa variance ?


b- Pendant les six semaines de la saison de récolte, la distribution de probabilité ne varie pas. Calculer l’espérance mathématique et la variance
de la variable aléatoire Y donnant la récolte totale en kg durant les six semaines.
Fondements de probabilités
Corrigé des exercices d’application
Corrigé 1 :
Notons les différents événements : Fe : «être femme», Lu : «porter des lunettes», H : «être homme».
Alors on a P(Fe) = 0.6, P(Lu\Fe) = 1 3 ; il s’agit de la probabilité conditionnelle probabilité de «porter des lunettes» sachant que la personne est une
femme.
De même, on a P(Lu\H) = 0.5.
On cherche la probabilité conditionnelle P(Fe\Lu).
D’après la formule des probabilités totales on a : P(Fe/Lu)P(Lu) = P(Lu/Fe)P(Fe) avec P(Lu) = P(Lu/Fe)P(Fe) +P(Lu/H)P(H).
Application numérique : P(Lu) = 0.4, donc P(Fe/Lu) = P(Lu/Fe)P(Fe) P(Lu) = 0.5.

Corrigé 2
Notons A l'événement ``la pièce provient de l'atelier 1'', B l'événement ``la pièce provient de l'atelier 2'' et D l'événement ``la pièce est
défectueuse''.
L'énoncé nous dit que les 2/3 des pièces produites proviennent de l'atelier 1. Donc P(A)=2/3.
On cherche P(A∩D)=PA(D)P(A)=0,03×23=150. On démontre de même que P(B∩D)=175 et donc que P(D)=P(A∩D)+P(B∩D)=130.
Ainsi, on a PD(A)=P(A∩D)P(D)=35.

Corrigé 3

1- F est croissante, de limite nulle en −∞, de limite égale à 1 en +∞ et continue à droite, il s’agit donc bien d’une fonction de répartition.
2-
x ∈ X(Ω) -1 1 7 11

P(X = x) 0,29 0,08 0,32 0,31

Corrigé 4
λk e−λ λk+1
E((1 + X)−1 ) = ∑+∞ −1 −λ
k=0 (1 + k) e = ∑∞
k=0 (k+1)!
k! λ

e−λ λk e−λ
= (∑+∞
k=0 k! − 1) = (e−λ − 1) = (1 − e−λ )/ λ
λ λ
Fondements de probabilités

Corrigé des exercices d’application

Corrigé 5

Var(X) = E[(X-E(X))²] = E(X²-2 E(X)X+(E(X))²)


= E(X²)-2 E(X)E(X)+(E(X))=E(X²)-2(E(X))²

Corrigé 6 :

a- E(X) = 0 × 0, 1 + 1 × 0, 5 + 2 × 0, 3 + 3 × 0, 1 = 1, 4 ; E(X²) = 02 × 0, 1 + 12 × 0, 5 + 22 × 0, 3 + 32 × 0, 1 = 2, 6 ; Var(X) =


E(X²) − (E(X))² = 0.64.

b- Y étant la somme de 6 variables aléatoires. i.i.d. on a : E(Y) = 6E(X) = 8, 4 et Var(Y) = 6Var(X) = 3.84
Statistique inférentielle

Exercices d’application

Exercice 1 :
Soit X une variable aléatoire dont la densité de probabilité f est définie par : où θ est un paramètre réel strictement positif.
1 −𝑥

𝑓(𝑥) = { 𝜃 𝑒𝑥𝑝 , 𝑥<0
𝜃
0, 𝑥≥0
1. Déterminer l’estimateur du maximum de vraisemblance 𝜃̂ de 𝜃 d’un r-échantillon de variable parente X.
2. Calculer l’espérance mathématique et la variance de 𝜃̂ .
Que peut-on conclure ?
3. Calculer la quantité d’information de Fisher.
4. En déduire que 𝜃̂ est efficace.

Exercice 2 :

Une entreprise fabrique des sacs en plastique pour les enseignes de distribution. Elle s'intéresse au poids maximal que ces sacs peuvent
supporter sans se déchirer. On suppose ici que le poids maximal que ces sacs peuvent supporter suit une loi normale d'espérance
mathématique 58 Kg et d'écart-type 3 Kg.

1. Sur 200 sacs reçus, une grande enseigne de distribution constate un poids moyen de 57,7 Kg.

1.1. Donner un intervalle de confiance bilatéral de la moyenne des poids sur un échantillon de taille 200, au seuil de risque 1 %. 1.2.
Quelle est votre conclusion sur le poids moyen constaté ?

2. Donner le poids moyen dépassé dans 97 % des cas, sur un échantillon de taille 200.
Statistique inférentielle

Corrigé des exercices d’application


Corrigé 1 :
On a :
E(X)= θ et V(X)= θ²
Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x1 , … , xr ) ∈ 𝑅 𝑟 , tous strictement
positifs, par :
L( θ ; x1 , … , xr ) = ∏ni=1 f(xi )

1 ∑ri=1 xi
=
θr θ
D’où :
∑ri=1 xi
ln L( θ ; x1 , … , xr ) = −lnθ +
θ²
il en résulte que :

∂ r ∑ri=1 xi
ln L( θ ; x1 , … , xr ) = − +
∂θ θ θ²
D’où :
∂ 1
ln L( θ ; x1 , … , xr ) = 0 ⇒ θ = ∑ri=1 xi
∂θ r

∂²
Et comme ln L( θ ; x1 , … , xr )<0
∂θ²

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une structure exponentielle


est :
r
1
θ̂ = ∑ xi
r
i=1
C’est la moyenne empirique du r-échantillon.
Statistique inférentielle

Corrigé des exercices d’application

2. Comme
r
1
θ̂ = ∑ xi
r
i=1

Alors :
V(X) θ²
E(θ̂) =E(X)= θ et V(θ̂) = =
r r
On en déduit que θ̂ est un estimateur sqns biais et convergent de θ.

3. Calculons la quantité d’information de Fisher, I [X, θ], concernant θ.


On a :
∂²
I[X, θ] =-E[ ln f( θ ; X)]
∂θ²
∂² X
= -E [ (- ln θ − )]
∂θ² θ
1 2X
=E [− + ]
θ2 θ3
1
=
θ2

Donc la quantité d’information de Fisher, I[𝑋1 , … , 𝑋𝑟 , 𝜃], concernant 𝜃 fournie par le r-échantillon est :
𝑟
I[𝑋1 , … , 𝑋𝑟 , 𝜃]= r I[X,𝜃]=
𝜃2
Calculons l’efficacité :
1
e[𝜃̂ ]= ̂) =1
I[𝑋1 ,…,𝑋𝑟 ,𝜃]V(𝜃
Donc 𝜃̂ optimal ou efficace.
Statistique inférentielle

Corrigé des exercices d’application


Corrigé 2 :
1. Ici on travaille sur un échantillon de taille 200 (la taille de la population étant considérée comme infinie).
1.1. La variable aléatoire 𝑋̅ égale à la moyenne des poids maximaux sur tout échantillon de taille 200 suit la loi normale N(58 ;
3
) = N(58 ; 0,212).
√200
𝑋̅ −58
On cherche P(58 – a ≤ 𝑋̅ ≤ 58 + a) = 0,99. Après avoir posé T = et lu sur la table de la loi normale centrée réduite, on
0,212
obtient a = 0,55.
Donc l'intervalle de confiance sur tout échantillon de taille 200, de la moyenne des poids, est [57,45 ; 58,55].
1.2. Le poids moyen constaté sur l'échantillon ci-dessus est conforme aux attentes (57,7 Kg appartient à l'intervalle).
2. On cherche P(𝑋̅ > b) = 0,97 donc après calculs on obtient b = 57,6.
Donc le poids moyen dépassé dans 97 % des cas est 57,6 Kg.
*Prérequis de l’Économie
Qu'est-ce qu'un panier de biens ?
CPP Optimisation sous contraintes

En économie, le multiplicateur de Lagrange permet Un panier de biens est un ensemble composé d'un ou de
Qu’est-ce qu’un modèle de CPP ? de déterminer une situation optimale (par exemple plusieurs produits. Ce panier peut être préféré à un
comment maximiser son profit, minimiser ses autre contenant une combinaison différente de biens.
Le modèle de concurrence pure et parfaite CPP stipule
dépenses, ou encore maximiser bien-être) sous une En effet Les individus peuvent classer certains paniers de
que :
contrainte quelconque (budget limité, bien-être biens en fonction de leurs préférences (goûts).
✓ Les agents économiques sont très nombreux minimum requis...).
On définit pour chaque individu une relation de
et très petits de sorte que aucun agent ne peut
La maximisation d’une fonction f(x,y) sous la préférence sur les paniers de biens : préféré, non
avoir à lui seul une influence sur le marché ;
contrainte g(x,y) revient à maximiser la fonction de préféré, indifférent.
✓ La transparence et la fluidité ;
Lagrange suivante :
✓ L’information complète ; Exemple : soient 2 paniers de biens A et B : Le
✓ La liberté d’accès ; L(x,y,𝜆 )= f(x,y)+ 𝜆 × 𝑔(𝑥, 𝑦) consommateur peut les classer du point de vue de la
satisfaction qu'ils lui procurent :
Avec 𝜆 est le multiplicateur de Lagrange
associé à la contrainte g. A ~ B : il est indifférent entre les deux paniers. Les deux
paniers sont donc équivalents pour lui.
Condition nécessaires :
A ≿ B : il préfère faiblement A à B.
𝜕𝐿 𝜕𝐿 𝜕𝐿
= 𝑙𝑥 =0 = 𝑙𝑦 =0 = 𝑙𝜆 =0
𝜕𝑥 𝜕𝑦 𝜕𝜆

Préférence

Relation de préférence "complète" :

Signifie que pour tous les paniers de consommation A et B, le consommateur est toujours Relation de préférence "transitive" :
capable de dire s'il préfère A à B ou B à A ou si A et B sont équivalents.
Signifie que si le panier A est préféré ou indifférent au panier B et si le panier B est
Soit A≽ 𝑩 , Soit B≽ 𝑨 soit 𝑨 ∼ 𝑩 préféré ou indifférent au panier C, alors le panier A est préféré ou indifférent au panier C.
A≽ 𝑩 et B ≽ 𝑪 ⇔ 𝐀 ≽ 𝐂
Relation de préférence "réflexive" :

Signifie qu'un panier est toujours équivalent à lui-même.

A≽ A ⇔ 𝑨 ∼ 𝑨
English

Lexique Anglais -Francais

Frequency Fréquence
Intervalle Étendue Interface De Programmation
Application Programming Interface
Path Chemin Decision Tree Arbres De Décision
Trend Tendance Cluster Une Grappe De Serveurs Ou Nœuds
Pending… En Cours… Data visualisation Visualisation Des Données
Skewness Asymétrie Structured And Unstructured Data Données Structurées Et Non-Structurées
Mean Or Average Moyenne Machine Learning Apprentissage Automatique
Split Diviser Data Cleansing Nettoyage Des Données
Treshold Seuil Data Mining Fouille De Données
Degree Of Freedom Degré De Liberté Accuracy Justesse
Dash Board Tableau De Bord
AUC (Aire Sous La Courbe ROC)
Tail Queue Auc (Area Under The Roc Curve)
Merge Baseline Référence
Fusion
Outlier Valeur Extrême Bias Biais
Cdf Fonction De Répartition Binary Classification Classification Binaire
Data Set Ensemble De Données Centroid Centroïde
Estimator Estimateur Checkpoint Point De Contrôle
Feature Caractéristique Class Classe
Label Étiquette Confusion Matrix Matrice De Confusion
Layer Couche Data Analysis Analyse De Données
Mean Squared Error Erreur Quadratique Normalization Normalisation
(MSE) Moyenne (MSE) Overfitting Surapprentissage
Metric Statistique Recall Rappel
Parameter Paramètre Training Apprentissage
Target Cible Training Set Ensemble d'apprentissage
Weight Pondération

Vous aimerez peut-être aussi