0% ont trouvé ce document utile (0 vote)

16 vues4 pages

Itc MP TP6

communauté

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

16 vues4 pages

Itc MP TP6

communauté

Transféré par

julojf.francoise

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP no 6 - Apprentissage automatique 1

1 Reconnaissance des chiﬀres manuscrits

Les caractères manuscrits peuvent présenter une grande variabilité : forme de chiffres, grosseur du trait,
inclinaison. . . On souhaite écrire un programme qui reconnaisse automatiquement des chiffres manuscrits. Pour
cela, on dispose d’un échantillon d’images bitmap représentant chacune un des 10 chiffres écrit à la main.
Plus précisément, les données constituent les lignes du fichier [Link] que j’ai placé en ligne sur
mon site, c’est-à-dire un fichier texte, avec ici le champs séparés par des virgules. En l’occurrence, chaque
ligne de données est formée de 65 nombres.

§ d’abord une donnée xi , formée par les pixels d’une image en niveaux de gris. Le niveau de gris est donné
par un nombre entier entre 0 et 16 (disons 0 pour noir et 16 pour blanc), et l’image comporte 8 lignes
et 8 colonnes (donc 8 ˆ 8 “ 64 nombres). D’abord sont donnés les pixels de la première ligne, puis les
pixels de la deuxième ligne, etc. On obtient ainsi une liste de 64 nombres. C’est toujours de cette
matière que seront représentées les images dans la suite.

§ ensuite un chiﬀre entre 0 et 9 : c’est l’étiquette yi de l’image xi , c’est-à-dire le chiﬀre manuscrit que
représente l’image.

1 Importer les données du ﬁchier [Link], dans une matrice (liste de liste) d’entiers X et un
vecteur (liste d’entiers) Y (respectivement les données et les étiquettes). Vous pourrez par exemple utiliser les
commandes open, read et readlines. . . , et aussi la commande split.

2 De combien d’images étiquetées dispose-t-on ? Dans la suite, on appelera N cette quantité.

Pour l’affichage, avec les 64 nombres de chaque xi “ pxℓ q0ďℓď63 (les pixels d’une image), il s’agit de former
une matrice 8 ˆ 8 (liste de 8 listes de 8 nombres). Dans le tableau à gauche sur la figure 1, les indices ℓ des
pixels d’une image sont à l’intérieur du tableau. Les indices de lignes i et de colonnes j de la matrice associée
figurent en en-têtes à gauche et en haut.

3 Exprimer l’indice ℓ du pixel à la ligne i et colonne j.

4 Écrire une fonction affiche(x,y) qui prend en argument une image x (liste de 64 nombres entre 0
et 15) et aﬃche cette image, avec en titre l’étiquette y passée en argument (utiliser la fonction title de
[Link], que vous chercherez dans l’aide si besoin). Voir par exemple au milieu sur la ﬁgure 1.
Vous pourrez d’abord mettre l’image sous forme de matrice (liste de listes) comme expliqué au-dessus, et
donner cette matrice à manger à la fonction imshow de [Link] (par exemple avec l’argument
cmap=’gray’, qui s’occupe de tout !).

1.1 Apprentissage supervisé

Il s’agit de faire apprendre à l’ordinateur comme reconnaître les différents chiffres, en lui montrant d’abord
un grand nombre de chiffres manuscrits avec les bonnes réponses associées. Ceci pourrait être utile pour le tri
automatique du courrier à la Poste, la lecture du montant d’un chèque lu par un automate, etc.
Il s’agit d’un problème de classement de données, qu’on va effectuer à l’aide de l’algorithme des k plus
proches voisins.

5 En utilisant la commande shuffle du module random, écrivez une fonction permutation(A) qui renvoie
une permutation aléatoire des entiers entre 0 et A ´ 1. Par exemple :
1 >>> permutation(17)
2 [1, 5, 6, 2, 12, 15, 0, 3, 14, 8, 10, 4, 11, 16, 7, 13, 9]

[Link] MP - ITC 2024-2025

TP no 6 - Apprentissage automatique 2

0 1 2 3 4 5 6 7

0 0 1 2 3 4 5 6 7

1 8 9 10 11 12 13 14 15

2 16 17 18 19 20 21 22 23

3 24 25 26 27 28 29 30 31

4 32 33 34 35 36 37 38 39

5 40 41 42 43 44 45 46 47

6 48 49 50 51 52 53 54 55

7 56 57 58 59 60 61 62 63

Figure 1 – Aﬃchages pour l’apprentissage supervisé des chiﬀres manuscrits

Dans la suite, on se réservera 80% de l’ensemble des données pour l’entraînement, et 20% pour les tests
(à une donnée près, si ça ne tombe pas juste. . . ).

6 Déﬁnissez les deux variables Ne et Nt comptant respectivement le nombre de données d’entraînement

et le nombre de données de test (on doit avoir N e ` N t “ N ).

7 Partagez aléatoirement le jeu de données en données d’entraînement et données de test. Concrètement,

créez deux listes images_e et images_t, de longueurs respectives N e et N t, et contenant respectivement les
indices des images d’entraînement, et les indices des images de test. Pour ce faire, vous n’avez qu’à prendre
pour la première liste, le début d’une permutation des nombres entre 0 et N ´1 (N “nombre total de données),
et comme données de test la ﬁn.

8 Écrire une fonction distance2(xA,xB) qui calcule le carré (inutile de calculer la racine carré pour
comparer des ÿ
distances !) de la distance euclidienne entre les images passées en argument (listes de 64 pixels),
c’est-à-dire paj ´ bj q2 si xA“ paj q0ďjď63 et xB“ pbj q0ďjď63 .
0ďjď63

9 ‹ Écrire une fonction knn(x,k) qui donne une prédiction sur la classe de l’image passée en argument,
en utilisant l’algorithme des plus proches voisins (voisinage de taille k), en apprenant à partir de Xe/Ye. En
cas d’égalité, vous pourrez prendre par exemple la première étiquette la plus fréquente. . .

10 Modifiez votre fonction affiche en une fonction affiche2(x,y_vraie,y_predite) qui affiche l’image x
avec en titre son étiquette vraie, et son étiquette prédite. Voir par exemple à droite sur la figure 1. Écrire
une fonction un_test(k) qui lance l’algorithme knn avec k voisins sur une image choisie au hasard parmi les
données de test, et affiche le résultat avec la fonction affiche2.

11 Calculez taux de réussite et matrice de confusion des prédictions pour diﬀérentes valeurs de k. Observez
l’eﬀet de la diminution du nombre de données d’apprentissage.

1.2 Apprentissage non supervisé

Des extra-terrestres découvrent notre écriture et cherchent à la comprendre. En particulier, disposant d’un
vaste échantillon de chiffres manuscrits, ils souhaitent le classifier en clusters de chiffres identiques, c’est-à-dire

[Link] MP - ITC 2024-2025

TP no 6 - Apprentissage automatique 3
regrouper les images en clusters homogènes, chaque cluster correspondant à un chiffre.
Il s’agit d’un problème de classification de données, qu’on va effectuer à l’aide de l’algorithme des k-
moyennes.
On maintient à un jour une liste poles (liste de K “ 10 images, qui ne sont a priori pas dans les données).
On maintient aussi à jour une liste pos, de taille N et tel que pos[i] est l’indice du pôle à laquelle est
actuellement associée l’image d’indice i de donnees (donc un nombre entier entre 0 et 9).

12 Écrire une fonction pole_plus_proche(x, poles), qui renvoie l’indice du pôle k le plus proche de x
parmi les pôles passés en argument.

13 Écrire une fonction re_partitionne(poles,pos) qui met à jour la liste pos étant donnée la liste des
pôles (liste d’images) donnée en argument. Cette fonction agit par eﬀet de bord sur pos. On demande aussi
à ce qu’elle renvoie True dès qu’au moins une image change de pôle associé, et False si aucune image ne
change de pôle.

14 ‹ Écrire une fonction nouveaux_poles(poles,pos) qui modifie par effet de bord la liste de pôles passée
en argument (et ne renvoie rien). Les nouveaux pôles sont calculés comme les iso-barycentres des différents
clusters lus dans pos (le premier cluster est formé de toutes les images d’indice i de X tel que pos[i] est égal
à 0, le deuxième cluster tel que pos[i] est égal à 1, etc). On peut convenir que si un cluster est vide, alors
son pôle est pris égal à p0, 0, . . . , 0q (image noire), mais ce cas ne devrait pas se produire.

15 ‹ Enfin, écrire une fonction kmeans(K) (bien sûr qu’on l’appelera avec K “ 10 car 10 chiffres !), qui
réalise un partionnement de donnees en K clusters. Vous pourrez choisir les pôles initiaux au hasard parmi
les données, en utilisant la fonction sample du module random. Ensuite, une itération de l’algorithme des k-
moyennes consiste en : re-partitionnement des données suivant les pôles passées en argument, puis recalcul
des nouveaux pôles. Quand toutes les itérations sont terminées, il faut calculer la partition à partir de pos.
La fonction doit renvoyer le nombre A d’itérations nécessaires, les pôles à la fin, ainsi que la partition obtenue
(liste de clusters, chaque cluster étant une liste d’indices d’images).

16 Lancez des tests. Par exemple, dans chaque cluster, regardez combien d’images sont étiquetés avec
l’étiquette la plus fréquente du cluster.

17 Par curiosité, vous pouvez aﬃcher les pôles à l’aide de la fonction avec imshow. Vous pouvez aussi
observer l’inertie totale diminuer. . .

2 Accidents de la route
Dans le ﬁchier [Link] que j’ai placé en ligne sur mon site, sont répertoriés les lieux des accidents
survenus en 2019 en Basse-Normandie. On désire faire des clusters à partir de ces accidents. Exercice à but
purement pédagogique. Est-ce vraiment signiﬁcatif de faire ça ?
On admet que la distance sur la sphère terrestre entre le point de latitude λ1 et de longitude φ1 , et le
point de latitude λ2 et de longitude φ2 vaut environ
a
pφ2 ´ φ1 q2 cos2 pλ1 q ` pλ2 ´ λ1 q2

et c’est cette quantité que nous pourrons retenir pour déterminer le pôle le plus proche d’un accident. Avec
nos latitudes proches de 49o N, on remplacera simplement cos2 pλ1 q par 0.43.

18 Reprenez et adaptez votre implémentation de l’algorithme des k-moyennes écrite à la section précédente.

[Link] MP - ITC 2024-2025

TP no 6 - Apprentissage automatique 4

19 Dessinez, avec une couleur diﬀérente pour chaque cluster.

20 Le top du top : utiliser le module cartopy.

[Link] MP - ITC 2024-2025

Vous aimerez peut-être aussi

TP : Reconnaissance de chiffres avec KNN
Pas encore d'évaluation
TP : Reconnaissance de chiffres avec KNN
4 pages
TP Algoknn
Pas encore d'évaluation
TP Algoknn
12 pages
07 - Cours Et TP - Algorithme Des K Moyennes
Pas encore d'évaluation
07 - Cours Et TP - Algorithme Des K Moyennes
4 pages
Détection de chiffres avec Python
Pas encore d'évaluation
Détection de chiffres avec Python
14 pages
2024 Agro Veto TB - 0725 - SP
Pas encore d'évaluation
2024 Agro Veto TB - 0725 - SP
4 pages
Méthodes de Machine Learning expliquées
Pas encore d'évaluation
Méthodes de Machine Learning expliquées
5 pages
TP3 Classification
Pas encore d'évaluation
TP3 Classification
4 pages
Algorithme des k plus proches voisins
Pas encore d'évaluation
Algorithme des k plus proches voisins
5 pages
Tutoriel Python : Classification d'Images
Pas encore d'évaluation
Tutoriel Python : Classification d'Images
6 pages
TP Images
Pas encore d'évaluation
TP Images
4 pages
Application de l'algorithme K-NN
Pas encore d'évaluation
Application de l'algorithme K-NN
3 pages
Introduction au Deep Learning avec Keras
Pas encore d'évaluation
Introduction au Deep Learning avec Keras
15 pages
4-TD04 Ia
Pas encore d'évaluation
4-TD04 Ia
5 pages
Introduction à la Classification en ML
Pas encore d'évaluation
Introduction à la Classification en ML
3 pages
Traitement d'images en Python MPSI/PCSI
Pas encore d'évaluation
Traitement d'images en Python MPSI/PCSI
4 pages
Architecture CC1
Pas encore d'évaluation
Architecture CC1
2 pages
TP15
Pas encore d'évaluation
TP15
6 pages
Classification K-NN avec IRIS et MNIST
Pas encore d'évaluation
Classification K-NN avec IRIS et MNIST
4 pages
9 Intelligence Artificielle KMeans TP
Pas encore d'évaluation
9 Intelligence Artificielle KMeans TP
3 pages
TP1 Classification Par Les K Plus Proches Voisins 23 24
Pas encore d'évaluation
TP1 Classification Par Les K Plus Proches Voisins 23 24
4 pages
IA Exercices Applications (Corrigés)
Pas encore d'évaluation
IA Exercices Applications (Corrigés)
6 pages
Implémentation de l'algorithme EM avec PyTorch
Pas encore d'évaluation
Implémentation de l'algorithme EM avec PyTorch
3 pages
4-TD04 - IA (Corrigé)
Pas encore d'évaluation
4-TD04 - IA (Corrigé)
10 pages
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
Pas encore d'évaluation
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
28 pages
Cours 2emepartie 2emeannee Partie Inteligence Artificielle
Pas encore d'évaluation
Cours 2emepartie 2emeannee Partie Inteligence Artificielle
6 pages
Projet Final Ia
Pas encore d'évaluation
Projet Final Ia
3 pages
TP sur Réseaux de Neurones RBF en Python
Pas encore d'évaluation
TP sur Réseaux de Neurones RBF en Python
6 pages
KNN - Jupyter Notebook
Pas encore d'évaluation
KNN - Jupyter Notebook
7 pages
CB Info DR-OCR
Pas encore d'évaluation
CB Info DR-OCR
8 pages
Concours Commun Polytechniques (CCINP) 2023 PC-PSI Informatique Commune Ca
0% (1)
Concours Commun Polytechniques (CCINP) 2023 PC-PSI Informatique Commune Ca
8 pages
Chargement et classification d'images
Pas encore d'évaluation
Chargement et classification d'images
2 pages
Introduction au Machine Learning avec R
Pas encore d'évaluation
Introduction au Machine Learning avec R
47 pages
Corrigé CNC Informatique 2024 - MP
83% (6)
Corrigé CNC Informatique 2024 - MP
12 pages
Introduction à la classification supervisée
Pas encore d'évaluation
Introduction à la classification supervisée
20 pages
TP18 - Images
Pas encore d'évaluation
TP18 - Images
4 pages
Introduction aux Dictionnaires Python
Pas encore d'évaluation
Introduction aux Dictionnaires Python
16 pages
Apprentissage Automatique avec Python
Pas encore d'évaluation
Apprentissage Automatique avec Python
1 page
TP Reconnaissance de Chiffres Avec Scikit-Learn: Contenu
Pas encore d'évaluation
TP Reconnaissance de Chiffres Avec Scikit-Learn: Contenu
9 pages
PPTOumzil
Pas encore d'évaluation
PPTOumzil
44 pages
Traitement d'images avec Python et Numpy
Pas encore d'évaluation
Traitement d'images avec Python et Numpy
4 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
Perceptrons et Cartes Topologiques en Matlab
Pas encore d'évaluation
Perceptrons et Cartes Topologiques en Matlab
4 pages
Corrigé DS Informatique 2023-2024
Pas encore d'évaluation
Corrigé DS Informatique 2023-2024
2 pages
Prijet Python
Pas encore d'évaluation
Prijet Python
5 pages
Analyse d'images avec Python et Numpy
Pas encore d'évaluation
Analyse d'images avec Python et Numpy
2 pages
Sujet 1 Avec Corrections
Pas encore d'évaluation
Sujet 1 Avec Corrections
4 pages
Reconnaissance Chiffre
Pas encore d'évaluation
Reconnaissance Chiffre
5 pages
Enoncé
Pas encore d'évaluation
Enoncé
4 pages
TP Machine Learning: NumPy, Pandas, Matplotlib
Pas encore d'évaluation
TP Machine Learning: NumPy, Pandas, Matplotlib
10 pages
Projet d'Apprentissage Automatique au Sénégal
Pas encore d'évaluation
Projet d'Apprentissage Automatique au Sénégal
13 pages
Algorithmie Algorithme Des K Plus Proches Voisins: 1. Présentation
Pas encore d'évaluation
Algorithmie Algorithme Des K Plus Proches Voisins: 1. Présentation
10 pages
K-Means Clustering pour Clients et Revenus
Pas encore d'évaluation
K-Means Clustering pour Clients et Revenus
4 pages
Détection de contours en traitement d'images
Pas encore d'évaluation
Détection de contours en traitement d'images
10 pages
Entraînement de modèles KNN avec Iris
Pas encore d'évaluation
Entraînement de modèles KNN avec Iris
18 pages
Synonymes et Décorrélations en ML
Pas encore d'évaluation
Synonymes et Décorrélations en ML
364 pages
Projet Kmeans
Pas encore d'évaluation
Projet Kmeans
3 pages
APlus2 Livre
Pas encore d'évaluation
APlus2 Livre
56 pages
Méthode de couche en graves 0/31,5
Pas encore d'évaluation
Méthode de couche en graves 0/31,5
8 pages
DS1-2ème Lettres-2019
100% (1)
DS1-2ème Lettres-2019
2 pages
Formation Parrainage GreatHela
Pas encore d'évaluation
Formation Parrainage GreatHela
2 pages
Examen Réseaux de Transmission 2013
Pas encore d'évaluation
Examen Réseaux de Transmission 2013
3 pages
Exercices sur les Polynômes et Équations
Pas encore d'évaluation
Exercices sur les Polynômes et Équations
4 pages
No Valer
Pas encore d'évaluation
No Valer
5 pages
Modélisation et Identification Électrique
Pas encore d'évaluation
Modélisation et Identification Électrique
394 pages
Python - Path
Pas encore d'évaluation
Python - Path
1 page
Correctum de Physique NS4 Partie Alternatif
100% (4)
Correctum de Physique NS4 Partie Alternatif
28 pages
Test d'auto-évaluation numérique
Pas encore d'évaluation
Test d'auto-évaluation numérique
3 pages
Commande de relais avec Arduino PIR
Pas encore d'évaluation
Commande de relais avec Arduino PIR
6 pages
Comment Interpréter Les Schémas Électriques Du Fiat Freemont
Pas encore d'évaluation
Comment Interpréter Les Schémas Électriques Du Fiat Freemont
3 pages
TTX Template Téléchargement
Pas encore d'évaluation
TTX Template Téléchargement
3 pages
Déploiement OpenStack pour NFV
Pas encore d'évaluation
Déploiement OpenStack pour NFV
96 pages
1ere - F4 - Génie Civil - Fascicules - PDF - Chômage - Environnement Naturel
Pas encore d'évaluation
1ere - F4 - Génie Civil - Fascicules - PDF - Chômage - Environnement Naturel
100 pages
Outils de Gestion Du Temps
Pas encore d'évaluation
Outils de Gestion Du Temps
23 pages
Atl 610
Pas encore d'évaluation
Atl 610
32 pages
Devoir de Controle N°4: Distributeur de Carburant GPL
100% (1)
Devoir de Controle N°4: Distributeur de Carburant GPL
5 pages
Codes de Défaut: Montadora Peugeot Système Transmission Nombre BVA - AL4 - AT8
Pas encore d'évaluation
Codes de Défaut: Montadora Peugeot Système Transmission Nombre BVA - AL4 - AT8
6 pages
Nouvelles CGV GVA Burkina Faso
Pas encore d'évaluation
Nouvelles CGV GVA Burkina Faso
4 pages
Modélisation des Composants Swing en UML
Pas encore d'évaluation
Modélisation des Composants Swing en UML
2 pages
Cycles et Rendement des Turbines à Gaz
100% (1)
Cycles et Rendement des Turbines à Gaz
42 pages
Statement
Pas encore d'évaluation
Statement
3 pages
Disjoncteur TTI
Pas encore d'évaluation
Disjoncteur TTI
88 pages
DV 21111001
Pas encore d'évaluation
DV 21111001
2 pages
Diapo 1et 2aya
Pas encore d'évaluation
Diapo 1et 2aya
2 pages
HTML 5: Uph Info S1 V1 AU: 2024-2025
Pas encore d'évaluation
HTML 5: Uph Info S1 V1 AU: 2024-2025
36 pages
Rapport de Visite - Gaz
Pas encore d'évaluation
Rapport de Visite - Gaz
3 pages
01 Demande de Cotations
Pas encore d'évaluation
01 Demande de Cotations
20 pages