0% ont trouvé ce document utile (0 vote)

26 vues5 pages

TD Math

Ce document présente les réponses à un atelier sur les fondamentaux de l'intelligence artificielle, en se concentrant sur l'apprentissage automatique et l'application du dataset Iris. Il aborde des concepts clés tels que le rôle de scikit-learn, l'utilisation du RandomForestClassifier, l'analyse des performances et la comparaison avec d'autres algorithmes comme AdaBoost et SVM. L'atelier conclut sur la diversité des approches en machine learning et leurs avantages respectifs.

Transféré par

siiafpk

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

26 vues5 pages

TD Math

Transféré par

siiafpk

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Atelier - 1

Intelligence Artificielle
Réalisé par Yahya Bouchak
1er avril 2025

1. Introduction
Ce document présente les réponses détaillées à l’atelier 1 sur les fondamentaux de
l’intelligence artificielle, couvrant les concepts d’apprentissage automatique et leur appli-
cation pratique avec le dataset Iris.

2. Réponses aux questions

2.1. Rôle de la bibliothèque scikit-learn
Scikit-learn est une bibliothèque Python open-source dédiée au machine learning. Dans
cet exercice, elle joue plusieurs rôles clés :
— Fournir le dataset Iris via load_iris()
— Offrir des fonctions pour diviser les données (train_test_split)
— Proposer des algorithmes de classification (RandomForestClassifier)
— Fournir des métriques d’évaluation (accuracy_score, classification_report)
— Permettre des visualisations basiques en combinaison avec matplotlib

2.2. Fonction du RandomForestClassifier

Le RandomForestClassifier est un algorithme d’apprentissage ensembliste qui :
— Crée de multiples arbres de décision (d’où le terme "forêt")
— Chaque arbre est entraîné sur un sous-ensemble aléatoire des données
— Pour chaque split dans les arbres, seul un sous-ensemble aléatoire des caractéris-
tiques est considéré
Avantages pour la classification :
— Réduit le sur-apprentissage par rapport à un seul arbre de décision
— Gère bien les données non linéaires
— Peut traiter des caractéristiques catégorielles et numériques sans normalisation préa-
lable

1
2.3. Analyse des performances du modèle
La précision (accuracy) mesure le pourcentage de prédictions correctes. Le rapport de
classification montre pour chaque classe :
— Precision : proportion de vrais positifs parmi les prédictions positives
— Recall : proportion de vrais positifs parmi les cas réels positifs
— F1-score : moyenne harmonique de precision et recall

2.4. Taille des ensembles après division

Le dataset Iris contient 150 échantillons :
— Ensemble d’entraînement : 80% de 150 = 120 échantillons
— Ensemble de test : 20% de 150 = 30 échantillons

2.5. Signification des couleurs dans le scatter plot

Dans le graphique plt.scatter(X[:, 0], X[:, 1], c=y, cmap=’viridis’) :
— X[:, 0] et X[:, 1] représentent respectivement la longueur et largeur des sépales
— c=y colore chaque point selon sa classe réelle (0, 1 ou 2)
— La palette ’viridis’ assigne différentes couleurs aux différentes classes

2.6. Importance de la division train/test

La séparation est cruciale pour :
— Évaluer la capacité de généralisation du modèle
— Détecter le surapprentissage
— Fournir une estimation non biaisée des performances

2.7. Hyperparamètres principaux du RandomForestClassifier

Les principaux hyperparamètres :
— n_estimators : nombre d’arbres (100 ici)
— max_depth : profondeur maximale des arbres
— min_samples_split : échantillons minimum pour diviser un nœud
— min_samples_leaf : échantillons minimum dans une feuille

2.8. Avantages de la forêt aléatoire vs régression logistique

La forêt aléatoire est préférée car :
— Peut modéliser des relations non linéaires
— Gère automatiquement les interactions entre caractéristiques
— Plus robuste aux caractéristiques redondantes

2
2.9. Signification de la précision (accuracy)
Dans ce contexte multiclasse :
— Accuracy = (prédictions correctes) / (total prédictions)
— Métrique globale mais pas toujours suffisante
— Doit être complétée par d’autres métriques

2.10. Termes du rapport de classification

Pour chaque classe :
— Precision : TP / (TP + FP)
— Recall : TP / (TP + FN)
— F1-score : 2*(precision*recall)/(precision+recall)

2.11. Moyens d’améliorer la précision

Approches possibles :
— Ingénierie des caractéristiques
— Réglage des hyperparamètres
— Essayer d’autres algorithmes
— Approfondir l’analyse des erreurs

2.12. Surapprentissage (overfitting)

Faible précision sur test vs haute précision sur train suggère :
— Le modèle a mémorisé les particularités du jeu d’entraînement
— Manque de capacité à généraliser
Solutions possibles :
— Réduire la complexité du modèle
— Augmenter les données d’entraînement
— Appliquer des techniques de régularisation

2.13. Passage à un modèle d’apprentissage profond

Pour utiliser un réseau neuronal :
— Normaliser les données
— Définir l’architecture du modèle
— Choisir la fonction de perte et l’optimiseur
— Monitorer la loss sur train/validation

3
2.14. Application avec AdaBoost, XGBoost et SVM
Implémentation comparative

1 from sklearn . ensemble import Ad aB oos tC la ssi fi er

2 from xgboost import XGBClassifier
3 from sklearn . svm import SVC
4
5 # AdaBoost
6 ada = A daB oo st Cla ss if ie r ( n_estimators =100 , random_state =42)
7 ada . fit ( X_train , y_train )
8 y_pred_ada = ada . predict ( X_test )
9 print ( " AdaBoost Accuracy : " , accuracy_score ( y_test , y_pred_ada ) )
10
11 # XGBoost
12 xgb = XGBClassifier ( n_estimators =100 , random_state =42)
13 xgb . fit ( X_train , y_train )
14 y_pred_xgb = xgb . predict ( X_test )
15 print ( " XGBoost Accuracy : " , accuracy_score ( y_test , y_pred_xgb ) )
16
17 # SVM
18 svm = SVC ( kernel = ’ rbf ’ , C =1.0 , gamma = ’ scale ’ , random_state =42)
19 svm . fit ( X_train , y_train )
20 y_pred_svm = svm . predict ( X_test )
21 print ( " SVM Accuracy : " , accuracy_score ( y_test , y_pred_svm ) )

Figure 1 – Résultats d’exécution du code comparatif

Analyse comparative
— AdaBoost : Algorithme boosting séquentiel, sensible au bruit
— XGBoost : Implémentation optimisée du gradient boosting, souvent plus précise

4
— SVM : Trouve l’hyperplan optimal, performance dépend du noyau

Conclusion
Cet atelier a permis d’explorer les bases du machine learning appliqué à la classification
avec le dataset Iris. Les différentes méthodes comparées montrent qu’il existe plusieurs
approches pour résoudre un même problème, chacune avec ses avantages spécifiques.

Vous aimerez peut-être aussi

TP4 ClassificationSupervisée Student
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
11 pages
Ad TD-1
Pas encore d'évaluation
Ad TD-1
4 pages
TP6 SVM
Pas encore d'évaluation
TP6 SVM
4 pages
TP2 Decision Trees 23 24
Pas encore d'évaluation
TP2 Decision Trees 23 24
4 pages
PYTHON Intélligence Artif
Pas encore d'évaluation
PYTHON Intélligence Artif
9 pages
Exercice Random Forest Classification Bayesienne
Pas encore d'évaluation
Exercice Random Forest Classification Bayesienne
5 pages
Méthodes Ensemble
Pas encore d'évaluation
Méthodes Ensemble
7 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
TP5 Forêt Aléatoire
Pas encore d'évaluation
TP5 Forêt Aléatoire
6 pages
Initiation Au Machine Learning Et Au Deep Learning
Pas encore d'évaluation
Initiation Au Machine Learning Et Au Deep Learning
27 pages
Rapport Des TPs.
Pas encore d'évaluation
Rapport Des TPs.
64 pages
TP RN Ensta 2018
Pas encore d'évaluation
TP RN Ensta 2018
20 pages
TP1 Compréhension Et Préparation Des Données
Pas encore d'évaluation
TP1 Compréhension Et Préparation Des Données
5 pages
TP RN Centrale Exec
Pas encore d'évaluation
TP RN Centrale Exec
6 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
Rapport Stage Dété 2021
Pas encore d'évaluation
Rapport Stage Dété 2021
16 pages
Arbre de décision en Data Mining avec Python
100% (1)
Arbre de décision en Data Mining avec Python
6 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
Introduction au Deep Learning avec Keras
Pas encore d'évaluation
Introduction au Deep Learning avec Keras
15 pages
TP Bayes
Pas encore d'évaluation
TP Bayes
3 pages
Contexte: Arbre de Décision Réseau de Neurones
Pas encore d'évaluation
Contexte: Arbre de Décision Réseau de Neurones
6 pages
TP: Arbres de Décision en ML
Pas encore d'évaluation
TP: Arbres de Décision en ML
6 pages
Énoncé - TP03
Pas encore d'évaluation
Énoncé - TP03
13 pages
TP 6: Decision Trees: Partie 1: Chargement Du Dataset Digits de Sklearn Et Entraînement Du Modèle D'arbre de Décision
Pas encore d'évaluation
TP 6: Decision Trees: Partie 1: Chargement Du Dataset Digits de Sklearn Et Entraînement Du Modèle D'arbre de Décision
4 pages
Atelier Python IA pour Débutants
Pas encore d'évaluation
Atelier Python IA pour Débutants
3 pages
Activité 3
Pas encore d'évaluation
Activité 3
3 pages
Resumé de Cours Et Questionnaires
Pas encore d'évaluation
Resumé de Cours Et Questionnaires
14 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
TP1: Arbre de Décision: Objectifs: Partie 1
Pas encore d'évaluation
TP1: Arbre de Décision: Objectifs: Partie 1
8 pages
Chapitre 3 - Classification Supervisé
Pas encore d'évaluation
Chapitre 3 - Classification Supervisé
31 pages
Travaux Pratiques 2
Pas encore d'évaluation
Travaux Pratiques 2
12 pages
TP Scoring
Pas encore d'évaluation
TP Scoring
5 pages
Concepts et Techniques du Machine Learning
Pas encore d'évaluation
Concepts et Techniques du Machine Learning
6 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
TP Api
Pas encore d'évaluation
TP Api
9 pages
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
Pas encore d'évaluation
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
24 pages
Metrics Lab
Pas encore d'évaluation
Metrics Lab
4 pages
Chapitre 2 - Machine Learning - Les Arbres de Décision
Pas encore d'évaluation
Chapitre 2 - Machine Learning - Les Arbres de Décision
10 pages
Classification Et Évaluation: Objectif Du TP 4
Pas encore d'évaluation
Classification Et Évaluation: Objectif Du TP 4
5 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
Résumé Deep Learning
Pas encore d'évaluation
Résumé Deep Learning
15 pages
3 bibliothèques Python low-code ML
Pas encore d'évaluation
3 bibliothèques Python low-code ML
7 pages
Feuilletage 927
Pas encore d'évaluation
Feuilletage 927
25 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
I. Comprendre Le Problème Et Les Données
Pas encore d'évaluation
I. Comprendre Le Problème Et Les Données
7 pages
Atelier 2 Machine Learning
Pas encore d'évaluation
Atelier 2 Machine Learning
5 pages
Med Yassine Tanabene Rapport TP2
Pas encore d'évaluation
Med Yassine Tanabene Rapport TP2
13 pages
Algorithmes de Machine Learning en Python
Pas encore d'évaluation
Algorithmes de Machine Learning en Python
5 pages
TP3: Classification avec KNN, SVM et Arbre de Décision
100% (2)
TP3: Classification avec KNN, SVM et Arbre de Décision
16 pages
Cours Sur Les Généralités Du Machine Learning
Pas encore d'évaluation
Cours Sur Les Généralités Du Machine Learning
12 pages
Atelier 3
Pas encore d'évaluation
Atelier 3
6 pages
Guide Débutant Scikit-learn : Modèles ML
Pas encore d'évaluation
Guide Débutant Scikit-learn : Modèles ML
2 pages
12 Stats III
Pas encore d'évaluation
12 Stats III
60 pages
ML If-Sitn
Pas encore d'évaluation
ML If-Sitn
122 pages
Machine Learning Python Guide
100% (1)
Machine Learning Python Guide
6 pages
ML If-Sitn
Pas encore d'évaluation
ML If-Sitn
140 pages
Intégration des TIC chez futurs enseignants
Pas encore d'évaluation
Intégration des TIC chez futurs enseignants
43 pages
Exercices pratiques en biostatistique ANOVA
Pas encore d'évaluation
Exercices pratiques en biostatistique ANOVA
12 pages
Chapitre 4 Analyse Factorielle Des Correspondances - AFC
Pas encore d'évaluation
Chapitre 4 Analyse Factorielle Des Correspondances - AFC
9 pages
CorrigA SArie Stat Simple
Pas encore d'évaluation
CorrigA SArie Stat Simple
13 pages
Fidélisation Clientèle à TMB Goma
Pas encore d'évaluation
Fidélisation Clientèle à TMB Goma
4 pages
SD3 1 Acp
Pas encore d'évaluation
SD3 1 Acp
36 pages
Régression Linéaire et Moindres Carrés
Pas encore d'évaluation
Régression Linéaire et Moindres Carrés
53 pages
TD2 TD3
Pas encore d'évaluation
TD2 TD3
8 pages
Analyse de Données et Modélisation R
Pas encore d'évaluation
Analyse de Données et Modélisation R
2 pages
Cartes de Controle EAD 2024
Pas encore d'évaluation
Cartes de Controle EAD 2024
11 pages
Etude D'une Série Statistique À Double Caractère
Pas encore d'évaluation
Etude D'une Série Statistique À Double Caractère
7 pages
Étude R&R: Méthode des Étendues
Pas encore d'évaluation
Étude R&R: Méthode des Étendues
3 pages
Analyse
Pas encore d'évaluation
Analyse
84 pages
Formation à l'Université de Bertoua
Pas encore d'évaluation
Formation à l'Université de Bertoua
28 pages
TP4 Methodes Descriptives - AFC
Pas encore d'évaluation
TP4 Methodes Descriptives - AFC
7 pages
TD Modele Lineaire 21 22
Pas encore d'évaluation
TD Modele Lineaire 21 22
22 pages
Guide d'Analyse des Données Qualitatives
Pas encore d'évaluation
Guide d'Analyse des Données Qualitatives
13 pages
Programme Formation Suivi Evaluation
Pas encore d'évaluation
Programme Formation Suivi Evaluation
3 pages
Décrire Les Données
Pas encore d'évaluation
Décrire Les Données
28 pages
Memoire
Pas encore d'évaluation
Memoire
122 pages
Chapitre1 Add
Pas encore d'évaluation
Chapitre1 Add
26 pages
Analyse de Données-Erraiteb
Pas encore d'évaluation
Analyse de Données-Erraiteb
56 pages
Retrieve 4
Pas encore d'évaluation
Retrieve 4
7 pages
Introduction à l'informatique décisionnelle
Pas encore d'évaluation
Introduction à l'informatique décisionnelle
22 pages
01 Exemple
Pas encore d'évaluation
01 Exemple
6 pages
Statistique TH Eorique Et Appliqu EE: Tome 2 Inf Erence Statistique 'A Une Et 'A Deux Dimensions Pierre Dagnelie
0% (1)
Statistique TH Eorique Et Appliqu EE: Tome 2 Inf Erence Statistique 'A Une Et 'A Deux Dimensions Pierre Dagnelie
7 pages
Analyse Statistique des Variables V1 à V4
Pas encore d'évaluation
Analyse Statistique des Variables V1 à V4
23 pages
Méthodologie de Recherche Et Analyse Des Données
Pas encore d'évaluation
Méthodologie de Recherche Et Analyse Des Données
54 pages
1 La Multicolinéarité
100% (1)
1 La Multicolinéarité
5 pages