0% ont trouvé ce document utile (0 vote)

82 vues9 pages

Classification des Patients Diabétiques

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

82 vues9 pages

Classification des Patients Diabétiques

Transféré par

G . A

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

La république Tunisienne North American Private university

Ministere de l’enseignments supérieur Institut International Technologie de Sfax

Et de la Recherche Scientifique Département De Génie Industriel

Département de Génie Industriel

PROJET INTELGENCE ARTIFFICIELLE
PROBLEME DE CALSSIFICATION DE
PATIENTS DIABETIQUE

j
j Par :
Elaborés
j
k
Oumaima BEN SALAH GI3

Spécialité : Génie industriel

Réalisé par : Aymen Gouiaa
Classe : Indus 3 - soir

Enseignant :

M. Sabeur Elkosantini

Année universitaire : 2022/2023

I. Introduction
Dans ce projet, nous allons explorer différents modèles d'apprentissage automatique pour
résoudre le problème de classification de patients diabétiques.

Le but de ce projet est de développer un système qui peut prédire si un patient est atteint
de diabète en utilisant des données de 9 variables. Nous allons utiliser un dataset contenant
768 données pour entraîner et tester les modèles.

II. Le démarche de travail

Dans ce projet, je vais commencer par explorer les données en les visualisant et en
vérifiant s'il y a des valeurs manquantes. Ensuite, je vais séparer les données en ensembles
d'entraînement et de test. Puis tester différents modèles de classification tels que la régression
linéaire, logistique, quadratique et l'arbre de décision. Enfin, je vais évaluer la performance de
ces modèles. Le but final de ce projet est de sélectionner le meilleur modèle pour prédire la
présence de diabète chez un patient.

III. Travail demandé

1. Affichage des 5 première ligne parmi 768 de la base de données par la fonction df.head (5)

On a 8 features (entrées) avec des Outcome (sortie) « 0 » ou « 1 » sont binaires

Généralement a régression linéaire est utilisée pour résoudre les problèmes de régression, dans
notre cas on a une variable cible binaire (Outcome) avec deux classes possibles (0 ou 1). Il est
donc possible d'utiliser la régression linéaire pour résoudre ce type de problème.

Mais Il existe d'autres modèles de classification qui peuvent également être utilisés pour
résoudre ce type de problème.

Il est donc important de tester plusieurs modèles et de comparer leurs performances pour
sélectionner le meilleur modèle pour notre ensemble de données.

Projet Intelligence Artificielle 1|Page

 Question 1 : L’affichage des attributs

Cette étape permet d’afficher les noms de attributs de vérifier que les données sont
correctement importées et de connaître les variables disponibles pour la suite de l'analyse.

 Question 2 : Vérification des attributs sans valeurs

Les résultats de tous les valeurs 0, cela signifie qu'il n'y a pas de valeurs manquantes dans
votre dataset. Les données sont complètes et ne nécessitent pas de nettoyage supplémentaire
pour gérer les valeurs manquantes. C'est une bonne chose car cela signifie que vous avez des
données complètes pour l'analyse et l'apprentissage automatique.

Projet Intelligence Artificielle 2|Page

 Visualisation des donnés

Les points des variables sont dispersés de manière aléatoire, cela indique qu’il n’y a pas de
corrélation entre ces variables

Cela signifie que les valeurs des variables ne sont pas liées entre elles donc il n'y a donc pas de
lien direct entre les variables.

Question 3 : Affichage de la matrice heatmap

Projet Intelligence Artificielle 3|
La matrice heatmap permet de visualiser les corrélations entre les différentes
variables

Puisque les valeurs d’intersection entre les attributs ne sont pas proches de 1 (forte corrélation
positive) ou -1 (forte corrélation négative) donc il n y’a pas de forte corrélation entre eux donc
on n’a pas besoin d’éliminer certains attributs

 Question 4 : Création des vecteurs X ("Pregnancies":" Age") et Y ("Outcome")

Cette fonction permet de séparer les variables d’entrée (X) et la variablr cible (Y) pour les
modèles.

• X est un vecteur qui contient les données des variables de "Pregnancies" à "Age"du
tableau de données.
• Y est un vecteur qui contient les données de la variable "Outcome" du tableau de
données

Projet Intelligence Artificielle 4|Page

Question 5 : Diviser le dataset en deux ensembles (70% pour l’apprentissage et 30%
pour le test). Utiliser la fonction train_test_split

Cette fonction permet de diviser les données en un ensemble d'entraînement et un ensemble de

test. Les paramètres de la fonction sont les suivants :

• X : les données d'entrée

• Y : les sorties
• test_size : la proportion des données à utiliser pour le test (0.3 signifie 30% des
données pour le test et 70% pour l'entraînement)
• random_state : pour reproduire les résultats

Question 6 : Afficher la taille des 4 ensembles obtenus

•
X_train représente les données d'entraînement pour les variables X, y_train représente
les données d'entraînement pour la variable cible y.
• X_test représente les données de test pour les variables X, y_test représente les données
de test pour la variable cible y
 Question 7 : Tester les différents modèles
Dans cette étape on va tester les différents modèles pour résoudre notre problème de
classification

Projet Intelligence Artificielle 5|

 Modèle 1 : Logistique

Dans notre cas la valeur de score égale à 0.77 . Ce qui indique que le modèle de régression
logistique a de bonnes performances pour prédire les résultats.

Ce score montre que les prédictions effectuées par le modèle sont assez proches de la réalité. Il
est donc possible d'utiliser ce modèle pour prédire les résultats dans des situations similaires à
celles utilisées pour l'entraînement.
Mais il faut continuer le test de plusieurs modèles pour trouver qui est le plus perforant.

Projet Intelligence Artificielle 6|Page

 Modèle 2 : Réseau Neurones

La valeur de perte est égale à 0.51 et le 0 .068. cela signifie que le modèle a
une performance moyenne pour prédire les résultats. La perte de 0.51 signifie qu'il y a encore
de la marge pour améliorer les prédictions du modèle. Et le score de 0.68 indique que 68%
des résultats sont correctement prédits par le modèle, il y a donc encore de la marge pour
améliorer les performances

 Modèle 3 : l’arbre de décision

Les arbres de décision sont souvent utilisés pour des taches de classification car ils
permettent de comprendre les relations entre les variables. La valeur de score est 0.74 cela
signifie que le modèle est performant pour prédire les résultats.
 Modèle 4 : Le foret aléatoire

Projet Intelligence Artificielle 7|

la valeur de score est 0.77 cela signifie que le modèle de foret aléatoire est la performant
pour prédire les résultats.

Question 8 : Evaluer la performance des différents modèles

Le modèle La valeur su score

Logistique 0.77

Réseau de neurone 0.68

L’arbre de décision 0.74

Le foret aléatoire 0.77

Les modèles les plus performants sont :

 Le modèle Régression logistque

 Le foret aléatoire

IV. Conclusion

En résumé, nous avons testé différents modèles de classification pour résoudre le problème de
détection de diabète chez les patients. Les résultats ont montré que les modèle quadratique et
foret aléatoire ont été les plus performants. Nous pouvons donc les recommander pour des
applications similaires.

Projet Intelligence Artificielle 8|Page

Vous aimerez peut-être aussi

10 Algorithmes D'apprentissage Automatique Pour Débutants
Pas encore d'évaluation
10 Algorithmes D'apprentissage Automatique Pour Débutants
1 page
2018 - HoundayiIffanice Houndji
Pas encore d'évaluation
2018 - HoundayiIffanice Houndji
55 pages
Intelligence-Artificielle 25 Cours
Pas encore d'évaluation
Intelligence-Artificielle 25 Cours
19 pages
Analyse Et Prédiction Des Crises Cardiaques
Pas encore d'évaluation
Analyse Et Prédiction Des Crises Cardiaques
30 pages
Cours - IA - Chapitre4
Pas encore d'évaluation
Cours - IA - Chapitre4
26 pages
Atelier 2 Machine Learning
Pas encore d'évaluation
Atelier 2 Machine Learning
5 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
15 pages
Prédiction de Crédit avec IA
Pas encore d'évaluation
Prédiction de Crédit avec IA
29 pages
Big Data Et Analyse Prédictive
Pas encore d'évaluation
Big Data Et Analyse Prédictive
44 pages
Sujet 46
Pas encore d'évaluation
Sujet 46
14 pages
Rapport Stage Dété 2021
Pas encore d'évaluation
Rapport Stage Dété 2021
16 pages
Projet IA MameCheikhSylla - IbraKoundoul
Pas encore d'évaluation
Projet IA MameCheikhSylla - IbraKoundoul
19 pages
Intro Au Machine Learning
Pas encore d'évaluation
Intro Au Machine Learning
12 pages
Analyse Prédictive des Élections et Discours Présidentiels
Pas encore d'évaluation
Analyse Prédictive des Élections et Discours Présidentiels
26 pages
Machine Learning
Pas encore d'évaluation
Machine Learning
5 pages
Corrigé D'un Examen de Machine Learning S4 Génie MIS
100% (1)
Corrigé D'un Examen de Machine Learning S4 Génie MIS
25 pages
Machine Learning Process
Pas encore d'évaluation
Machine Learning Process
10 pages
Machine Learning Python Guide
100% (1)
Machine Learning Python Guide
6 pages
Prédiction du Diabète par IA et Outils Data
Pas encore d'évaluation
Prédiction du Diabète par IA et Outils Data
3 pages
Algorithmes IA : TD & TP Université Ki-Zerbo
Pas encore d'évaluation
Algorithmes IA : TD & TP Université Ki-Zerbo
4 pages
Machine Learning
Pas encore d'évaluation
Machine Learning
89 pages
Détection Pneumonie par IA
Pas encore d'évaluation
Détection Pneumonie par IA
10 pages
Machine Learning avec Scikit-learn
Pas encore d'évaluation
Machine Learning avec Scikit-learn
26 pages
Projets IA : Anomalies, Images, Sentiments, Performance
Pas encore d'évaluation
Projets IA : Anomalies, Images, Sentiments, Performance
2 pages
PYTHON Intélligence Artif
Pas encore d'évaluation
PYTHON Intélligence Artif
9 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Cours - Systemes Intelligents - C6
Pas encore d'évaluation
Cours - Systemes Intelligents - C6
11 pages
Tutoriel Scikit-learn pour Débutants
Pas encore d'évaluation
Tutoriel Scikit-learn pour Débutants
26 pages
Chapit 1 ML L3 IRS
Pas encore d'évaluation
Chapit 1 ML L3 IRS
38 pages
TD Et Indications - Éléments de Réponse
Pas encore d'évaluation
TD Et Indications - Éléments de Réponse
10 pages
Pourquoi Lancer Un Projet
Pas encore d'évaluation
Pourquoi Lancer Un Projet
26 pages
Steps To Complete A Machine Learning
Pas encore d'évaluation
Steps To Complete A Machine Learning
11 pages
IA Version 5 Mon Cours Éléve Très Réduit
Pas encore d'évaluation
IA Version 5 Mon Cours Éléve Très Réduit
28 pages
I. Comprendre Le Problème Et Les Données
Pas encore d'évaluation
I. Comprendre Le Problème Et Les Données
7 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
Rapport Des TPs.
Pas encore d'évaluation
Rapport Des TPs.
64 pages
Cours ML Mounira
100% (1)
Cours ML Mounira
131 pages
Évaluez Un Algorithme de Classification Qui Retourne Des Valeurs Binaires - Evaluez Les Performances D'un Modele de Machine Learning - OpenClassrooms
Pas encore d'évaluation
Évaluez Un Algorithme de Classification Qui Retourne Des Valeurs Binaires - Evaluez Les Performances D'un Modele de Machine Learning - OpenClassrooms
5 pages
Introduction à Scikit-Learn et ML
Pas encore d'évaluation
Introduction à Scikit-Learn et ML
35 pages
TP2 A Rendre
Pas encore d'évaluation
TP2 A Rendre
5 pages
Entraîner Un Modèle
100% (1)
Entraîner Un Modèle
16 pages
Introduction au Machine Learning et IA
Pas encore d'évaluation
Introduction au Machine Learning et IA
63 pages
AI Cours
Pas encore d'évaluation
AI Cours
12 pages
Logiciel R
Pas encore d'évaluation
Logiciel R
2 pages
Section 3.1 - Apprentissages
Pas encore d'évaluation
Section 3.1 - Apprentissages
25 pages
TP2 - EPI Polytec - v2020 - 2021 PDF
Pas encore d'évaluation
TP2 - EPI Polytec - v2020 - 2021 PDF
12 pages
Défis et Solutions en Apprentissage Automatique
Pas encore d'évaluation
Défis et Solutions en Apprentissage Automatique
38 pages
Indicateurs de Performance en Machine Learning
Pas encore d'évaluation
Indicateurs de Performance en Machine Learning
3 pages
Projet Machine Learning
Pas encore d'évaluation
Projet Machine Learning
21 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
01 RN Modele Lineaire
Pas encore d'évaluation
01 RN Modele Lineaire
37 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
Projets ML pour étudiants en S5
Pas encore d'évaluation
Projets ML pour étudiants en S5
3 pages
Étapes Pour Le Projet
Pas encore d'évaluation
Étapes Pour Le Projet
4 pages
Introduction à l'apprentissage machine
Pas encore d'évaluation
Introduction à l'apprentissage machine
64 pages
Correction de Lactivité 5.1 PDF
Pas encore d'évaluation
Correction de Lactivité 5.1 PDF
2 pages
Formation OpenBuildings Débutant
Pas encore d'évaluation
Formation OpenBuildings Débutant
2 pages
DEDICACE3
Pas encore d'évaluation
DEDICACE3
2 pages
MPLS Et Ses Evolutions
Pas encore d'évaluation
MPLS Et Ses Evolutions
12 pages
Introduction au Shell Unix
Pas encore d'évaluation
Introduction au Shell Unix
65 pages
Phoenix Contact 1085171 FR
Pas encore d'évaluation
Phoenix Contact 1085171 FR
8 pages
Gestion des affaires et livraisons industrielles
Pas encore d'évaluation
Gestion des affaires et livraisons industrielles
2 pages
Fiche de TD1
Pas encore d'évaluation
Fiche de TD1
2 pages
Initiation
Pas encore d'évaluation
Initiation
30 pages
Client Commande Produit Detail
Pas encore d'évaluation
Client Commande Produit Detail
3 pages
Arona Lamine TOP
Pas encore d'évaluation
Arona Lamine TOP
119 pages
Curriculum Vitae - Musasa-2
Pas encore d'évaluation
Curriculum Vitae - Musasa-2
2 pages
Application Programming Interface
Pas encore d'évaluation
Application Programming Interface
2 pages
Exercice CRC
Pas encore d'évaluation
Exercice CRC
1 page
Évolution de la Veille Technologique
Pas encore d'évaluation
Évolution de la Veille Technologique
9 pages
Introduction aux Frameworks Web
Pas encore d'évaluation
Introduction aux Frameworks Web
35 pages
Themes Expose LICENCE 3
Pas encore d'évaluation
Themes Expose LICENCE 3
3 pages
API Schneider PDF
Pas encore d'évaluation
API Schneider PDF
89 pages
Legrand Maroc - Tableau - Electrique - Connecté
Pas encore d'évaluation
Legrand Maroc - Tableau - Electrique - Connecté
20 pages
Codage et Compression de Texte
Pas encore d'évaluation
Codage et Compression de Texte
85 pages
Intégration de fonctionnalités pour KYOWORK
Pas encore d'évaluation
Intégration de fonctionnalités pour KYOWORK
18 pages
Yamaha An1x Mode D Emploi FR 72182
Pas encore d'évaluation
Yamaha An1x Mode D Emploi FR 72182
120 pages
Ingénieur Informatique Junior Créatif
Pas encore d'évaluation
Ingénieur Informatique Junior Créatif
1 page
Maintenance Dépannage PC en Réseau
0% (1)
Maintenance Dépannage PC en Réseau
22 pages
CV Sanogo Ousmane V.1
Pas encore d'évaluation
CV Sanogo Ousmane V.1
1 page
Prix Samsung Note 20 Ultra à Abidjan
Pas encore d'évaluation
Prix Samsung Note 20 Ultra à Abidjan
1 page
Approche et outils en gestion de projet
Pas encore d'évaluation
Approche et outils en gestion de projet
60 pages
Introduction L3 L2I
Pas encore d'évaluation
Introduction L3 L2I
49 pages
Fox X 50 2024.01.15 01.14.47 PDF
Pas encore d'évaluation
Fox X 50 2024.01.15 01.14.47 PDF
1 page
TP de La Geomatique-Qgis
Pas encore d'évaluation
TP de La Geomatique-Qgis
24 pages