CHAPITRE 1 : INTRODUCTION AU ML ET OUTILS D’IA
Le machine Learning ou Apprentissage automatique permet à l'ordinateur d'apprendre à
partir de l'étude de données et de statistiques. L'apprentissage automatique est un pas dans la
direction de l'intelligence artificielle (IA). Machine Learning est un programme qui analyse les
données et apprend à prédire le résultat.
A cet effet une base de données peut être dans l’esprit d’un ordinateur, un ensemble de
données ou une collection de donnée par exemple un tableau ou une base de données complète.
Exemple de tableau :
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Exemple de bases de données :
En regardant le tableau, nous pouvons deviner que la valeur moyenne est probablement
autour de 80 ou 90, et nous sommes également en mesure de déterminer la valeur la plus élevée
et la valeur la plus faible, mais que pouvons-nous faire d'autre ? Et en regardant la base de
données, nous pouvons voir que la couleur la plus populaire est le blanc et que la voiture la plus
âgée a 17 ans, mais que se passerait-il si nous pouvions prédire si une voiture avait un AutoPass,
simplement en regardant les autres valeurs ?
C'est à cela que sert le Machine Learning ! Analyser les données et prédire le résultat.
1. Les types de données
Pour analyser des données, il est important de savoir à quel type de données nous avons
affaire.
Nous pouvons diviser les types de données en trois catégories principales :
➢ Numérique
➢ Catégorique
➢ Ordinal
a. Les données numériques
Les données numériques sont des nombres et peuvent être divisées en deux catégories
numériques :
➢ Données discrètes : nombres limités à des nombres entiers. Exemple : Le nombre de
voitures qui passent.
➢ Données continues : nombres qui ont une valeur infinie. Exemple : Le prix d'un article
ou la taille d'un article
b. Les données catégorielles
Sont des valeurs qui ne peuvent pas être mesurées les unes par rapport aux autres.
Exemple : une valeur de couleur ou toute valeur oui/non.
c. Les données ordinales
Sont comme des données catégorielles, mais peuvent être mesurées les unes par rapport
aux autres. Exemple : notes scolaires où A est meilleur que B et ainsi de suite.
En connaissant le type de données de votre source de données, vous pourrez savoir
quelle technique utiliser lors de leur analyse.
Dans ce Chapitre, nous reviendrons sur les mathématiques et les statistiques d'étude, et
comment calculer des nombres importants basés sur des ensembles de données. Nous
apprendrons également à utiliser divers modules Python pour obtenir les réponses dont nous
avons besoin. Et nous apprendrons comment créer des fonctions capables de prédire le résultat
en fonction de ce que nous avons appris.
2. Régression
Le terme régression est utilisé lorsque vous essayez de trouver la relation entre des
variables. Dans l’apprentissage automatique et dans la modélisation statistique, cette relation
est utilisée pour prédire l’issue d’événements futurs.
2.1. Régression linéaire
La régression linéaire utilise la relation entre les points de données pour tracer une ligne
droite à travers eux tous. Cette ligne peut être utilisée pour prédire les valeurs futures.
Dans l’apprentissage automatique, prédire l’avenir est très important.
Python dispose de méthodes permettant de trouver une relation entre des points de
données et de tracer une ligne de régression linéaire. Nous allons vous montrer comment utiliser
ces méthodes au lieu de passer par la formule mathématique.
Dans l'exemple ci-dessous, l'axe des x représente l'âge et l'axe des y représente la vitesse.
Nous avons enregistré l'âge et la vitesse de 13 voitures alors qu'elles passaient devant un péage.
Voyons si les données que nous avons collectées pourraient être utilisées dans une régression
linéaire :
2.2. Les Arbres de Décision
Un arbre de décision est un organigramme qui peut vous aider à prendre des décisions
en fonction de votre expérience antérieure. Dans l’exemple, une personne essaiera de décider
si elle doit aller à un spectacle comique ou non. Heureusement, notre personne d'exemple s'est
inscrite à chaque fois qu'il y avait un spectacle comique en ville, et a enregistré quelques
informations sur le comédien, et a également indiqué s'il y était allé ou non.
Nous avons un exemple d’arbre de décision :
3. Utilisations de quelques IA
Chatboot de Recherches sur Internet : [Link]
Résumé des livre : Perplexity : [Link]
Discuté avec un pdf de manière résumé :
[Link]
09892&utm_term=talk%20to%20pdf&utm_content=725197320909&device=c&matchtype=b
&network=g&gclid=Cj0KCQiA9667BhDoARIsANnamQbKO4GvGmLCiVpc5fCp1cyzuj4A
LM4shAn9VrG3hwWtvU7vGe2ha0saAglREALw_wcB&gad_source=1
Générer des powerPoint : [Link]
maker?utm_agid=147411783784&creative=619003445242&device=c&placement=&utm_so
urce=google&utm_medium=paid-
search&utm_campaign=&utm_term=&hsa_acc=1088970905&hsa_cam=18195923478&hsa_
grp=147411783784&hsa_ad=619003445242&hsa_src=g&hsa_tgt=dsa-
1729959376722&hsa_kw=&hsa_mt=&hsa_net=adwords&hsa_ver=3&gad_source=1&gclid=
Cj0KCQiA9667BhDoARIsANnamQZJEeFxSmWAEzOzjoGCGoVST8pdU0a6b6VC32B8Zf
fFndPHyyC8bHsaAqLYEALw_wcB