QUESTION DE MACHINE LEARNING
1- C’est quoi le machine learning ?
Le machine learning est une technique d'intelligence artificielle qui permet
aux ordinateurs d'apprendre à partir de données et d'améliorer leurs
performances sur des tâches sans être explicitement programmés.
2- C’est quoi l’IA ? et quelles sont ses applications ?
L'intelligence artificielle (IA) est une branche de l'informatique qui
permet aux machines de simuler des capacités humaines, comme
l'apprentissage, la compréhension et la prise de décision.
Voici quelques applications de l'IA :
• Reconnaissance vocale
• Traitement du langage naturel
• Vision par ordinateur
• Systèmes de recommandation
• Véhicules autonomes
• Chatbots et assistants virtuels
• Diagnostic médical
• Analyse prédictive
• Automatisation des processus
• Jeux vidéo et simulations
3- Les domaines ou techniques de l’IA ?
Voici quelques domaines et techniques de l'intelligence artificielle (IA) :
• Apprentissage automatique (Machine Learning)
• Apprentissage profond (Deep Learning)
• Traitement du langage naturel (NLP)
• Vision par ordinateur
• Systèmes experts
• Robotics
• Raisonnement automatisé
• Planification et optimisation
• Evolution computationnelle
• Traitement d'images
4- Les prérequis de l’IA ?
• Les données (BIG DATA)
• Les algorithmes
• Le cloud computing
5- Différence entre le machine learning et le deep learning ?
Aspect Machine Learning Deep Learning
Sous-catégorie du machine
Technique d'IA permettant
learning qui utilise des
Définition aux machines d'apprendre à
réseaux de neurones
partir de données.
profonds.
Généralement moins Plus complexe, nécessitant
Complexité complexe, utilisant des des architectures de réseaux
algorithmes simples. de neurones.
Fonctionne bien avec des
Efficace avec de grandes
Données ensembles de données plus
quantités de données.
petits.
Moins interprétable,
Souvent plus facile à
Interprétabilité considéré comme une "boîte
interpréter.
noire".
Reconnaissance d'image,
Recommandations,
Applications traitement du langage
classification, régression.
naturel, jeux.
Plus exigeant en termes de
Exigences de Moins gourmand en
puissance de calcul et de
calcul ressources.
mémoire.
6- C’est quoi un agent intélligent ?
Un agent intelligent est un système qui perçoit son environnement, prend
des décisions et agit de manière autonome pour atteindre des objectifs.
7- Quelle est l’approche de l’IA ?
L'approche de l'IA consiste à créer des systèmes capables d'effectuer des
tâches qui nécessitent normalement de l'intelligence humaine. Cela inclut
l'apprentissage à partir de données, la résolution de problèmes et la prise de
décisions. Les techniques utilisées varient, allant du machine learning aux réseaux
de neurones.
8- Différence entre l’approche symbolique et la programmation simple:
L'approche symbolique utilise des règles et des symboles pour représenter
des connaissances et résoudre des problèmes, souvent en imitant la logique
humaine. En revanche, la programmation simple consiste à écrire des
instructions précises que l'ordinateur suit sans interprétation. Alors que
l'approche symbolique se concentre sur la compréhension et le raisonnement, la
programmation simple se concentre sur l'exécution directe de tâches.
9- Donnez les différents types d’apprentissages :
• Apprentissage supervisé : L'algorithme apprend à partir d'un ensemble de
données étiquetées (input-output) pour prédire des résultats sur de
nouvelles données.
• Apprentissage non supervisé : L'algorithme explore des données non
étiquetées pour identifier des motifs ou des structures cachées, comme le
clustering.
• Apprentissage semi-supervisé : Combine des données étiquetées et non
étiquetées pour améliorer l'apprentissage, souvent utilisé lorsque
l'étiquetage est coûteux.
• Apprentissage par renforcement : L'agent apprend à prendre des
décisions en interagissant avec un environnement, en recevant des
récompenses ou des pénalités pour ses actions.
10- Donnez la différence entre un apprentissage sup et un apprentissage
non sup
Aspect Apprentissage Supervisé Apprentissage Non Supervisé
Données étiquetées (input-
Données Données non étiquetées
output)
Découvrir des motifs ou des
Objectif Prédire des résultats
structures
Exemples Classification, régression Clustering, réduction de dimensions
11- Quelle est la différence fondamentale entre une étiquette et une
caractéristique ?
Une étiquette est la variable expliquée, c'est-à-dire la valeur que l'on cherche
à prédire. Une caractéristique est la variable explicative, qui fournit des
informations pour aider à faire cette prédiction.
12- Quelle est la particularité de l’arbre de décision ?
L'arbre de décision se distingue par sa représentation visuelle en forme
d'arbre, où chaque nœud pose une question et chaque branche mène à une décision
ou à un résultat.
13- Qu’est-ce que la prédiction ?
La prédiction est l'estimation d'un résultat futur basée sur des données et des
modèles analytiques.
La prédiction est le processus d'estimation d'un résultat futur ou d'une valeur
inconnue en se basant sur des données existantes et des modèles statistiques ou
d'apprentissage automatique.
14- Qu’est ce qu’un label ?
Un label est une étiquette ou une valeur qui indique la catégorie ou le résultat
associé à une donnée dans un ensemble, souvent utilisée dans des tâches de
classification.
15- Quels sont les 2 concepts clés de l’apprentissage non supervisé ?
• Clustering : Regroupement de données en clusters ou groupes similaires
sans étiquettes préalables.
• Réduction de dimensionnalité : Simplification des données en réduisant
le nombre de variables tout en préservant l'information essentielle.
16- Quels sont les algorithmes utilisés en ANS ?
• K-means
• Hierarchical clustering
• DBSCAN
• PCA (Analyse en Composantes Principales)
• t-SNE (t-distributed Stochastic Neighbor Embedding)
• Autoencoders
17- A quoi sert la fonction K-means ?
La fonction K-means sert à regrouper des données en un nombre prédéfini
de clusters en minimisant les distances entre les points et le centre de leur cluster.
18- Dans le K-means quel est l’argument qui permet de choisir le nombre
de clusters ?
nClusters
19- Les différentes librairies et leurs utilités :
• Scikit-learn : Fournit des outils simples et efficaces pour l'apprentissage
automatique et l'analyse de données.
• TensorFlow : Framework pour construire et entraîner des modèles
d'apprentissage profond.
• Keras : Interface haut niveau pour construire et entraîner des réseaux de
neurones, souvent utilisée avec TensorFlow.
• Pandas : Bibliothèque pour la manipulation et l'analyse de données,
facilitant le travail avec des structures de données.
• NumPy : Fournit des fonctions pour le calcul scientifique et la
manipulation de tableaux multidimensionnels.
• Matplotlib : Bibliothèque pour créer des visualisations graphiques et des
plots en Python.
• Seaborn : Basée sur Matplotlib, elle simplifie la création de visualisations
statistiques attrayantes.