TH8753
TH8753
--Sujet --
Au terme de ce travail, je remercie DIEU Le Tout Puissant qui m’a donné la force et la
vo lonté d’achever mon travail et nous lui rendons grâce.
Le travail de recherche, comme tout autre travail, nécessite de la motivat ion pour être
accompli d’une manière optimale. Pendant mes années de thèse j’ai été motivé, et ce grâce à la
confiance que m’a donné mo n Directeur de thèse. Je tiens à exprimer ma profonde grat itude et
ma sincère reconnaissance à M. FERGANI Belkacem qui m’a encadré durant ces années de
Thèse, pour ces conseils, son aide inest imable et son optimisme contagieux.
Je remercie les membres de jury en co mmençant par M. HOUACINE Amrane qui m’a
fait l’honneur d’accepter de présider ce jury. Aussi je t iens également à remercier les membres du
jury : Mme. FALE K Leila, Mme. HAMMAMI Latifa, M. BENSLAMA Zoubir et M. KENAZA
Tayeb, pour l’honneur qu’ils me font à juger ce travail.
Le travail de recherche n’exclut pas des mo ments difficiles pour des raisons
psycho logiques, administratives, techniques, et autres. Je tiens à remercier mes parents qui ont
veillé à ce que ces mo ments diffic iles so ient les plus courts grâce à leur écoute, encouragement,
affect ion, et aide, sans qui ce travail n’aurait jamais pu vo ir le jour. Je leur dédie ce travail en
témo ignage de ma profonde affect ion pour toute la patience et les sacrifices qu’ils ont consent i
pour moi et dont je serai à jamais redevable, et d’avo ir porté ce travail à terme représente pour
mo i aujourd’hui la plus belle des récompenses.
Enfin, je ne saurais terminer cette liste sans adresser un remerciement particulier à ceux
qui m’ont soutenu dans l’o mbre de prés ou de lo in, mes amis, et toute ma famille.
2
TABLE DES MATIERES
Introduction Générale………………………………………………………………………….. 1
Motivation……………………………………………………………………………………… 2
Objectif de la thèse ……………………………………………………………………………. 3
Contributions……………………………………………………………………………………. 4
Organisation de la thèse………………………………………………………………………... 5
Chapitre I. LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES
HUMAINES…………………………………………………………………………………… 7
І.1. Introduction ………………………………………………………………………………... 7
І.2. Le Contexte……………………………………………......................................................... 8
I.3. Habitats Intelligents pour la Santé (HIS) et les Activité de la Vie Quotidienne (AVQ)… .. 10
І.3.1. Notion de l’Habitat Intelligent pour la Santé (HIS).……………………………….. 10
I.3.2. Etat de l’art des systèmes HIS……………….. ……………..................................... 11
I.3.3. Définition des Activités de la Vie Quotidienne (AVQ) ………………………....... 12
I.4. Technologies d’assistance aux personnes âgées dans une maison intelligente …………… 13
І.4.1. La reconnaissance sonore …………………………………………………………. 14
I.4.2. La reconnaissance à partir de séquences vidéo ……………………………………. 15
І.4.3. Les réseaux de capteurs …………………………………………………………… 16
I.4.4. Avantages et inconvénients des technologies du soutien à domicile ……………... 18
I.5 Les Bases de données pour la RAH…………………….………………………………… 19
I.5.1 Annotation des données …………………………………………………………..... 20
I.5.2. Etude des bases de données………………..……………………………................... 21
I.5.2.1. La base de données TK ……………………………………….……….......... 22
I.5.2.2. La base de données TAP80F ……………………………………………...... 24
I.5.2.3. La base de données OrdonezA ……………………………….………......... 26
I.5.3. Description détaillée des données ………………………………………………….. 26
I.5.3.1. Protocole expérimental ………………………….…………………………. 27
I.5.3.2. Représentation des données (Vecteurs caractéristiques)…………………… 27
I.5.3.3. Pré-traitements des bases de données issues des capteurs binaires ………… 30
I.6. Conclusion…………………………………………………...……………………….......... 34
Chapitre II. METHODES DE CLASSIFICATION POUR LA RAH…………………….. 36
II.1 Introduction ……………………………………………………………………………….. 36
II.2. Etat de l’art des méthodes de classification automatique des activités humaines ……...... 38
II.3. Fonctionnement général des méthodes de classification…………………………………. 40
II.3.1. Principe …………………………………………………………………………… 40
II.3.2. Modèles de Markov cachés (HMM)………………………………………………. 41
II.3.3. Champs Aléatoires Conditionnels (CRF)…………………………………………. 42
II.3.4. k-plus proches voisins (k-NN)…………………………………………………….. 45
II.3.5. Analyse Discriminante Linéaire (LDA)…………………………………………… 46
TABLE DES MATIERES
Tableau I.1- Résumé des études existantes et des types de capteurs mis en œuvre …………... 14
Tableau I.2-Classification des capteurs suivant le type d’informations collectées…………..... 17
Tableau I.3- Réponse au questionnaire sur les habitudes de vie de l’occupant ………….……. 21
Tableau I.4- Informations sur les différentes bases de données ……………………………..... 22
Tableau I.5- Liste des activités annotées pour chaque base de données ainsi que le nombre
d’échantillons de chaque activité (.)…………………………………………………………….. 27
Tableau I.6- Exemple de données enregistrées des capteurs dans un habitat intelligent…….... 30
Tableau II.1- Tableau récapitulatif des travaux selon le type d’activités……………………… 37
Tableau II.2- Noyaux usuels pour les SVM………………………………………………........ 55
Tableau II.3- Matrice de confusion dans le cas multi-classes…………………………………. 62
Tableau II.4- Poids wi de la marge pour la base de données TK26M………………………… 64
Tableau II.5- Poids wi de la marge pour la base de données TK28M………………….…….. 64
Tableau II.6- Poids wi de la marge pour la base de données TK57M………………………… 65
Tableau II.7- Poids wi de la marge pour la base de données Tapia80F ……………………… 65
Tableau II.8- Poids wi de la marge pour la base de données OrdonezA……………………… 65
Tableau II.9- Les résultats de reconnaissance d’activités pour les méthodes de classification
LDA, k-NN, SVM et WSVM. …………………….…………………………………………... 66
Tableau II.10- La matrice de confusion de WSVM pour la base de données TK26M……......
69
Tableau II.11- La matrice de Confusion de WSVM pour la base de données TAP80F. …….
69
Tableau II.12- La matrice de Confusion de WSVM pour la base de données OrdonezA. …..
70
Tableau III.1- Les avantages et inconvénients des méthodes de ré-échantillonnage US, OS et
Smote……………………………………………………………………………………………. 84
Tableau III.2- Les résultats de reconnaissance d’activités pour les méthodes de classification
WSVM, US-SVM, OS-SVM et SMOTE-SVM. ………………………………………………. 94
Tableau III.3- Les résultats de reconnaissance d’activités pour les méthodes de classification
WSVM, PCA-WSVM, et LDA-WSVM. ……………………………………………………… 101
Tableau IV.1- Evaluation des résultats de classification humaine pour toutes approches. Nb
Feat. montre le nombre de caractéristiques PCs, LDs et la concaténation PCs-LDs. ………….. 110
Tableau IV.2- La matrice de confusion de PCA-LDA-HMM pour la base de données 115
TK26M………………………….……………………………………………………………….
5
Liste des tableaux
6
Liste des figures
FigureIV.5- Comparaison des taux de reconnaissance entre les méthodes de classification HMM,
WSVM, PCA-LDA-HMM et PCA-LDA-WSVM pour chaque activité avec la base de données 113
TAP80F……………………………………………………….……………………………………..
10
Liste des acronymes
VS Vecteurs de Support
QP Quadratic problem
ML Machine Learning
KKT Karush-Kuhn-Tucker
RBF Radial Basic Function
OAA One-Against-All
OAO One-Against-One
LIBSVM Library for Support Vector Machines
SMO Sequential Minimal Optimization
TCC Taux de Classification Correcte
TK26M acronyme du nom de l'auteur Tim van Kasteren 26ans Masculin (M)
TK28M L’auteur :Tim Kasteren -28ans -Masculin (M)
TK57M L’auteur :Tim Kasteren -57ans -Masculin (M)
TAP80F L’auteur :Tapia -80 ans -Féminin (F)
VC Validation Croisée
Liste des acronymes
INTRODUCTION GENERALE
1
INTRODUCTION GENERALE
pouvoir être capable de reconnaître automatiquement les activités des occupants et permet leur
assistance à distance d’une manière intelligente.
Motivation
La vaste majorité des travaux existants dans le domaine de reconnaissance d’activités humaines
souffre des problèmes comme la variabilité du comportement usagé, le déséquilibre entre les
différentes classes de données, et le bruit affectant les données issues des réseaux de capteurs
sans fil. Dans cette thèse, nous traiterons deux problématiques. La première est que les ensembles
de données sont généralement déséquilibrés [8, 9], certaines activités sont plus fréquentes que
d’autres. Prenons pour exemple deux activités, ‘Dormir’ se produit généralement une fois par
jour tandis que l’activité ‘Boire’ se fait plusieurs fois par jour mais le nombre d’échantillons
obtenus pour l’activité ‘Dormir’ est plus important que celui de ‘Boire’, ceci s’explique par le
temps d’exécution de chaque activité induisant l’apparition de deux types de classes majoritaire
et minoritaire. Cependant, le système d’apprentissage peut avoir des difficultés à apprendre le
concept lié à la classe minoritaire et, par conséquent, ne pas incorporer la notion de déséquilibre
des classes dont l’évaluation finale peut conduire à des conséquences négatives pour les systèmes
de surveillance. Récemment, le problème du déséquilibre des classes a été reconnu comme un
problème crucial dans les méthodes d’apprentissage [10]. La plupart des classificateurs supposent
une répartition uniforme des classes de données et supposent un coût de mauvais classement égal
pour les différentes classes. De nombreux algorithmes d’apprentissage automatique ont été
évalués pour résoudre le problème du déséquilibre de données, par exemple, C4.5 [11], les
Méthodes à Vecteurs de Support (SVM) [12] et les k-Plus Proches Voisins (k-NN) [11], sans
apporter une réponse définitive et satisfaisante dans le domaine RAH. Par conséquent, nous
devons améliorer les algorithmes existants afin de traiter le problème de données déséquilibrées
et choisir la méthode la plus adaptée à la reconnaissance d’activités humaines.
La deuxième problématique est que le choix des descripteurs (attributs) caractéristiques des
données (dans notre cas issues des réseaux de capteurs placés dans les différents endroits de la
maison intelligente) ne sont pas évidents à priori et s’inscrivent en plus dans la catégorie de
données massives (grande dimension) [13, 14]. Par conséquent, nous devons extraire les
meilleures caractéristiques adaptées à la tâche de classification des activités humaines sans perdre
dans la précision des systèmes de reconnaissance.
2
INTRODUCTION GENERALE
Objectif de la thèse
L’objectif de notre travail est la modélisation du comportement de la personne dans sa propre
maison. Ce qui va permettre la détection des situations à risque ou critiques. L’observation des
habitudes de vie quotidienne d’une personne est un bon indicateur de l’évolution de sa situation
médicale. Dans le cas d’une dégradation de l’état de santé, des répercussions immédiates seront
remarquées dans le comportement et le déroulement des activités, par exemple: effectuer
certaines activités très lentement, diminution du temps des repas ou suppression globale d’une
activité par exemple. Le but de construire un modèle de comportement dans une situation
habituelle est de permettre la détection des situations inhabituelles et donc potentiellement
inquiétantes dans l’habitat intelligent pour la santé.
Plus particulièrement, on a adopté plusieurs approches de modélisation d’AVQ [15, 16, 17, 18]
adaptées aux données issues d’un réseau de capteurs installé dans un habitat intelligent dans un
contexte d’assistance aux personnes âgées. Ces capteurs sont issus de plusieurs types, on cite les
capteurs de contact collés dans les portes, les fenêtres et pour les capteurs de cuisine, comme les
capteurs de pression placés sous les pieds de chaises, du lit, ainsi que les capteurs de données
physiologiques tels que des bracelets portés en permanence par la personne.
Notre but de départ était l’amélioration des algorithmes de classification standards afin de choisir
l’approche la plus adaptée à la reconnaissance d’activités humaines dans un habitat intelligent.
Notre première contribution dans le Chapitre ΙΙ consiste à comparer plusieurs méthodes de
classification supervisées afin de pouvoir sélectionner la plus pertinente en termes de bonne
reconnaissance d’activités humaines. Une autre contribution dans le Chapitre III, consiste à traiter
le problème du déséquilibre de données entre les différentes classes d’activités humaines afin de
réaliser une classification cohérente et non biaisée par certaines activités dominantes. Le
problème de dimensionnalité des données a été aussi traité par l’extraction efficace de bons
attributs. Enfin, dans le chapitre IV, nous avons proposé une nouvelle approche de classification
appelée PCA-LDA-WSVM, qui traite les deux problèmes cités précédemment. Les simulations
ont été présentées et analysées indépendamment dans chaque chapitre afin de mener une
discussion plus cohérente des résultats.
3
INTRODUCTION GENERALE
Contributions
Cette thèse contribue à l’amélioration des performances du classificateur SVM dans le cadre de
reconnaissance des activités humaines. Nous avons comparé différentes méthodes de
classification discriminatives à savoir les Champs Aléatoires Conditionnels (CRF) [7, 15],
l’Analyse Discriminante Linéaire (LDA) [15], k-NN [16], SVM [15] et les Méthodes à Vecteurs
de Support pondérée (WSVM) [17] afin de sélectionner la meilleure approche. Cette recherche a
été valorisée à travers les contributions publiées dans [15, 16, 17, 19].
Nous avons aussi traité le problème du déséquilibre de données entre les différentes classes
d’activités afin d’améliorer les performances de reconnaissance des activités humaines. Les
approches pour aborder le problème des données d'apprentissage déséquilibrées peuvent être
classées en deux grandes catégories principales [10, 19].
Au niveau algorithmique [17, 19] en utilisant les poids affectés pour chaque classe
d’activité qui va permettre de corriger les erreurs d'apprentissage causées par ce
déséquilibre et encourager les algorithmes d’apprentissage à se diriger vers un type de
modèle spécifique plus satisfaisant. On utilisera dans notre travail la méthode de
classification WSVM et nous allons intervenir plus particulièrement au niveau de
l’optimisation du processus d’apprentissage WSVM.
Ensuite, nous avons abordé le problème de dimensionnalité des données issues des réseaux de
capteurs dans l’apprentissage automatique, afin d’extraire les meilleurs attributs pour une bonne
classification des activités humaines. Nous avons utilisé deux approches d’extraction de
caractéristiques à savoir l’Analyse en Composantes Principales (PCA) et l’Analyse Discriminante
Linéaire (LDA).
Une autre contribution consiste en la proposition d’une nouvelle approche évaluée à travers un
article de Journal [22] qui traite à la fois le problème du déséquilibre de données et le problème
de dimensionnalité des données afin d’améliorer les résultats de classification des activités
4
INTRODUCTION GENERALE
humaines. Elle combine les deux méthodes d’extraction de caractéristiques à savoir l’Analyse en
Composantes Principales (PCA) et l’Analyse Discriminante Linéaire (LDA), avec la méthode de
classification appelée Méthode à Vecteurs de Support pondéré (WSVM). La combinaison PCA-
LDA vise à réduire le nombre de caractéristiques tout en augmentant le pouvoir de séparation
entre les classes d’activités. Ensuite la méthode WSVM a pour but de classifier les données
réduites issues de la sortie de l’étage PCA-LDA afin d’éviter le sur-apprentissage causé par les
échantillons des classes d’activités majoritaires et d’obtenir de meilleurs résultats de
classification des activités humaines. L’approche proposée a été testée et validée sur des données
réelles issues de réseaux de capteurs installés dans des habitats intelligents [23, 24, 25].
Organisation de la thèse
La thèse est organisée comme suit :
Le Premier Chapitre présente des généralités sur la reconnaissance d’activités des personnes à
partir du traitement de données collectées par des réseaux de capteurs sans fil. Nous aborderons
dans ce chapitre le problème d’augmentation de la population âgée dans le monde, puis nous
définirons par la suite les Activités de la Vie Quotidienne (AVQ) et ses différents types. Nous
donnerons la définition d’un Habitat Intelligent pour la Santé (HIS). Ensuite, nous présenterons le
système d’informations et de communication de l’HIS, suivi d'une description sommaire des
modules constituant ce système. Enfin, nous donnerons un bref aperçu des bases de signaux réels
utilisés dans nos travaux et qui sont issus de réseaux de capteurs sans fil d’un habitat intelligent
ainsi qu’aux pré-traitements nécessaires réalisés.
Le Deuxième Chapitre aborde la classification des activités humaines qui est le cœur de notre
travail. En premier lieu, il consiste à présenter les différentes méthodes de classification utilisées
dans l’état de l’art. Ensuite, il détaillera les méthodes retenues dans cette thèse, en élaborant un
nouveau principe des Méthodes à Vecteurs de Support pondérée (WSVM). A la fin de ce
chapitre, on étalera les résultats obtenus sur différentes bases de données réelles.
Le Troisième Chapitre expose les deux problèmes rencontrés dans les systèmes RAH, à savoir
le déséquilibre de données présent dans les bases de données et le problème de dimensionnalité
des données issues des réseaux de capteurs installés dans les habitats intelligents. Ensuite il
présentera deux solutions respectives proposées pour traiter ces deux problèmes afin d’améliorer
les performances de classification d’activités humaines et avoir des systèmes RAH plus adaptés.
5
INTRODUCTION GENERALE
6
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
CHAPITRE І : LA RECONNAISSANCE
AUTOMATIQUE DES ACTIVITES HUMAINES
I.1. Introduction
Les personnes en pertes d’autonomie comme les personnes âgées vivant seules à domicile sont
sujettes à plusieurs risques liés au vieillissement à long terme (mauvaise alimentation, perte
d’autonomie, hygiène insuffisante …). Cette croissance n’est probablement pas gérée par les
centres des soins de santé, il est suggéré le maintien à domicile par des résidences assistées, avec
un renforcement de leur sécurité et une amélioration de leur qualité de vie, (voir [26] pour plus de
détails sur les applications de maintien à domicile). Avec l’apparition de ce type de résidences,
toute une réflexion est apparue autour des technologies apportant des réponses pratiques aux
besoins des personnes en perte d’autonomie. Les technologies à base de reconnaissance
d’activités humaines à partir des capteurs sont en plein essor en raison de leur efficacité [27, 28,
29].
On synthétise les champs d’exploration établis dans le domaine de «Maison Intelligente» connue
sous la nomination «Smart Home» dans la Figure I.1 selon différents aspects :
• Personnes en perte d’autonomie, essentiellement les personnes âgées, handicapées et démentes,
• Services, distingués par deux grandes catégories :
- la sécurité des biens et des personnes (surveillance, téléassistance, assistance thérapeutique,
assistance médicale, etc.)
- la gestion du confort, intégrant l’utilisation (multimédia) dans la maison intelligente et le
confort sensoriel (ou des capteurs) (régulation de l’éclairage, gestion énergétique, etc.)
• Bases de données, centralisées ou distribuées (réparties sur plusieurs organismes), stockant
différents types d’informations sur la personne (activités, données physiologiques, traitements
thérapeutiques, etc.),
• Fonctionnalités, par le suivi de trajectoires, l’authentification des personnes, l’identification des
activités ainsi que la communication des informations à un système secondaire ou à un service de
plus haut niveau,
7
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Dans cette partie, nous allons tout d’abord présenter l’objectif de notre travail dans le cadre
d’assistance aux personnes en perte d’autonomie et plus particulièrement pour les personnes
âgées, ce qui nous permettra de comprendre les enjeux et la nécessité des technologies
d’assistance aux personnes âgées. Nous présenterons ensuite les différents types des technologies
d’assistance, le système d’informations et de communication de l’Habitat Intelligent pour la
Santé (HIS), suivi d'une description sommaire des modules constituant ce système. Nous
définissons par la suite les Activités de la Vie Quotidienne (AVQ) et ses différents types. Enfin,
la dernière section sera consacrée à la présentation des différentes bases de données réelles issues
à partir de réseaux de capteurs sans fils.
I.2. Le Contexte
Ces dernières années, les évolutions dans le domaine médical ont entraîné une augmentation de
l’espérance de vie de la population. Une des conséquences de cette augmentation est
l’accroissement de l’âge moyen qui se traduit par le vieillissement de la population. Au début du
21ème siècle, les personnes âgées étaient environ 600 millions dans le monde, soit trois fois plus
8
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
50 ans plus tard. Selon l’ONU, les personnes âgées de 60 ans ou plus représentaient, en 2007,
près du cinquième de la population dans les pays développés et, d’ici à 2050, elles devraient en
constituer le tiers, soit 2 milliards d’individus (Figure I.2). La population mondiale des personnes
âgées croît au rythme de 2% par an, soit beaucoup plus rapidement que la population dans son
ensemble. Dans les 25 ans à venir, elle devrait continuer d’augmenter à un rythme plus rapide
que les autres tranches d’âge. Une croissance aussi rapide exigera dans la plupart des pays des
mesures socio-économiques de grande portée [31].
Figure I.2- Pourcentage de la population âgée de plus de 65 ans (1950-2050), selon l’ONU «
United Nation, population Division ». [31]
Certes, l’allongement de l’espérance de vie de la population est un bienfait mais cela révèle une
multitude de problèmes de caractère individuel et sociétal liés à la qualité de vie des personnes
âgées. En effet, les problèmes de santé deviennent plus nombreux pour les personnes âgées et les
problèmes liés à la perte d’autonomie se multiplient. Le haut risque de chutes et de troubles dans
le comportement, diminue considérablement la qualité de vie des personnes fragiles. Avec les
avancées médicales, l’accès aux soins de maladies chroniques est devenu aisé, alors que les
difficultés liées à la perte d’autonomie restent un problème majeur de santé publique et également
de société. Si nous prenons l’exemple de la France, aux alentours des années 2030, une personne
sur quatre sera concernée par le problème de dépendance. En revanche, l’entrée en établissement
d’hébergement pour les personnes âgées devient de plus en plus difficile en raison du nombre
limité de places disponibles. Dans les années futures, l’écart entre les besoins de prise en charge
des personnes âgées et le nombre de places en établissements deviendra encore plus important,
vu l’accroissement rapide de l’espérance de vie.
9
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Pour diminuer cette pression, le maintien et l’assistance à domicile des personnes âgées, le plus
longtemps possible, semble être une bonne solution. Cela permet, notamment, à la personne
concernée, de préserver au maximum ses liens familiaux et sociaux, de conserver un
environnement familier, et de bénéficier d’un maximum d’indépendance.
Dans ce contexte d’application, un système de suivi et d’analyse des comportements des
personnes âgées encore indépendantes, vivantes seules à leur domicile est plus que nécessaire.
Cela permettra de garantir leur sécurité, d’observer l’évolution de leur niveau de dépendance et
d’émettre une alerte en cas de perte d’autonomie. De plus, il est bien connu que même des
changements subtils dans le comportement des personnes âgées peuvent donner des signes
importants quant à la manifestation ou progression de certaines maladies. Des troubles de
sommeil, par exemple, pourraient être causés par une insuffisance cardiaque ou par des maladies
chroniques. Les changements dans la démarche, d’autre part, peuvent être associés à des signes
précoces de troubles neurologiques liés à plusieurs types de démence. Ces exemples soulignent
l’importance de l’observation en permanence des changements de comportement chez les
personnes âgées afin de détecter une détérioration de la santé avant que celle-ci ne devienne
critique. Nous allons, dans la section suivante, définir l’habitat intelligent proprement dit, ensuite
donner un aperçu sur les différents systèmes d’habitats intelligents, et finalement définir les
différents types d’activités de la vie quotidiennes effectuées par les personnes en perte
d’autonomie.
10
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
figure ci-dessous, met en œuvre une chaîne complète de traitement d'informations allant du
recueil des paramètres initiaux à leur analyse en termes médicaux (diagnostic, évaluation
fonctionnelle, télé surveillance), décisionnels (fusion de données, détection d'alarmes), et de
gestion (droits d’accès, archivage, analyses rétrospectives...).
Figure I.3- Architecture matérielle et logicielle du système distribué HIS du Laboratoire TIMC-
IMAG à la faculté de médecine de Grenoble-France. [35].
Des capteurs ont été disséminés en différents endroits de l’habitat : capteurs de présence (PIR),
tensiomètre, pèse-personne, oxymètre, etc. Ces capteurs ont été reliés, via un réseau local filaire
et non filaire, à un logiciel d’acquisition et de traitement des signaux, lequel est chargé d’analyser
les événements, de surveiller l'évolution des paramètres et de détecter d’éventuelles situations
critiques (chutes, malaise, appels vocaux ). Il communique, par réseau téléphonique ou câblé et
technologies Internet, avec un centre de télévigilance médicalisée chargé de la réception et du
traitement des informations et des alarmes. Plusieurs projets de recherche sur les systèmes
d’habitats intelligents [36], [37], [38], [39] sont lancés à travers le monde afin de favoriser le
maintien à domicile.
11
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
12
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
d'un patient et de discerner le type de soutien dont il aura besoin [41]. Pour résumer, les AVQ
sont un ensemble d'activités qu'une personne normale est censée être en mesure de réaliser pour
être qualifiée comme autonome. On peut distinguer deux types d'AVQ différents : Basique et
Instrumentale [42].
AVQB: Les activités de base de la vie quotidienne sont l'ensemble des activités qui sont
fondamentales et obligatoires pour répondre aux besoins primaires d'une personne. Cela inclut la
capacité de se déplacer, d’aller à la salle de bains, de s’alimenter, etc. Ces activités sont
composées de quelques étapes seulement et ne nécessitent pas une véritable planification.
AVQI: Ce genre d'activités plus complexes est composé d'un plus grand nombre d'étapes et
nécessite une meilleure planification, un bon jugement et implique la manipulation d’objets. Ces
activités sont nécessaires pour vivre de façon autonome et dans la société. Pour une personne,
être capable de réaliser toutes les AVQ instrumentales signifie être relativement autonome. Cette
catégorie comprend les activités telles que la gestion de son argent, le magasinage, l'utilisation
d'un téléphone, prise de médicaments…
Les AVQ instrumentales sont plus complexes que les activités basiques.
Dans la littérature scientifique sur l'assistance technologique à l'intérieur de maisons intelligentes
[43], les chercheurs utilisent généralement les AVQ sans les distinguer. Cependant, la plupart du
temps les recherches se concentrent sur la reconnaissance et l'aide des AVQ instrumentales. La
raison principale est que la personne qui ne peut pas accomplir avec succès une activité de base
aura des besoins en soins plus complets que l'aide apportée par une maison intelligente. Dans la
section suivante, on présentera les différentes technologies permettant le maintien et l’assistance
des personnes âgées à domicile.
13
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Tableau I.1- Résumé des études existantes et des types de capteurs mis en œuvre.
Auteurs Description du système Méthode
Mozer [46] Détecteurs Réseaux de neurones
Williams [47] Détecteurs, contacteurs Analyse simple de données
Barnes [48] Capteurs infrarouges passifs, Modélisation et suivi de mouvement,
Commutateurs magnétique, Analyse des activités,
Contacteurs Utilisation anormale des équipements
14
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
15
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
de vision de la caméra est limité et il est donc très difficile de mesurer une vitesse verticale.
Thome et Miguet [56] intègrent les résultats d’une classification de la position de la silhouette
provenant de plusieurs caméras à l’aide d’une fusion basée sur la logique floue. Rougier et al.
[57] présentent une méthode qui utilise une classification par un modèle de mixture de
gaussiennes appliqué au contour de la personne suivi dans le temps afin de détecter la chute. La
détection de la chute se fait par une méthode de vote majoritaire sur le résultat de chacune des
caméras.
16
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Un capteur RFID pourrait effectuer cette tâche en utilisant des étiquettes RFID placées sur des
objets qui interagissent avec le comportement de la personne. Cette catégorie inclut aussi les
capteurs fixés sur l’ameublement de la maison. Il s’agit, notamment, des capteurs de contact sur
les portes des armoires et des réfrigérateurs qui indiquent qu’elles ont été ouvertes, des capteurs
de pression qui indiquent si une personne est assise dans un lit ou sur une chaise, et des capteurs
17
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
électriques qui indiquent si un poêle a été allumé. Les capteurs environnementaux, appelés aussi :
capteurs de contexte, tels que les capteurs de lumière, les capteurs d’eau et les capteurs de
température permettent de recueillir des informations de contexte sur la scène.
18
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
quotidienne), ont de fortes probabilités d’être acceptés par les personnes âgées et d’être diffusés
largement.
Figure I.4- L’appartement intelligent du WSU avec les capteurs de mouvement (M), de
température (T), d'eau (W), ... [62]
19
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Figure I.5- Une résidente qui exerce une activité de ‘Lavage des mains’ (gauche). Cette activité
déclenche les capteurs de mouvement ainsi que les capteurs de débit d'eau (à droite). [62]
20
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
report en anglais) [5]. Dans cette méthode, les données sont collectées par le biais des
questionnaires ou des interviews avec les usagers. Ces questionnaires comportent entre autres des
questions relatives à la façon dont les usagers se comportent avec le système afin d’atteindre leurs
objectifs. Dans le questionnaire, nous posons des questions sur l’heure habituelle, l’endroit
habituel et la durée de réalisation des AVQ de l’occupant. C’est l’occupant qui répond au
questionnaire. Le tableau I.3 présente la réponse au questionnaire de l’occupant vivant dans un
appartement de la plateforme AILISA [59].
Tableau I.3- Réponse au questionnaire sur les habitudes de vie de l’occupant. [59]
21
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
d’une base de données à l’autre, ainsi que la configuration des capteurs, pour plus de détails voir
le tableau I.4. Le type de capteurs utilisés pour surveiller les utilisateurs a été choisi en
fonction de deux critères principaux: la facilité d'installation et l’intrusion minimale. Les
capteurs utilisés sont : des interrupteurs à lames souples (ou interrupteurs reed) pour détecter
l’état ouvert des portes et des placards, des capteurs de pression pour détecter si le sujet est assis
sur un canapé ou allongé sur son lit, capteurs de contacts en mercure pour détecter le déplacement
des tiroirs, des capteurs infrarouges passifs pour détecter les mouvements dans des endroits
spécifiques, des capteurs de niveau d’eau pour savoir si les toilettes ont été utilisées, et enfin des
capteurs de température pour indiquer l’utilisation de la douche.
22
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
choix de ce RCSF a été fait à cause de son protocole réseau économique en énergie et qui gère
efficacement la communication sans fil, ce qui augmente la durée de vie des batteries de capteurs.
Ce kit de réseaux de capteurs est doté d’un nœud de capteur spécial doté d’une grande puissance
de calcul appelé ‘puits’ (ou sink/station de base) connecté à un PC via une clé USB. Le nœud de
réseau sans fil RFM a une entrée analogique et l’autre numérique.
Figure I.6- Nœud de réseau de capteurs sans fil pour lequel le capteur peut être attaché
[7].
TK26M TK28M
23
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
L’annotation a été réalisée de deux manières en utilisant soit un rapport d’activité écrit sur papier
(manuscrit) ou à l’aide d’une oreillette Bluetooth combinée avec le logiciel de reconnaissance
automatique de la parole. Le début et la fin de chaque activité sont annotés avec des commandes
bien définies. Les classes annotées sont par exemple : Autres activités, Sortir, Dormir, Déjeuner.
Dans le procédé d’annotation Bluetooth, le fournisseur de la base de données a utilisé l’oreillette
Bluetooth de type Jabra BT250v combinée avec un logiciel de reconnaissance de la parole
Microsoft API, (Figure I.8). L’oreillette est rechargée pendant la phase du sommeil. La puissance
de batterie de l’oreillette Bluetooth en veille (standby) est de 300 heures et de 10 heures en mode
activé, ce qui est suffisant pour un jour complet d'annotation.
Figure I.8- Oreillette Bluetooth Jabra BT250v utilisé pour l'annotation [7].
Dans la base de données TK57M l’annotation a été réalisée en utilisant le journal électronique.
Plusieurs feuilles de papier ont été distribuées dans toute la maison à des endroits différents où
les activités sont typiquement effectuées. L’usager lui-même annote sur feuille l'heure de début et
de fin des activités en lisant l’heure sur sa montre. L'avantage de ce procédé est qu'il est très
facile à installer et à utiliser par l’usager. L'inconvénient de cette méthode est qu'elle est
consommatrice en temps pour le traitement des données annotées (c'est-à-dire transcrire les
informations qui se trouvent sur les feuilles de papier vers un ordinateur) et que l’heure affichée
sur la montre de l’usager pourrait légèrement différer des horodatages qui enregistrent les
données des capteurs sur l’ordinateur.
24
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Figure I.9- Plan d’architecture de la maison TAP80F, les points bleus représentent les nœuds de
capteurs sans fil [5].
Les activités ont été annotées par le sujet lui-même en utilisant un Journal électronique (PDA),
comme le montre la figure I.10. Le sujet a reçu des signaux sonores une fois toutes les 60 minutes
pendant 14 jours (la durée de l'étude).
Au signal sonore, le sujet a reçu la série suivante de questions :
On lui a d'abord demandé ‘Que faites-vous au signal sonore (maintenant) ?’
Le sujet choisit l'activité qu'il faisait au moment du signal sonore dans un menu contenant toutes
les activités.
La question suivante était : ‘Pendant combien de temps avez-vous fait cette activité ?’
Le sujet choisit la réponse sur une liste de quatre propositions : moins de 2 minutes, moins de 5
minutes, moins de 10 minutes et plus de 10 minutes.
On lui a alors demandé : ‘faisiez-vous une autre activité avant le signal sonore ?’. Si l'utilisateur a
répondu positivement, la même liste d’activités lui était représentée une autre fois. Au total dix
activités différentes ont été annotées.
Figure I.10- (a). Les capteurs de changement d'état qui peuvent être installés dans
un habitat intelligent. (b) Une capture d'écran à partir de l'outil PDA pour recueillir des données
d’apprentissage sur les activités humaines.
25
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Les activités ont été annotées manuellement par le sujet lui-même en utilisant un Journal
manuscrit. Dix activités différentes ont été annotées, voir le tableau I.5 : On remarque que
l’activité Boire n’est pas présentée dans cette base de données, néanmoins deux activités
supplémentaires ont été incluses par rapport aux autres bases de données, à savoir: ‘Faire sa
toilette’ et ‘Loisir’. Cette dernière activité comprend les activités suivantes : Regarder la
télévision, la lecture ou travailler avec son ordinateur.
26
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Tableau I.5- Liste des activités annotées pour chaque base de données ainsi que le nombre
d’échantillons de chaque activité (.).
TK26M TK28M TK57M TAP80F OrdonezA
Autres- Autres- Autres- Autres- Autres-
activités(4627) activités(5598) activités(2732) activités(17673) activités(1307)
Sortir(17151) Sortir(10835) Dormir (7886)
Sortir(11993) Aux toilettes(630) Aux toilettes
Aux toilettes(380) Aux toilettes(75) Manger(376) Prendre des (173)
Se doucher(265) Se doucher(112) Aux toilettes(243) médicaments(185) Se doucher
Dormir(11601) (121)
Se Brosser les Se doucher(191) Prép. Petit Prép.
Petit-déjeuner(109) dents(41) déjeuné(466) Déjeuner
Se brosser les
Dîner(348) Dormir(6057) Prép. Déjeuner(843) (132)
dents(102) Faire sa
Boire(59) S’habiller(46) Prép. Dîner(506)
Se Raser(67) toilette (154)
Prep. Déjeuner(81) Prép. le Goûter(320) Loisirs (8646)
Dormir(7738)
Prep. Dîner(90) Laver la Sortir (1692)
S’habiller(112)
Boire(12) Vaisselle(328) Petit-
Prendre des
Faire la Regarder TV(717) déjeuner (331)
médicaments(16)
Vaisselle(34) Ecouter de la Goûter (14)
Petit-déjeuner(73)
Dîner(54) musique(1100)
Déjeuner(62)
Petit-déjeuner(143) Dîner(291)
Jouer au piano(492) Goûter(24)
Boire(34)
Se détendre(2435)
Notre but est de déterminer un groupe d’activités que l’on souhaiterait classifier
automatiquement. Dans les différentes bases de données, l’individu a été équipé d’un moyen
d’annotation et a été appelé à entrer dans l’appartement et se comporter comme s’il était dans sa
propre maison. Il lui avait été demandé par la suite d’effectuer au moins une fois chacune des
activités (AVQ) définies précédemment dans le tableau I.5. Il n’y a ni ordre, ni contrainte de
temps pour effectuer ces activités. Les seules conditions requises sont d’effectuer les différentes
activités correctement et pas simultanément afin d’éviter le chevauchement entre les différentes
activités.
27
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
moins une fois dans l'intervalle de temps [t +t], sinon xit 0 . Étant donné un ensemble de n
capteurs, l'observation à l'instant t est donnée par le vecteur binaire x→ (x1t, x 2t ,…, x nt )Tr . Une
activité à l’instant t est donnée par yt avec yt 1,..., N et N est le total nombre des activités
humaines comme Sortir, aller aux toilettes, se doucher, dormir, boire, préparer le dîner, etc. La
tâche de reconnaissance consiste à trouver une correspondance entre une séquence
d’observations x1:T (x 1, x 2 ,…, x T )Tr et une séquence d’étiquettes y1:T (y1, y 2,…, y T )Tr pour une
durée d’acquisition de données T. Par la suite, nous allons également utiliser les notations x et y
en faisant référence à x1:T et y1:T .
Les lectures de capteurs ont donc été divisées en segments de données de longueurs constantes,
Δt=60 secondes, sans chevauchement, voir figure І.12. La durée de cette tranche de temps est
suffisamment longue pour être discriminative et suffisamment courte pour fournir des résultats
précis en matière d'étiquetage. Un vecteur de caractéristiques a été généré pour chaque tranche
de temps. Le vecteur contient une entrée pour chaque capteur, où les valeurs des capteurs
peuvent avoir les valeurs 0 ou 1.
Figure I.12- Relation entre les lectures de capteurs et les intervalles de temps Δt.
Concernant la méthode de test, nous avons utilisé l’approche dite validation croisée (VS) de type
leave one day out [7]. Cette approche consiste à séparer, pour une base de données de n jours,
une journée complète de lectures des capteurs pour le test et les jours restants pour
l’apprentissage. Cette opération est ensuite répétée pour chacun des autres jours, ce qui donne
un nombre d’itérations égal au nombre de jours. A la fin du test, nous obtenons des vecteurs
d’étiquettes pour chaque jour de test. Pour obtenir le vecteur d’étiquettes total des classes
28
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Figure I.13- Les différentes représentations des caractéristiques a) Raw, b) Change Point et c)
Last.[7]
29
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
On a illustré dans le tableau I.6 un exemple d’extrait des données qui peuvent être enregistrées à
partir d’un réseau de capteurs dans un habitat intelligent. On remarque que les états de capteurs
sont binaires ou des valeurs numériques comme dans le cas de capteurs de température,
d’humidité, de pression, etc.
Tableau I.6- Exemple de données enregistrées des capteurs dans un habitat intelligent.
30
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Dans ce qui suit, nous expliquons les traitements réalisés sur les différentes bases de données
pour avoir des données standard utilisables comme entrées aux classificateurs à savoir la matrice
des données de capteurs et les étiquettes de classes correspondantes aux différentes données. Ces
traitements sont similaires pour toutes les bases de données. On choisira la base de données
TK26M [7]. Dans la figure I.14, on visualise les données issues de réseau de capteurs pour une
journée avec les différents attributs (dans notre cas les objets auxquels les capteurs sont installés)
à savoir : Micro ondes, Lave vaisselle, Machines à laver … etc.
Figure I.14- Exemple d’acquisition des données brutes de capteurs installés dans la maison
(Congélateur, Armoire, Micro-ondes …) pour la base de données TK26M.
Ainsi, au cours d'une AVQ comme la préparation d'un repas, en utilisant seulement des capteurs
binaires, ils permettent d’obtenir l’information sur la présence ou l’absence d’une personne dans
la cuisine qui est obtenue par le détecteur de mouvements ou encore l’information de l'ouverture
et la fermeture des armoires avec des capteurs de contact électromagnétiques.
31
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
On constate d’après la figure I.15 qu’il y a deux types d’étiquettes, celles correspondantes aux
différents capteurs installés dans les différents endroits dans la maison et celles des différentes
activités effectuées durant la période d’acquisition. Ci-dessous, on affiche les deux captures
d’écran du codage des étiquettes des capteurs et le codage des étiquettes des activités avec leurs
identificateurs respectifs de la base de données TK26M :
Figure I.15- (a). Une capture d'écran pour le codage des étiquettes de capteurs installés dans
l’habitat intelligent. (b) Une capture d'écran pour le codage des étiquettes d’activités de la vie
quotidiennes.
L’emplacement des capteurs dans la maison modélise chacune des activités humaines. En
voyant, par exemple, une personne à 9h00 se saisir d'une tasse, nous pouvons associer cette
action, avec une certaine certitude, à l'activité ‘Prendre petit déjeuner’. Sept activités ont été
générées. Chaque capteur est représenté par son code. {6} est le modèle de l'activité ‘Prendre une
douche’, {5, 14} ‘Utilisation de toilettes’ {12} ‘Sortir’, {7, 8} ‘Boire’, {1, 8, 9, 17, 23, 13}
‘Préparer les repas’.
Le même emplacement des capteurs posés sur les objets de la maison intelligente peut donner
une information sur deux activités différentes. Si nous revenons à l'exemple cité ci-haut, et que
l'action ‘Prendre une tasse’ était détectée à 22h00, l'activité qui peut se dégager de ces deux
observations ne serait plus ‘Prendre petit déjeuner’ mais plutôt ‘Faire la vaisselle’.
Des modifications sont apportées à cette base de données à l'aide des algorithmes sur MATLAB
selon les étapes suivantes :
32
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
Cette étape consiste à convertir des informations de la base de données TK26M en format texte à
des structures manipulables par MATLAB, cette conversion est comme suit :
-as: Les informations des durées des activités, construites par la syntaxe ‘actstruct’.
-ss: C'est les informations des données d’acquisition de capteurs, construites par la syntaxe
‘sensstruct’.
Figure I.16- Exemple d’extraction du vecteur d’étiquettes des classes. La conversion de ‘as’ en
format texte vers le format Matlab. ID : contient le codage des activités.
Figure I.17- Exemple d’extraction des données de capteurs. La conversion de ‘ss’ en format
texte vers le format Matlab. ID : contient le codage des capteurs.
33
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
On a appliqué un algorithme d’échantillonnage disponible sur le site [23] sur les deux structures
de données ‘as’ et ‘ss’ pour obtenir le vecteur ‘Dates’, le vecteur d'étiquettes des classes ‘Labels’
et les matrices des données de capteurs sous leurs différentes représentations ‘FeatMatRaw’,
‘FeatMatChange’ et ‘FeatMatLast’.
ss
I.6. Conclusion
Dans ce chapitre, nous avons souligné la nécessité de la compréhension et la reconnaissance des
activités humaines. Ensuite, nous avons donné les définitions respectives de l’habitat intelligent
pour la santé (HIS) et les activités de la vie quotidiennes (AVQ) dans le domaine de
reconnaissance d’activités humaines et plus particulièrement des personnes âgées contraintes de
vivre à leur domicile dans des conditions d’autonomie limitée, et nous avons aussi présenté
brièvement un état de l’art sur les différents habitats intelligents pour la santé.
En relation avec notre travail, nous avons focalisé cette reconnaissance sur les activités humaines
(comme boire, manger, dormir ...). Nous avons également abordé le système que sous-entend
cette reconnaissance à savoir le traitement de données centralisées dans un habitat intelligent,
grâce à différentes technologies d’assistance aux personnes âgées à savoir la reconnaissance
sonore, la reconnaissance à partir de séquences vidéo et les capteurs. Nous avons ainsi comparé
ces différents types de technologies et pour chacune, nous avons évalué les avantages et les
inconvénients. Dans notre travail, nous nous sommes focalisés sur les bases de données issues
d’un réseau de capteurs sans fil. Par la suite, nous avons présenté les différentes bases de données
utilisées dans nos travaux afin de mener à bien nos simulations. Nous avons aussi présenté la
34
CHAPITRE I : LA RECONNAISSANCE AUTOMATIQUE DES ACTIVITES HUMAINES
procédure de traitements nécessaires pour extraire la matrice des données de capteurs et les
étiquettes d’activités correspondantes, qui seront utilisées ensuite comme entrées aux
classificateurs. Nous avons utilisé plusieurs jeux de données provenant de plusieurs habitats
intelligents.
Notre objectif est de s’assurer que notre modèle de classification fonctionne quel que soit le type
de capteurs utilisé et la complexité des activités réalisées. Cela nous permet aussi de valider le
pouvoir discriminant de notre modèle. Le tableau I.5 discuté dans la section (I.5.3) a permis de
présenter les détails de chaque ensemble de données utilisé dans nos simulations. Ainsi, ce
tableau a présenté les distributions des activités pour chaque base de données. Ces distributions
nous donnent une idée très claire sur la fréquence de chaque classe d’activité dans chaque base de
données, d’où l’apparition de la notion du déséquilibre de données. Au cours du prochain
chapitre, nous aborderons la notion de classification de données et les méthodes de classification
utilisées pour permettre la prédiction automatique des AVQs
35
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
CHAPITRE ІІ : METHODES DE
CLASSIFICATION POUR LA RAH
II.1. Introduction
36
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Tableau II.1- Tableau récapitulatif des travaux selon le type d’activités. [74]
Activités Réf Activités reconnues Type de Technique Limites
lassification d’apprentissage
[65] Les AVQ : )Annotation manuelle
garder TV, Lire, écouter la musique Supervisée Réseau Bayésien des données
dynamique 2) activités simples
Assis/ [75] Les activités Marcher, assis, courir, Ne prend pas le temps
Supervisée Arbre de décision
Debout/ Regarder TV, lire des activités
Marcher/ 2)Ne gère pas le bruit
Courir/
Lire/Dormir
37
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
38
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
activités quotidiennes telles que dormir, manger en intégrant les connaissances à priori et les
performances de classification ont été améliorées par l'utilisation de l’information temporelle
[89].
Une autre approche consiste à modéliser les activités par modèles de Markov cachés (HMM)
[90]. Plusieurs variantes permettent plus de souplesse dans l’ordre des séquences (on cite : les
HMM hiérarchiques [91]) ou par la modélisation de la durée des activités [90]. Cependant,
malgré les bonnes performances obtenues avec ces modèles, ils nécessitent beaucoup de données
d’apprentissage, données qui sont très rares dans le domaine de l’assistance à domicile. De plus,
il reste difficile d’intégrer des connaissances à priori dans ces modèles probabilistes. Une
nouvelle méthode utilisant les réseaux logiques de Markov (MLN) a été appliquée à ce domaine
[92]. Ceci présente de multiples avantages : le modèle est défini dans un langage logique formel
qui le rend facilement vérifiable et réutilisable, l’incertitude est prise en compte de manière
systématique, et enfin l’apprentissage du modèle permet l’insertion aisée de connaissances à
priori.
Les performances du classificateur appelé les modèles de Markov cachés (HMM) et les champs
aléatoires conditionnels (CRF) ont été aussi comparés pour la reconnaissance des d’activités
humaines [68]. Dans [15], la comparaison des méthodes à vecteurs de support à marge molle (C-
SVM), CRF et l’Analyse Discriminante Linaire (LDA) a été réalisée pour reconnaitre les AVQ,
où C-SVM est trouvé supérieur en termes de bonne classification par rapport aux classificateurs
CRF et LDA, tandis que les classificateurs CRF et SVM sont trouvés sensibles à la classe
dominante dans la base de données. D’autres solutions prometteuses comme celle de Jakkula &
al. [61] et de Moutacalli & al. [93] commencent de plus en plus à être exploitées sérieusement par
de nombreux scientifiques. Ces approches appliquent des techniques d'exploration de données
pour apprendre les comportements, les habitudes et les routines.
Nous avons pu constater que les approches supervisées ont pris de l’ampleur et sont largement
utilisées dans ce domaine. Dans cette section du chapitre, nous avons présenté brièvement les
différentes approches utilisées dans notre travail pour la modélisation du comportement de
l’usager à savoir : Les modèles de Markov cachées (HMM), les Champs Aléatoires Conditionnels
(CRF), les k-plus proches voisins (k-NN), L’Analyse Discriminante Linaire (LDA), les Méthodes
à Vecteurs de Support (SVM) et les Méthodes à Vecteurs de Support Pondérée (WSVM); ces
derniers seront présentés en détails. Nous avons choisi ces classificateurs, de part leur fiabilité et
39
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
leur fondement théorique très solide dans différents domaines de l’apprentissage automatique des
données. Les méthodes HMM et CRF ont été prises comme méthodes de référence [68].
Figure II.1- Schéma général de système de classification d’activités humaines dans une maison
intelligente.
40
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Notons que les sorties du modèle HMM satisfont la propriété de Markov : étant donné un état Yt,
l’observation Xt est indépendante de tous les états et de toutes les observations à toutes les autres
tranches de temps [72]. La probabilité jointe d’une séquence d’états et observations peut être
écrite dans un modèle HMM de la façon suivante :
T
P(Y1 : T , X 1 : T ) P(Y1)(X 1 | Y1) P(Yt | Yt1)P( X t | Yt ) (II.1)
t2
Les notations Y1:T et X1:T sont utilisées pour signifier Y1, Y2, ..., YT et X1, X2, ..., XT respectivement.
41
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Généralement, les auteurs utilisent l'algorithme de Baum-Welch Baum et al. [94], Welch [95]
pour entrainer le système, et l'algorithme de Viterbi [96] pour déterminer la séquence la plus
probable à partir des observations. Lorsque l'on utilise un HMM par action, reconnaitre cette
action revient à trouver la chaîne de Markov qui génère la séquence observée avec la plus grande
probabilité.
[72]) :
42
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
conditionnelle. Pour différents domaines, les CRFs ont montré leur supériorité par rapport aux
modèles génératifs, tels que les HMMs traditionnellement utilisés pour ce genre de problème. Le
principal avantage des CRF est leur capacité à modéliser directement une probabilité
discriminante de l’étiquetage sachant les observations alors que les modèles génératifs sont
amenés à résoudre un problème plus difficile que le problème original : apprendre une probabilité
jointe plutôt que d’apprendre la probabilité de l’étiquetage sachant les données observées. Ces
modèles conditionnels permettent aussi de relaxer les hypothèses d’indépendance conditionnelle
des observations.
Supposons une séquence d’entrée discrète X = {x1, x2, ..., xT} ainsi qu’une séquence de labels
(étiquettes) à prédire Y = {y1, y2, ..., yT}. Les modèles graphiques non orientés, dont CRF est un
cas particulier, peuvent être définis comme suit : Soit G = (V, E) un graphe non dirigé ou V est
l’ensemble des nœuds et E l’ensemble des arcs. Chaque nœud ν V est associé à une variable
aléatoire yν dans Y. Ce graphe est appelé graphe d’indépendance. On dit que (X, Y) est un champ
aléatoire conditionnel si chaque variable aléatoire yν respecte la propriété de Markov suivante :
Ou w ~ ν signifie que w et ν sont voisins dans G. Ainsi, chaque variable aléatoire yν ne dépend
Ou C est l’ensemble des cliques de G et Z(X) est un terme de normalisation défini comme suit :
Pour les CRF, Lafferty [97] ont propose de définir la forme de ces fonctions de potentiel comme
l’exponentielle d’une somme pondérée de fonctions f k appelées « primitives » du modèle :
43
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
ψc ( yc ,X) exp( λk fk ( yc , X, c)
k
(II.8)
Les k étant les poids associés à chacune de ces fonctions de primitives. Ainsi, les CRFs sont
définis avec différents niveaux de dépendances simples et complexes. Dans notre travail, on
définit le cas des dépendances simples comme l’illustre la figure II.3.
Dans le cas de la structure de dépendance la plus simple (Figure II.3), il existe deux types de
cliques :
Les cliques locales qui relient l’observation xt à son étiquette yt pour lesquelles nous notons les
fonctions de potentiel s.
Les cliques de transition qui connectent deux étiquettes successives yt-1 et yt pour lesquelles nous
notons les fonctions de potentiel g .
La probabilité conditionnelle de séquence de labels peut donc s’exprimer par l’équation suivante
:
1
P(Y X) exp σ k g k (yt 1 , yt , x, t) μk sk (yt , x, t) (II.9)
Z(X)
t,k t,k
où µ et σ sont les vecteurs de poids relatifs aux fonctions de potentiel s et g. Ces paramètres sont
estimés lors de la phase d’apprentissage du modèle.
44
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Pour la phase de test, la solution consiste à trouver la séquence d’étiquettes Y* qui maximise la
probabilité P(Y X) . La recherche de la séquence optimale Y est réalisée par un algorithme de
Figure II.4- Décision par 1-NN (cercle pointillé) et 3-NN (cercle en trait plein) sur un ensemble
d’observations appartenant à 2 classes.
Cette méthode n’a pas réellement de phase d’apprentissage, c’est-à-dire qu’il n’y a pas de
construction de modèle. Tout repose sur :
- Une mesure de distance, c’est-à-dire la fonction noyau. Parmi les distances les plus souvent
utilisées, on peut citer la distance euclidienne, cependant, en fonction du problème, on peut
également utiliser les distances de Hamming, de Mahalanobis, etc.
45
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
d’être moins sensible aux erreurs d’apprentissage, mais dans le même temps les k plus proches
voisins doivent rester très proches de y pour que les approximations soient fiables. Par suite, il est
nécessaire de réaliser un compromis, en choisissant une valeur de k plus petite que le nombre de
d’observations m. Cette méthode a l’avantage de pouvoir s’appliquer à des cas de discrimination
faisant intervenir un nombre élevé de classes.
Les défauts de ces algorithmes simples sont d’une part le besoin de garder en mémoire les
données d’apprentissage et d’autre part la nécessité de calculer les distances à tous les points
d’apprentissage. Ils sont donc fort consommateur en espace mémoire et en temps de calcul. En
plus, si les données d’apprentissage ne couvrent pas suffisamment les classes à étudier, les
performances du classificateur se dégradent rapidement.
Notons Y la variable à prédire, elle prend ses valeurs dans l’ensemble y1 ,..., y N des classes.
Nous définissons k les centres de gravité des nuages de points conditionnels et k la matrice
de variance-covariance de chaque classe :
mk
x
1
k i (II.11)
mk i 1
46
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
L’objectif est de produire une règle d’affectation X (w) Y (w) qui permet de prédire, pour une
observation w donnée, sa valeur associée de Y à partir des valeurs prises par X. La règle
Bayésienne consiste à produire une estimation de la probabilité a posteriori d’affectation.
P(Y yk ) P( X | Y yk )
P(Y yk | X ) k
(II.13)
P(Y y ) P( X | Y y )
i 1
i i
mk
P(Y yk ) N
(II.15)
m
j 1
j
47
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Nous attribuons le nouveau vecteur de caractéristique qui doit être classé w à yk utilisant la
fonction discriminante linéaire D(Y yk , X ) . La règle de classification est donnée dans
l'équation ci-dessous :
La règle de classification pour LDA est très intuitive. Cette méthode nécessite une phase
d'apprentissage, c'est à dire le calcul des fonctions discriminantes et leurs paramètres. Les
données nouvelles w peuvent être classifiées simplement en résolvant la fonction discriminante
appropriée pour chaque classe yk et l'application de la règle de classification.
ІI.3.6.1. Introduction
Ces méthodes de classification sont apparues qu’en 1995 avec Cortes et al. [73]. Elles sont issues
de la théorie de l’apprentissage statistique [71], qui définit un cadre théorique. Les SVM affichent
pour des applications pratiques de très bonnes performances, et leur succès est dû à l’utilisation
de fonctions noyaux pour transformer le SVM en algorithme non-linéaire pouvant être appliqué
sur des données variées. Ces classificateurs biclasses sont connus pour offrir de bonnes capacités
de généralisation, même lorsque la dimension des vecteurs à traiter est grande.
48
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
f (x) w , x b
(IІ.20)
n
w x b
i 1
i i
(II.21)
n
où w IR et b IR sont des paramètres à estimer de la fonction de décision.
Pour décider à quelle catégorie une donnée appartienne ~ x , il suffit de prendre le signe de la
fonction de décision : y sgn( f ( ~
x )). Géométriquement, cela revient à considérer un hyperplan
qui est le lieu des points x satisfaisant w, x b 0 . En orientant l’hyperplan (C.à.d., en fixant
un coté pour lequel les données sont classées positivement), la règle de décision consiste à
observer de quel coté de l’hyperplan se trouve la donnée ~
x . La figure II.5 représente la situation
dans IR2 (espace d’attributs).
49
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
→ →
On voit que le vecteur w définit la pente de l’hyperplan : w est perpendiculaire à l’hyperplan. Le
terme b quant à lui permet de translater l’hyperplan parallèlement à lui-même. Deux remarques à
propos de la figure ІI.5. Il est facile d’imaginer deux nuages de points tels qu’aucune droite ne
sépare les motifs ronds des croix. On dit dans ce cas que les données sont non-séparables. Nous
nous limitons pour l’instant au cas séparable. La deuxième remarque est que les droites qui
séparent les motifs ronds des croix ne sont pas équivalentes du point de vue de la qualité de
prédiction qui leur est associée.
Les motifs situés sur les lignes canoniques sont les vecteurs supports (VS) d’où l’appellation de
la méthode d’apprentissage. Nous allons voir après que ces vecteurs sont les points représentatifs
de toute la masse de données des deux classes.
50
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Figure II.7- Sur et sous-apprentissage des données, avec le modèle quadratique est le plus
adapté.
Maintenant que nous avons défini les notions de marges et d’hyperplans canoniques, nous
pouvons formuler un problème d’optimisation mathématique tel que sa solution nous fournisse
l’hyperplan optimal (maximisant la marge) :
1
max wIR ,bIR w
2
Pour maximiser la marge, il faut donc minimiser w . Par la suite, nous chercherons au fait à
2
minimiser (1/ 2). w , pour simplifier les calculs. Le problème peut se transformer sous la
yi ( w, xi b) 1 i i 1...m
Tel que
i 0 i 1...m
51
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
La constante C est souvent appelée la constante de trade-off (compromis), parce qu’elle permet
d’indiquer l’importance que nous accordons aux erreurs commises sur le training set par rapport
au fait de maximiser la marge. Si on sait que les données d’apprentissage sont très bruitées, on
accordera davantage d’importance à la marge en utilisant un paramètre C petit. Par contre, si
l’intérêt se porte plutôt sur les résultats obtenus sur le training set, on utilisera un paramètre C de
grande valeur. Plus est grand, plus nous pénalisons les mauvaises classifications et la complexité
de la classe des fonctions de décision sera plus grande.
Figure II.8- La distance séparant un outlier et l’hyperplan canonique est : i
.
w
La formulation du problème que nous avons présenté est souvent reprise sous la dénomination de
marge douce (soft margin) dans la littérature. Il s’agit d’un problème d’optimisation quadratique
(QP1) sous contraintes linéaires dont la fonction objective (І.6) est à minimiser. Dans cette
formulation, les variables à fixer sont les composantes wi et b, donc QP1 implique le réglage de
n+1 paramètres (n étant la dimension de l’espace d’entrée plus la dimension du scalaire b). En
gardant cette formulation telle quelle, nous soufrons du même problème que les méthodes
classiques du ML (overfitting). Pour éviter cela, il est nécessaire d’introduire une formulation
dite duale du problème. Pour dualiser QP1, nous devons former ce que nous appelons le
Lagrangien.
A partir de quoi nous pouvons formuler le problème dual :
Maximiser W ( ) 1 y y x , x
m m
(IІ.24)
QP2 :
i1
i
2
i j i j i j
i, j
52
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
m
i yi 0
Tel que i1
i 0 i 1...m
Les variables duales i sont appelées multiplicateurs de Lagrange, une pour chaque point de
donnée. C’est une forme d’optimisation quadratique de dimension m bien étudiée, pour laquelle
il existe de bons algorithmes d’optimisation. Et, ce qui est important, il est connu que les
problèmes de ce type ont des optima globaux uniques. Ce qui signifie, qu’il devrait y avoir un
seul ensemble de i qui maximise la valeur de W.
La résolution du dual permet donc de calculer la fonction de l’hyperplan. Nous avons à présent
tous les éléments nécessaires pour exprimer la fonction décision de notre classificateur
m
f (x) i yi x, xi b (II.25)
i1
La solution de l’hyperplan ne requiert que le calcul des produits scalaires entre les vecteurs de
l’espace d’entrée et un nombre réduit de points : les vecteurs supports.
L’idée retenue dans SVM va dans un autre sens : on va tenter de trouver une projection
(mapping) de l’espace d’entrée vers un autre espace, dit transformé ou espace des caractéristiques
(feature space), dans lequel les données sont linéairement séparables. La figure IІ.9 donne une
représentation imagée de ce genre de mapping. La dimension du feature space est généralement
très élevée. Nous noterons le feature space F, et le mapping vers cet espace : : X F .
Ce processus de projection des données dans l’espace induit par le noyau est équivalent à une
extraction de caractéristiques systématique sur les données d’entrée.
53
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Notons une transformation non linéaire de l’espace d’entrée X vers l’espace des
caractéristiques. On remplace x par (x) partout. Le problème dual d’optimisation devient :
m
i yi 0
Tel que i1
0 i 1...m
i
L’équation de l’hyperplan séparateur dans le nouvel espace est alors :
m
où les coefficients i et b sont obtenus comme précédemment par résolution du problème dual.
En effet, il existe des fonctions bilinéaires symétriques définies positives k (xi , x j ) appelées
fonctions Noyaux, facile à calculer et dont il a été montré dans [2], qu’elles correspondent à un
produit scalaire dans un espace de grande dimension. Lorsqu’une telle correspondance est
exploitable, le problème d’optimisation est équivalent au problème suivant :
m i 1 y i y ji j k(x i , x j )
m
m
i yi 0
Tel que i1
C i 0 i 1...m
f (x) i yi k(x, xi ) b
i1
(ІI.29)
Avec mc le nombre de points support.
Donc, tout algorithme à produit scalaire (linéaire) peut être noyauté (non linéaire) en remplaçant
.,. par k (., .) . Néanmoins, ce dernier devra remplir certaines conditions appelée les conditions
de Mercer [100].
54
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Nous présentons dans le tableau IІ.2 quelques familles de fonctions noyaux usuels paramétrables
qui vérifient cette condition.
Une liste plus complète de noyaux de Mercer peut être consultée dans [73]. Le choix du noyau
RBF est souvent recommandé. En effet, il correspond à un meilleur “éclatement” des données.
Une autre raison est le faible nombre de paramètres à régler pour le RBF, qui influe dans la
complexité du modèle, où sigma est la déviation standard de la gaussienne.
Tableau II.2- Noyaux usuels pour les SVM.
Les valeurs des hyper-paramètres (σ, C) jouent un rôle très important dans la maximisation de la
marge. La maximisation de celle-ci dans le SVM est une procédure de sélection des hyper-
paramètres implicite à l’apprentissage, qui permet de minimiser l’erreur d’apprentissage tout en
réduisant la complexité du classificateur.
55
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Afin d’éviter le sur-apprentissage, le classificateur choisi est à son tour évalué sur un ensemble de
test indépendant. Cependant, en pratique, nous ne disposons pas toujours d’un nombre suffisant
de données étiquetées pour s’en réserver une partie pour la sélection de modèle. Dans ce cas, on
utilise ceux que l’on appelle la Validation Croisée (Cross Validation) k-fold qui consiste à
diviser l’ensemble de données en K partitions distinctes de taille approximativement égale pour
en utiliser k−1 partitions pour l’apprentissage et la dernière pour évaluer la performance du
classificateur. A chaque test de validation, les paramètres (σ, C) changent suivant une grille
prédéfinie des valeurs les plus probables Grid search method. La procédure se répète k fois. On
note que cette procédure est appelée Leave-one-out dans le cas ou k = n.
Ex : pour k=4 :
56
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
chapitre. Nous avons utilisé dans ce mémoire la méthode développée par [101] qui s’appelle
SVM pondéré pour résoudre le problème de déséquilibre des données au niveau algorithmique.
L’idée générale de la méthode SVM pondérée (WSVM) est de changer la fonction de coût SVM
pour entrainer le classificateur. Des poids sont affectés aux erreurs de chaque classe d’activité
humaine du au déséquilibre de données. Exemple : il est possible de réaliser un bon taux de
classification total en affectant simplement tous les échantillons à la classe majoritaire (des
observations positives). Ceci donne une classe minoritaire (des observations négatives) mal
classée (erreur de classification). Ce déséquilibre entres les différentes clases d’activités, tends
généralement à favoriser la classe dite majoritaire. L’ajustement des paramètres de régularisation
pour les différentes classes, aboutit à une amélioration de la précision de classification des classes
minoritaires, voir figure ci-dessous.
Cette méthode modifie la fonction d’optimisation primaire de SVM en assignant deux paramètres
de cout différents C- et C+, respectivement pour la classe minoritaire et majoritaire comme donné
dans l’équation suivante :
m m
min 1/ 2 K(w, w) C i C i
w,b,ξ di 1 di 1 (II.30)
Tel que : y (wT(x ) b) 1 , 0, i 1,..., m
i i i i
La formulation duale de WSVM donne le même Lagrangien comme dans SVM original en
(IІ.24), mais avec différentes contraintes sur αi comme suit:
1
max m m m y y K (x , x ) (II.31)
j 1 i j i j
i1 i i1 i j
i 2
57
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Où les i et i sont les multiplicateurs de Lagrange pour les données positives et négatives
respectivement. Le problème d’optimisation dual WSVM peut être résolu de la même manière
que la résolution du problème d’optimisation dual SVM.
En utilisant NBSV+ et NBSV- pour indiquer le nombre des vecteurs de support limite qui
appartiennent à la classe respectivement positive et négative. On utilise aussi NSV+ et NSV- pour
indiquer le nombre des vecteurs de support qui appartiennent à la classe respectivement positive
et négative. Selon la contrainte dans l’équation (II.31), nous pouvons voir que :
m
i d i i i 0 (II.32)
i1 di 1 di 1
En raison des vecteurs support qui se trouvent sur les frontières de discrimination WSVM, on
aura i C , quand le nombre est NBSV+ et on aura NBSVC i
di1
Cependant, parce que la valeur maximale des multiplicateurs de Lagrange i pour les vecteurs
supports qui se trouvent sur les frontières de discrimination est C, on aura NSVC i
di 1
Lorsque le paramètre de coût C est pondéré, Huang et al. [101] ont mis en avant un WSVM dont
les coefficients de coût sont tels que:
C C w
(II.35)
C C w- (II.36)
58
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
NBSV A N
SV
m C.w.m m
(II.37)
NBSV A N
SV (II.38)
m C.w.m m
Afin d'obtenir le même taux d'erreur pour les deux classes, nous considérons
A A
. Nous pouvons obtenir la relation suivante
C.w .m C.w.m
w w
(II.39)
m m
Par l'introduction (II.35) et (II.36) dans l'équation (II.39), nous obtenons la solution suivante:
C m (II.40)
C- m
Plusieurs auteurs [101], [102] ont proposé d’ajuster différents paramètres de coûts pour résoudre
le problème de déséquilibre de données et par conséquent diminuer la mauvaise classification des
données des classes minoritaires. Veropoulos et al. [102] ont proposé d'augmenter le coût associé
à la classe minoritaire (c'est-à-dire C C ) pour obtenir une plus grande marge sur le côté de la
classe minoritaire. Cependant, ils ne suggèrent pas des lignes directrices pour choisir les valeurs
optimales des paramètres de cout. Dans [16], [17], nous avons implémenté un algorithme SVM
pondéré qui affecte à chaque classe d’activité un paramètre de cout Ci choisi sur la base de la
proportion des données des différentes classes. En prenant C- = Ci, m et mi sont respectivement
le nombre d’échantillons de la classe majoritaire et le nombre d’échantillons de la ith classe. Nous
obtenons la valeur du paramètre de cout Ci pour chaque activité par :
59
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
La formulation duale de WSVM donne le même Lagrangien comme dans la formulation du SVM
60
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Cela est du, d’une part, au nombre limité de données utilisées pour entrainer chaque hyperplan, et
d’autre part, à la simplicité des problèmes à résoudre. En effet, chaque deux classes prises à part
sont moins chevauchées que toutes les classes. La structure de la méthode WSVM multi-classes
utilisant l’approche un-contre-un est visualisée dans la figure II.12.
61
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
62
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
d’une classe réelle (ou de référence). Un des intérêts de la matrice de confusion est qu’elle
montre clairement si le système parvient à classifier correctement les données.
La matrice de confusion est un outil servant à mesurer la qualité d’un système de classification.
C’est est un tableau à double entrée. Chaque colonne de la matrice représente le nombre
d’occurrences d’une classe estimée, tandis que chaque ligne représente le nombre d’occurrences
d’une classe réelle (ou de référence). Un des intérêts de la matrice de confusion est qu’elle
montre clairement si le système parvient à classifier correctement les données.
Classes prédites
1 2 3
1 TP1 e12 e13 NG1
Classes
2 e21 TP2 e23 NG2
réelles
3 e31 e32 TP3 NG3
NI1 NI2 NI3 Total
TPi
Rappel 1 N 100% (II.44)
N i 1 NG i
N TP
TCC i1 i 100% (II.45)
Total
(12 ).Precision.Rappel
F Mesure 100% (II.46)
2 * Precision Rappel
63
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
2.Precision.Rappel
F Mesure 100% (II.47)
Precision Rappel
avec N : est le nombre de classes et Total : est le nombre d’échantillons à classer tel que :
N
Total NG
i 1
i
(II.48)
Le F-mesure sera notre premier critère d’évaluation car il met en évidence le problème des
données déséquilibrées contrairement au taux de classification correcte qui donne le taux global
de classification. Même si le taux de classification correcte est la manière typique pour évaluer
les performances d’un classificateur, il n’est pas toujours la meilleure mesure pour évaluer les
classificateurs des activités humaines parce que l’ensemble de données contiendra des classes
dominantes qui apparaissent plus fréquemment que d'autres. Par exemple, dans l'ensemble de
données et dans le cas binaire de deux classes Boire et Dormir, si le nombre d’échantillons total
de l’activité Boire est 59 et 11601 pour l’activité Dormir. Le classificateur SVM classe
parfaitement seulement la classe Dormir avec TCC=99.5% tandis que le Rappel, la Précision et
F-Mesure ne vont pas dépasser les 50%. Donc, s’il y a des classes d’activités majoritaires bien
classifiées, le TCC sera élevé même si les classes minoritaires ont été mal classifiées. D’où F-
mesure sera notre premier critère d’évaluation car il met en évidence le problème des données
déséquilibrées contrairement au taux de classification correcte qui donne le taux global de
classification sans tenir compte des activités minoritaires.
II.4.2. Résultats
- Sélection du modèle
Toutes les méthodes de classification ont été testées sous l’environnement MATLAB. La
méthode SVM est testée en utilisant la bibliothèque LIBSVM [103]. Dans nos expérimentations,
nous avons optimisé les hyper-paramètres SVM (σopt, Copt) respectivement dans les gammes [0.1
– 2.0] et [0.1 - 100] à l’aide de la méthode de validation croisée pour les bases de données
TK26M, TK28M, TK57M, TAP80F et OrdonezA. Nous avons obtenu (σopt, Copt)= (1.7, 1), (1.5,
1), (2.0, 1), (1.2, 1) et (1.3, 5) respectivement pour les bases de données TK26M, TK28M,
TK57M, TAP80F et OrdonezA. Pour la méthode de classification WSVM, nous utiliserons le
64
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
critère de l’équation (II.41) comme c’est mentionné dans les tableaux ci dessous. Ces valeurs sont
données pour la première itération de la méthode de validation croisée appelée Leave one day
out.
65
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Petit-
Sortir Goûter
déjeuner
5 27 610
Nous résumons dans le tableau II.9 les performances de classifications en termes de TCC, rappel,
de précision, F-mesure obtenus avec les méthodes LDA, k-NN, SVM, et WSVM sur les cinq
bases de données réelles TK26M, TK28M, TK57M, TAP80F et OrdonezA. Nous remarquons
dans ce tableau en termes de F-mesure que la méthode de classification WSVM est supérieure
par rapport aux autres approches pour toutes les bases de données, à l’exception de la base
TK57M où WSVM est légèrement inferieur par rapport à LDA. Cette dernière méthode vient en
deuxième rang en termes de bonnes performances de classification et surpasse les autres
méthodes de classification à savoir k-NN et SVM pour la plupart des bases de données.
Nous reportons dans les figures II.13, II.14, II.15 le taux de classification de chaque activité en
utilisant les algorithmes LDA, k-NN, SVM et WSVM pour les bases de données TK26M,
TAP80F et OrdonezA. A première vue dans la figure II.13, on remarque que les meilleurs
résultats de classification sont obtenus avec les activités majoritaires Sortir et Dormir pour toute
les méthodes de classification. Nous pouvons tout de suite constater que les classes minoritaires
(Aux toilettes, Se doucher, et les activités de cuisine : Petit-déjeuner, Dîner et Boire) classifiées
avec WSVM ont été généralement bien reconnues comparativement aux autres méthodes de
classification. Cependant, l’activité Autres-activités a été bien reconnue avec la méthode SVM.
En outre, les activités de cuisine sont en général difficiles à reconnaitre par rapport aux autres
activités.
Tableau II.9- Les résultats de reconnaissance d’activités pour les méthodes de classification
LDA, k-NN, SVM et WSVM. Les valeurs en gras présentent les performances obtenues avec les
meilleurs classificateurs.
66
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Dans la figure II.14, on constate que les classes majoritaires (Autres activités et Ecoutez de la
musique) on été bien classifiées par rapport aux autres activités. Globalement, les activités
minoritaires (Aux toilettes, Prendre des médicaments, Laver la Vaisselle, Regarder TV et les
activités de cuisine (Prép. Petit déjeuner, Prép. Déjeuner, Prép. le Goûter) ont été bien classifiées
avec la méthode WSVM comparativement aux autres approches de classification. L’activité
Prendre des médicaments n’a pas pu être reconnu avec k-NN et SVM. Aussi, l’activité Prép. le
Goûter n’a pas été bien classifiée avec SVM. Ce dernier fournit un taux de classification
significatif pour la classe majoritaire Autres-activités. Les activités de cuisine Prép. Petit déjeuné,
Prép. Déjeuner, Prép. Dîner, Prép. le Goûter et Laver la Vaisselle restent mal classifiées et sont
difficiles à reconnaitre par les différents classificateurs étudiés dans ce mémoire.
On remarque dans la figure II.15 pour la base de données OrdonezA, que les classes majoritaires
Dormir, Loisirs et Sortir donnent les meilleures performances de reconnaissance d’activités pour
toutes les méthodes de classification. Particulièrement, WSVM fournit de bonnes performances
pour les activités minoritaires (Aux toilettes, Prép. Déjeuner, Faire sa toilette) mais ces dernières
restent inferieures à celles des activités majoritaires.
67
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Figure II.13- Comparaison des taux de reconnaissance entre les différentes méthodes de
classification pour chaque activité avec la base de données TK26M.
Figure II.14- Comparaison des taux de reconnaissance entre les différentes méthodes de
classification pour chaque activité avec la base de données TAP80F.
Le classificateur LDA donne aussi de bonnes performances pour les activités minoritaires (Se
doucher, Petit-déjeuner, Gouter). Les méthodes k-NN et SVM sont inferieures aux autres
méthodes de classification pour toutes les activités à l’exception de l’activité appelée Autres-
activités. L’activité Gouter a été très mal classifiée avec la méthode de classification k-NN.
68
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Figure II.15- Comparaison des taux de reconnaissance entre les différentes méthodes de
classification pour chaque activité avec la base de données OrdonezA.
Ensuite, nous avons visualisé les matrices de confusion de la méthode de classification WSVM
pour les bases de données TK26M, TAP80F et OrdonezA. Cette matrice montre l’efficacité de la
méthode de classification WSVM, où le taux de reconnaissance le plus élevé correspond toujours
à la bonne reconnaissance des activités humaines. La diagonale de cette matrice représente le
Taux de Classification Correcte (TCC) de chaque activité. Nous remarquons dans le tableau II.10
que les activités Sortir, Aux toilettes, Se doucher, Dormir donnent les meilleurs taux de
classification des activités humaines. On constate aussi que la plus grande confusion réside entre
les activités de cuisine (Petit-déjeuner, Dîner et Boire) et Autres-activités.
Nous remarquons dans le tableau II.11 pour la base de données TAP80F que toutes les activités
présentent des performances très basses par rapport aux autres bases de données. Les activités
Regarder TV et Ecouter de la musique sont mieux classifiées par rapport aux autres activités. On
constate que la plus grande confusion est entre l’activité Prendre des médicaments, les activités
de cuisine (Prép. Petit Déjeuner, Prép. Déjeuner, Prép. Dîner, Prép. le Goûter et Laver la
Vaisselle), et Autres activités. L’activité Prép. le Goûter a été mal classifiée et la plus grande
confusion est entre cette activité et Prendre des médicaments.
69
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
activités
toilettes
Autres-
Sortir
doucher
Dormir
Dîner
Boire
Aux
Petit-
déjeuner
Se
Activités
Aux toilettes 11.0 2.9 80.3 2.9 1.6 1.0 0.0 0.3
Se doucher 7.2 0.0 3.3 89.1 0.0 0.4 0.0 0.0
Goûter
Prendre
Prép. Petit
déjeuné
déjeuné
Laver la
Vaisselle
TV
des
activités
toilettes
Autres-
Dîner
Regarder
Prép.
Prép.
Prép. Le
Musique
Aux
Activités
Autres-
26.0 12.6 19.4 9.0 2.9 3.4 2.5 5.3 12.5 9.4
activités
Aux toilettes 8.9 36.8 17.1 10.9 4.6 4.1 5.0 7.0 4.4 1.2
Prendre des
15.7 10.8 34.0 9.7 0.5 15.7 6.0 1.1 3.2 3
médicaments
Prép. Petit
9.4 3.6 16.3 26.2 23.8 4.7 3.2 4.0 6.2 2.6
déjeuné
Prép.
6.3 3.1 8.8 26.0 17.4 11.3 2.0 11.1 7.0 7.0
déjeuné
Prép.
7.1 4.1 21.5 14.0 18.4 14.8 3.7 4.1 4.0 8.3
Dîner
Prép. le
13.0 7.1 17.0 14.6 7.4 13.4 11.0 4.3 3.1 9.1
Goûter
Laver la
3.3 4.6 4.6 9.4 13.1 8.0 10.1 32.9 6.7 7.3
Vaisselle
Regarder TV 17.0 11.8 1.5 2.1 5.8 1.4 1.4 13.0 42.7 3.3
Ecouter de la
8.1 5.4 5.2 5.2 5.8 6.5 4.3 7.0 2.6 49.9
musique
Dans le tableau II.12, les activités Dormir, se doucher, Prép. Déjeuné, Regarder TV, Sortir et
Petit-déjeuner ont des taux de classification correcte supérieurs aux autres activités. Nous
prenons l’activité Gouter qui a été mal classifiée. Elle a été confuse avec l’activité : Autres-
activités.
70
CHAPITRE II : METHODES DE CLASSIFICATION POUR LA RAH
Dormir
Goûter
déjeuné
Loisirs
Autres-
activités
toilettes
Petit-
Sortir
doucher
déjeuner
Prép.
Aux
Faire sa
toilette
Activités
Autres-activités 8.2 11.8 5.3 8.8 2.9 3.9 40.9 5.7 12.5 0
Dormir 0 100 0 0 0 0 0 0 0 0
Aux toilettes 6.9 20.8 26.8 10.2 8.4 13.0 5.9 2.1 2.7 3.2
Faire sa toilette 5.1 0.7 1.9 0,8 8.8 69.2 7.4 4.5 0.9 0.7
Sortir 0 0 0 0 0 0 0 100 0 0
Goûter 23.7 5.2 6.2 15.0 18.1 7.2 0 5.3 4.1 15.2
II.5. Conclusion
Nous avons présenté dans ce chapitre, les détails de notre approche de reconnaissance des
activités humaines, appelée Méthodes à Vecteurs de Support pondérée (WSVM), ainsi que la
validation auprès de différentes données issues des habitats intelligents. Nous avons aussi
comparé notre approche avec d’autres méthodes de classification les plus connues dans la
littérature à savoir LDA, k-NN et SVM. Nous avons ainsi, expliqué l’aspect théorique de chaque
méthode et le paramétrage correspondant.
Ensuite nous avons présenté les détails concernant la phase de simulations. Nous avons effectué
plusieurs simulations pour répondre aux questions posées au départ. A la lumière de ces résultats,
nous avons pu mettre en évidence les points forts de notre modèle et montrer qu’il est supérieur
aux autres modèles de classification. Il a le pouvoir d’améliorer la reconnaissance d’activités
minoritaires comme les activités de cuisine. Ces dernières restent difficiles à reconnaitre et
présentent une grande confusion entre elles. L’évaluation de ces méthodes de classification en
termes de taux de classification correcte montre que WSVM donne les meilleurs résultats. Ceci
ce n’est vraiment pas important puisque F-mesure est notre premier critère d’évaluation, comme
il a été déjà mentionné dans ce chapitre.
71
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
III.1. Introduction
Tout ce qui a été exposé jusque là concerne la comparaison de différentes méthodes de
classification appliquées au domaine de la reconnaissance d’activités humaines. Dans ce
chapitre, deux problématiques dans le domaine de RAH ont été exposées à savoir le
déséquilibre des classes et la dimensionnalité des données issues des réseaux de capteurs. Par
conséquent, nous devons améliorer les algorithmes existants afin de traiter ces deux
problématiques et choisir la méthode la plus performante pour la reconnaissance d’activités
humaines.
La plupart des algorithmes de classification sont basés sur deux hypothèses :
(H1) le critère à minimiser est le nombre d’erreurs et (H2) le jeu de données d’apprentissage
est un échantillon représentatif de la population sur laquelle le modèle sera appliqué. Ce sont
ces deux hypothèses qui font que les modèles ne sont pas satisfaisants quand ils sont construits
à partir de données déséquilibrées.
Figure III.1- Représentation d’un jeu de données constitué de trois classes déséquilibrées
72
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
La section qui va suivre exposera en détails les difficultés rencontrées dans le cas de
déséquilibre entre deux classes ainsi que les stratégies mise en place pour y remédier. On peut
l’illustrer par un exemple simple : si 99 % des données appartiennent à une seule classe
(appelée classe majoritaire) et 1% des données restantes à la classe minoritaire, il sera difficile
de faire mieux que classer toutes ces données dans la classe majoritaire et obtenir 1% d’erreur
: selon les hypothèses (H1), (H2) que nous venons de citer précédemment c’est même la
meilleure procédure à faire. Weiss [105] propose de distinguer plus précisément les différents
problèmes des données déséquilibrées, et de l’apprentissage des classes rares. Nous allons les
citer dans la section suivante.
- Métriques inappropriées:
Les mesures utilisées généralement au cours du processus d’apprentissage pour guider
l’apprentissage, ou pour en évaluer les résultats, ne sont pas adaptées aux classes
déséquilibrées. Si on remplace le critère à optimiser, par exemple le taux d’erreur de
classification, par un critère plus pertinent qui prend en compte le déséquilibre des classes, on
doit pouvoir adapter simplement les algorithmes. Le Rappel et la Précision sont par exemple
des critères plus adéquats à ce type de données [106].
- Manque de données:
Les données d’une classe ne sont pas rares au sens absolu, mais beaucoup moins représentées
que ceux des autres classes. Le problème est donc le ratio : (Nb données minoritaire : Nb
données majoritaire) plus que le nombre d’individus disponibles pour apprendre le concept de
la classe minoritaire : faire un apprentissage sur un jeu de données déséquilibrées où le ratio
est 5 : 100 (manque absolu) est un problème très différent d’une répartition avec le ratio est
500 : 10000 (manque relatif). Ce problème de déséquilibre a été illustré par Weiss [105]. De
nombreuses méthodes peuvent être utilisées pour gérer ce problème [10], [20], [107].
73
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
- Données bruitées:
Le bruit a plus d’effet sur les classes minoritaires que sur les classes majoritaires, ceci
s’explique par le fait que peu de données bruitées (mal étiquetées) suffisent pour affecter la
phase d’apprentissage [10]. Le modèle de classification obtenu lors de cette phase devient
incapable de discerner entre les données bruitées et les données minoritaires. Si le modèle était
plus adapté, il apprendra correctement ces données issues des classes minoritaires, mais
également ceux qui sont réellement du bruit. Généralement, les données minoritaires appelées
aussi les classes rares sont les classes d’intérêt et donc sont importantes à bien les classifier
74
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
75
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Une autre approche pour tenir compte de l’asymétrie est d’introduire un biais dans les
algorithmes d’apprentissage. Barandela et al. [114] proposent d’utiliser une mesure de
distance pondérée dans l’algorithme des k-plus proches voisins (k-NN). L’objectif de cette
distance est de compenser le déséquilibre du jeu de données sans altérer la distribution des
76
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
classes : des poids sont assignés non aux individus prototypes mais aux classes. Ainsi les
distances aux prototypes de la classe minoritaire deviennent plus faibles qu’à ceux de la classe
majoritaire.
77
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
SMOTE) avec le classificateur du type Méthodes à Vecteurs de Support (SVM), comme nous
le montre la figure III.2. Dans la phase d’entrainement, nous avons besoin de corriger le
déséquilibre entre les classes d’activités représentées dans l’espace de caractéristiques en
utilisant l’une des méthodes de ré-échantillonnage de données qui seront chacune détaillée
dans la prochaine sous section. Ensuite, les données équilibrées seront utilisées pour
l’entrainement du classificateur SVM. Le modèle ainsi obtenu durant la phase d’entrainement
sera utilisé pour prédire les nouvelles observations issues des activités humaines durant la
phase de test.
78
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Pour ce faire, il nous faut comme entrée un ensemble d’apprentissage ainsi que les étiquettes
des classes « Label ». L’instruction Matlab {id=round(rand(1, ClassDmin)*(class(i)-1)+1)}
sera celle qui va permettre d’obtenir un vecteur d’indices dont chaque élément sera assimilé
aléatoirement aux lignes d’une même classe (grâce à la fonction « rand ») et cette instruction
sera réitérée pour toutes les classes hormis classe minoritaire. Les sorties représentent le
nouvel ensemble d’apprentissage sous-échantillonné « sample », ainsi que l’ensemble
d’étiquettes de classes aussi sous-échantillonné « sampleLabel ». Les algorithmes III.1, III.2
sont illustrés à la fin de la section III.5.2.
79
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
80
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Algorithme de Sous-échantillonnage
Entrée : - Ensemble d’apprentissage « Data »
- Etiquettes de classes « Label »
Sortie : - Ensemble d’apprentissage sous-échantillonné « sample »
- Nouvelles étiquettes « sample label »
Algorithme :
1 Si size(data)=size(label)
2 Pour i=1: NbClass
3 Trouver les ids (identifiants) de chacune des classes Class (i)
4 Regrouper les données de même classe dans ClassD{i}
5 Calculer le nombre d’indices de chaque classe : class(i)=length(id)
Fin
5 Trouver la classe minoritaire classmin
6 Initialisation :
sample= [ ] et samplelabel= [ ]
7 Tant que (i< =NbClass)
Si (lenght(classmin) < length(Class(i)))
8 Chercher les indices de la classe majoritaire i sélectionnés pour atteindre la classmin
avec : {id=round(rand(1,classmin)*(class(i)-1)+1)}
9 Ajouter les données et leurs étiquettes correspondantes avec les ids en
utilisant la concaténation : sample=[ClassD{i}( :,id)] ;
et samplelabel=[y(ClassD{i}( :,id))] ;
Avec y(ClassD{i}( :,id)) est le vecteur d’étiquettes de la classe ClassD{i}( :,id)
Fin
Fin
81
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Algorithme de Sur-échantillonnage
82
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Le sur-échantillonnage implique souvent des copies exactes des données existantes, ce qui
peut entrainer un sur-apprentissage du modèle. Pour surmonter ce problème de sur-
apprentissage et élargir la région de décision de données appartenant à une classe minoritaire,
il existe une autre technique permettant de produire des données synthétiques appelée SMOTE
(Synthetic Minority Oversampling TEchnique, décrite en détail dans [118]) qui utilise les k-
NN (k-plus proches voisins) pour créer de nouveaux exemples.
83
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Chacun de ces algorithmes US, OS et Smote présente des avantages et des limites qui pèsent
plus ou moins fort en fonction des caractéristiques de leurs algorithmes comme on peut le voir
dans le tableau suivant :
84
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
- Lorsque le nombre de variables est trop grand (il peut aller jusqu’à plusieurs dizaines
de milliers dans certaines applications), l’algorithme d’apprentissage devient
intractable. La réduction de dimensionnalité diminue les charges de calcul dû à
l’apprentissage.
85
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
86
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
87
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
88
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.9- PCA appliquée dans un espace à trois dimensions. (Nous cherchons un autre
espace de représentation pour lequel les projections des données des différentes classes sont
les mieux séparées, la figure de droite montre une grande séparation entre les différentes
classes).
Supposons que nous ayons un ensemble de données X x1, x2 ,..., xm composé de m
observations où chaque observation xi xi1, xi 2,..., xin est composée de n caractéristiques.
L’application de l’algorithme PCA pour la matrice X passe par différentes étapes ci-dessous
afin de trouver les composantes principales :
1. Calculer le vecteur 1 , 2 ,..., n Tr qui représente le vecteur moyen où i est la
moyenne de la ième composante des données.
(III.2)
j i j i i j
j1 m j1
89
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
4. Calculer la matrice V (de taille n× n) qui est composée des coordonnées des vecteurs
→
propres v j de S triés par ordre décroissant des modules des valeurs propres j (la
première colonne de V est le vecteur propre qui correspond à la plus grande valeur
propre). Les valeurs propres seront positives puisque la matrice de covariance est
symétrique et définie positive.
V Eig(S)
(III.3)
~
5. Garder les p premières colonnes de V pour former la matrice U : n× p qui représente
les p premières composantes principales. Nous avons choisi le critère du pourcentage
d’inertie reproduite.
P
λj
j 1
I k n Threshold 0.85 (III.4)
λj
j 1
Ce pourcentage doit être supérieur ou égal à 85% pour sélectionner la valeur de p qui est la
nouvelle dimension de projection.
Généralement, une fois que les vecteurs propres de la matrice de covariance sont déterminés,
l’étape suivante va consister à les mettre en ordre décroissant suivant leurs valeurs propres.
Ceci nous donnera les composantes principales par ordre d’importance. On peut alors ignorer
les composantes les moins significatives considérées comme des composantes bruitées. On
perd ainsi des informations, mais si les valeurs propres sont petites, la perte sera minimale. Si
on omet quelques composantes, l’ensemble final de données aura moins de dimensions que
l’original. On passe ensuite à la formation de la matrice caractéristique. Cette dernière est
construite en sélectionnant les vecteurs propres qu’on veut garder et en formant une matrice
avec ces vecteurs propres (représentés en colonnes).
90
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Pour plus de détails, le lecteur pourra consulter (Jolliffe [121]). PCA étant une méthode de
réduction de dimension, il est important de savoir qu'elle ne peut pas retenir la totalité de
l'information contenue dans le nuage de points initial. Enfin, PCA prend uniquement en
compte les dépendances linéaires entre les variables et ne peut donc pas fournir une projection
pertinente pour une distribution non-linéaire de points. La figure III.10 montre à gauche, un
exemple de données non-linéaires (non reparties dans un plan) et à droite le résultat de leur
projection dans un plan généré par les deux premières composantes principales calculées sur
ces données.
L'analyse discriminante linéaire, appelée aussi analyse discriminante linéaire de Fisher, est une
méthode de réduction du nombre de dimensions proposée par Fisher en 1936 [122]). Cette
méthode s'applique lorsque les données d’apprentissage sont connues, ces informations peuvent
être utilisées pour l’apprentissage du sous–espace. L'idée de Fisher a été de créer une méthode
pour choisir entre les combinaisons linéaires des variables celles qui maximisent
l'homogénéité de chaque classe. En d'autres termes, cette méthode consiste à chercher un
espace vectoriel de faible dimension qui maximise la variance inter-classe.
La méthode LDA permet de trouver les directions “utiles à une bonne discrimination des
classes” (La première est le discriminant de Fisher généralisé) dans lesquelles les données
originales sont projetées dans l’espace transformé en maximisant le rapport :
91
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
| D Tr BD |
J (D) arg max (III.6)
D | DTrW D |
1 N
Bp×p= nk (mk m)(mk m) Tr (III.7)
n k1
avec (m k m)(m k m)Tr est une matrice C (k ) (p×p)
n S avec S (X m )(X m )
Tr
et W =1 N (III.8)
p×p k k k k k k k
n k 1
Où m (m , m ,..., m ,...m )Tr et m =moyenne de X j dans w avec: m X
1 nk
k k1 k2 kj kp kj k kj kj
nk j
B et W sont les matrices respectives de dispersion inter-classe (entre les centres de gravité m1
et m2) et intra-classe (entre les points et le centre de gravité correspondant). Le nuage de
point de centre de gravité m est partagé en q (2 dans notre cas) sous-nuages par la variable
“classe”. Chaque sous-nuage (classe wk ) d’effectif nk est caractérisé par son centre de gravite
(ou centroide) mk et sa matrice de variance-covariance Sk . La figure III.11 montre la
disposition des classes dans un espace à deux variables. Soient deux classes C1 et C2 de
centres de gravité m1(X1, X2) et m2(X1, X2), les résultats de la transformation appliquée
correspondent à des nuages de points de chaque classe très regroupés et que les centres de
gravité des classes bien séparés.
Soit DTr la transformation linéaire permettant d’établir le nouvel espace de projection. Les
vecteurs lignes de la matrice DTr définissent les directions des axes de la nouvelle base. En
général, s’il y a N classes, nous allons chercher N-1 directions (vecteurs discriminants) qui
correspondent aux N-1 plus grandes valeurs propres.
La solution est obtenue en cherchant les racines du polynôme caractéristique et en résolvant
l’équation :
92
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.11- Analyse discriminante à une dimension (nous cherchons une droite pour
laquelle les projections des points des différentes classes sont les mieux séparées, la figure de
droite montre une grande séparation entre les deux classes).
Nous nous intéresserons à trouver la projection W dans le sous espace des caractéristiques tel
que :
yi WTrx i (III.10)
par n caractéristiques).
93
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Tableau III.2- Les résultats de reconnaissance d’activités pour les approches de classification
WSVM, US-SVM, OS-SVM et SMOTE-SVM. Les valeurs en gras présentent les meilleures
performances obtenues avec les différentes approches.
Nous reportons dans les figures III.12, III.13, III.14, le taux de classification de chaque
activité en utilisant les approches WSVM, US-SVM, OS-SVM et SMOTE-SVM pour les
bases de données TK26M, TAP80F et OrdonezA. On remarque dans la figure III.12 que les
meilleurs résultats de classification sont obtenus avec les activités majoritaires ‘Sortir’ et
‘Dormir’ pour toutes les méthodes de classification. Nous pouvons aussi constater que les
classes (aux toilettes, Se doucher, Dîner et Boire) ont été bien classifiées avec la méthode
SMOTE-SVM. L’activité Petit-déjeuner est légèrement inférieure en termes de bonne
classification comparativement à la méthode WSVM. Cependant, les méthodes de
94
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
classification OS-SVM et SMOTE-SVM donnent les meilleurs résultats pour l’activité Autres-
activités. Cette dernière et les activités de cuisine Petit-déjeuner, Dîner et Boire ont été mal
classifiées par rapport aux autres activités.
Figure III.12- Comparaison des taux de reconnaissance entre les méthodes de classification
WSVM, US-WSVM, OS-SVM et SMOTE-WSVM pour chaque activité avec la base de
données TK26M.
Dans la figure III.13, on constate que les classes (aux toilettes, Prendre des médicaments,
Prép. Dîner, Prép. le Gouter et Ecouter de la musique) on été bien classifiées avec la méthode
WSVM comparativement aux autres méthodes de classification. Cependant, l’activité
Regarder TV et les activités de cuisine (Prép. Déjeuner et Laver la Vaisselle) ont été bien
classifiées avec SMOTE-SVM comparativement aux autres approches de classification.
Particulièrement, les activités Prép. Dîner et Prép. le Gouter ont donné de mauvais résultats de
classification. Les activités de cuisine présentent les taux de classification les plus bas et
restent en général difficiles à reconnaitre par rapport aux autres activités. En outre, les
méthodes de classification OS-SVM et SMOTE-SVM donnent les meilleurs résultats pour
l’activité Autres-activités.
On remarque dans la figure III.14 que les classes majoritaires Dormir et Sortir donnent les
meilleures performances en termes de reconnaissance d’activités pour toutes les méthodes de
95
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.13- Comparaison des taux de reconnaissance entre les méthodes de classification
WSVM, US-WSVM, OS-SVM et SMOTE-WSVM pour chaque activité avec la base de
données TAP80F.
96
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.14- Comparaison des taux de reconnaissance entre les méthodes de classification
WSVM, US-WSVM, OS-SVM et SMOTE-WSVM pour chaque activité avec la base de
données OrdonezA.
97
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
supérieure par rapport aux autres approches pour toutes les méthodes de classification. Les
résultats montrent que les caractéristiques combinées LDs contribuent significativement à
améliorer les performances du classificateur WSVM.
98
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
99
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.16- L’extraction des caractéristiques par l’Analyse Discriminante Linéaire (LDA).
On a aussi montré que LDA est meilleure que PCA pour reconnaitre les activités humaines
avec le classificateur WSVM pour toutes les bases de données. PCA permet la réduction
significative du nombre d’attributs mais reste inférieure aux autres approches à l’exception des
bases de données TAP80F et OrdonezA, ou les performances de classification PCA-WSVM
surpassent de celles de WSVM.
Nous reportons dans les figures III.17 et III.18, le taux de classification de chaque activité en
utilisant les approches WSVM, PCA-WSVM et LDA-WSVM pour les bases de données
TK26M et TAP80F. A première vue dans la figure III.17, on remarque que les activités
minoritaires ‘aux toilettes’, ‘Se doucher’, et les activités de cuisine : (‘Petit-déjeuner’, ‘Boire’)
ont été mieux reconnues avec la méthode LDA-WSVM comparativement aux méthodes
WSVM et PCA-WSVM. LDA-WSVM est une méthode efficace pour reconnaitre les
différentes activités.
100
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Tableau III.3- Les résultats de classification d’activités avec les méthodes WSVM, PCA-
WSVM, et LDA-WSVM. Les valeurs en gras présentent les meilleures performances obtenues
avec le classificateur LDA-WSVM.
Les meilleurs résultats de classification sont obtenus avec les activités majoritaires ‘Sortir’ et
‘Dormir’ pour toutes les méthodes de classification. En outre, les activités de cuisine sont en
général difficiles à reconnaitre par rapport aux autres activités. L’activité ‘Autres activités’
était aussi mieux reconnue avec la méthode LDA-WSVM. Si on compare WSVM et PCA-
WSVM, on voit clairement que PCA n’a pas pu améliorer les résultats par rapport à WSVM,
sauf pour certaines activités comme ‘Dîner’ et ‘Boire’.
Dans la figure III.18, LDA-WSVM a permis l’amélioration significative des résultats de
classification pour la plupart des activités humaines, à l’exception des activités ‘Prendre des
médicaments’, ‘Prép. Petit Déjeuner’ et ‘Prép. Dîner’. Les activités de cuisine présentent les
taux de classification les plus bas et restent en général difficiles à reconnaitre par rapport aux
101
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
autres activités. Particulièrement, les activités ‘Prép. Dîner’ et ‘Prép. le Goûter’ ont donné de
mauvais résultats de classification. Les activités majoritaires ‘Autres activités’ et ‘Ecouter de
la musique’ ont été aussi mieux reconnues avec la méthode LDA-WSVM et présentent les
meilleurs taux de classification correcte.
Figure III.17- Comparaison des taux de reconnaissance entre les méthodes de classification
WSVM, PCA-WSVM et LDA-WSVM pour chaque activité avec la base de données TK26M.
102
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
Figure III.18- Comparaison des taux de reconnaissance entre les méthodes de classification
WSVM, PCA-WSVM et LDA-WSVM pour chaque activité avec la base de données TAP80F.
III.9. Conclusion
Nous avons vu dans cette partie que les jeux de données déséquilibrées peuvent être traités à
deux niveaux : le traitement des données en phase de pré-apprentissage et le traitement au
niveau de l’algorithme d’apprentissage lui-même. Au niveau des données, les méthodes de ré-
échantillonnage, plus particulièrement le sur-échantillonnage et le sous-échantillonnage,
permettent de transformer un jeu de données pour éviter de biaiser le modèle vers la classe
majoritaire. Nous avons présenté dans ce chapitre trois algorithmes (US, OS et SMOTE) que
nous avons utilisés pour réduire le déséquilibre dans les bases de données et permettre un
apprentissage plus performant et plus fiable.
Enfin une première stratégie de classification a été adoptée qui consiste à faire une
combinaison de ces méthodes de ré-échantillonnage avec le classificateur SVM pour la
reconnaissance d’activités humaines dans le cas des données déséquilibrées. La méthode de
classification WSVM qui traite le problème du déséquilibre au niveau algorithmique et plus
particulièrement au niveau de l’optimisation d’apprentissage SVM, a été utilisée comme
103
CHAPITRE ІII : LES PROBLEMES DE DESEQUILIBRE ET DIMENSIONALITE DES
DONNEES : PROPOSITION DE SOLUTIONS
méthode de comparaison. Cette dernière est assez perspicace vis-à-vis les approches US-SVM,
OS-SVM et SMOTE-SVM.
Ensuite dans la deuxième partie de ce chapitre, nous avons employé les méthodes d’extraction
de caractéristiques PCA et LDA pour réduire l’espace d’attributs et améliorer les
performances de reconnaissance RAH pour le classificateur WSVM. Le maintien des
performances de classification sera aussi un atout puisque avec un nombre d’attributs plus
petit, on aura une complexité du classificateur SVM moindre. La deuxième stratégie adoptée
était la mise en œuvre de méthodes hybrides PCA-WSVM et LDA-WSVM. Nos résultats
obtenus sur les différentes bases de données montrent clairement que le classificateur LDA-
WSVM fournit globalement de meilleures performances pour toutes les activités humaines. Il
a permis d’améliorer significativement les performances de reconnaissances des activités
minoritaires (comme Se doucher, Petit-déjeuner, Dîner et Boire), même si ces dernières restent
inférieures à celles des activités majoritaires en termes de bonne classification.
104
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
IV.1. Introduction
Cette méthode [22] repose sur la combinaison les méthodes Analyse en Composantes
Principales (PCA), l’Analyse Discriminante Linéaire (LDA) et Méthode à Vecteurs de
Support pondérée (WSVM) afin de pouvoir obtenir un système de reconnaissance d’activités
humaines robuste en termes de bonne performances de classification. L’idée de combiner les
caractéristiques de type composantes principales (PCs) et les caractéristiques discriminantes
linéaires (LDs) obtenues en sortie respectivement avec les méthodes linéaires de réduction de
dimension PCA et LDA afin d’obtenir un meilleur espace de caractéristiques et s'affranchir du
fléau de la dimension n’est pas totalement nouvelle et semble assez intuitive étant donné la
complémentarité inhérente des interprétations des principes des méthodes d’extraction de
caractéristiques PCA et LDA dans le sens où PCA effectue la réduction de dimensionnalité
tout en préservant la variance élevée dans l’espace de sortie, tandis que LDA effectue la
réduction de la dimensionnalité tout en préservant la discrimination entre les classes
d’activités humaines, voire la figure IV.1.
Figure IV.1- Classification de données en deux dimension avec le premier vecteur de base
LDA et le premier vecteur de base PCA. Approche de fusion de données avec PCA-LDA
pour la classification supervisée [124].
105
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Cependant, LDA bien qu’elle préserve la discrimination entre les classes d’activités humaines,
elle a un inconvénient du à sa nature paramétrique. A savoir que le nombre de composantes
extraites ne peut pas être dépasser le nombre de classes moins un [122]. Les méthodes PCA et
LDA ne sont pas corrélées car la LDA génère un espace propre significativement différent de
la PCA. Pechenizkiy [125] montre que la fusion de LDA avec PCA ont donné de bons
résultats. Notons que de précédentes études ont en effet montré que les approches non
linéaires surpassent les méthodes linéaires sur des jeux de données artificiels hautement non
linéaires. Cependant, les succès de réduction de dimension avec les méthodes non linéaires
sur des jeux de données naturelles sont plutôt rares.
Pechenizkiy [125] a appliqué les deux transformations PCA et LDA pour des tâches de
reconnaissance de formes en utilisant les méthodes de classification k-NN, C4.5 et le Naïve
bayésien sur différents ensembles de données issus de la base de données UCI [126], puis
l'espace des caractéristiques fusionné est obtenu par concaténation des caractéristiques PCs et
LDs. Notre nouvelle approche suit le même principe que [125], à la différence que nous avons
utilisé l’espace de caractéristiques construit à partir de PCA-LDA comme entrée à notre
classificateur appelé Méthode à Vecteurs de Support pondérée (WSVM) afin de prendre en
compte le déséquilibre entres les classes d’activités humaines. Notons que chaque donnée
(Entrainement-Test) est représentée dans l’espace de caractéristiques de dimension (p + q)
avec p et q sont respectivement les nouvelles dimensions obtenues avec les méthode de
réduction PCA et LDA.
IV.2. Principe
L’ensemble de données est divisé en deux partitions Apprentissage-Test selon la division de la
méthode de validation croisée Lave one day out. Ensuite la méthode Analyse en Composantes
Principales (PCA) et la méthode paramétrique Analyse Discriminante Linéaire (LDA) sont
appliquées indépendamment à l’ensemble d’entrainement, en produisant les nouvelles
matrices de données issues des modèles PCA et LDA. Les données originales de l'ensemble
d’entrainement sont projetées dans des sous espaces de dimension inferieure (également
indépendamment avec chaque approche). Ainsi les deux ensembles d'entraînement
transformés sont produits, dont l'un contient des composantes principales (PCs) au lieu des
106
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Figure IV.2- Approche de fusion de données avec PCA-LDA pour la classification supervisée
[125].
Pour être en mesure d'évaluer le classificateur, dans notre cas Méthode à Vecteurs de Support
pondérée (WSVM), sur l’ensemble test set, ce dernier devrait également être transformé dans
le même format. Cela se fait d’une manière similaire comme dans l’ensemble d’entrainement,
tel que l'ensemble de test est transformé de façon indépendante avec les méthodes PCA et
LDA, et des PCs et LDs sont construites et sont traduites par les transformations de matrices.
107
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Ensuite, les LDs sont fusionnées avec les PCs et l’attribut des étiquettes des classes de
l'ensemble test original. Le nouvel espace de représentation est utilisé pour tester notre
classificateur. Pour voir la structure de notre approche PCA-LDA-WSVM, la figure ci-dessous
illustre bien toute la procédure de classification pour l’obtention des classes d’activités
prédites.
108
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
109
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
réelles TK26M, TK28M, TK57M, TAP80F et OrdonezA. Nous remarquons dans ce tableau
en termes de F-mesure que l’approche proposée de classification PCA-LDA-WSVM est
supérieure par rapport aux autres approches, mais elle est inferieure par rapport à PCA-LDA-
HMM dans la base de données TK26M avec le même nombre d’attributs.
Les résultats montrent que les caractéristiques combinées PCs-LDs contribuent
significativement à améliorer les performances des classificateurs HMM et WSVM. On a
aussi montré que LDA est meilleure que PCA pour reconnaitre les activités humaines avec le
classificateur WSVM pour toutes les bases de données. On remarque dans la base de données
TAP80F, que l’approche PCA-WSVM améliore les performances de classification des
activités humaines comparativement aux classificateurs CRF, SVM et WSVM avec un
nombre d’attribut significativement inférieur à celui de l’espace original des données.
Tableau IV.1-Evaluation des résultats de classification humaine pour toutes les approches. Nb
Feat. montre le nombre de caractéristiques PCs, LDs et la concaténation PCs-LDs. Les valeurs
en gras présentent les meilleures performances en termes de F-mesure obtenues avec les
différentes approches.
110
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Nous reportons dans les figures IV.4 et IV.5, le taux de classification pour chaque activité en
utilisant les algorithmes de reconnaissance HMM, WSVM, PCA-LDA-HMM et PCA-LDA-
WSVM pour les bases de données TK26M et TAP80F. A première vue dans la figure IV.4,
pour la base de données TK26M, on remarque que PCA-LDA-HMM et l’approche proposée
surpassent respectivement les classificateurs HMM et WSVM en termes de bonne
reconnaissance d’activités humaines. Néanmoins avec l'espace des caractéristiques augmenté
(PCs-LDs), il est facile de voir, par exemple, que HMM surpasse WSVM pour toutes les
activités.
Il est également remarqué, une clair supériorité pour la méthode PCA-LDA-HMM pour
reconnaitre l’activité ‘Autres-activités’ et les activités minoritaires Dîner et Boire) et des
résultats comparables avec notre approche de reconnaissance pour les activités restantes.
Les meilleurs résultats de classification sont obtenus avec les activités majoritaires ‘Sortir’ et
‘Dormir’ pour toutes les méthodes de classification. Nous pouvons tout de suite constater que
les classes (Aux toilettes et Se doucher) ont été bien classifiées avec la méthode HMM
comparativement aux autres méthodes de classification. En outre, les activités de cuisine sont
en général difficiles à reconnaitre par rapport aux autres activités.
111
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Dans la base de données TAP80F, la méthode proposée donne les meilleurs résultats de
classification pour les activités minoritaires ‘Autres-activités’, ‘Aux toilettes’, ‘Prendre des
médicaments’, ‘Prép. Déjeuner’, ‘Prép. le Goûter’, ‘Laver la Vaisselle’ et ‘Regarder TV’
comparativement aux autres méthodes, et des résultats relativement inferieurs par rapport à
l’approche PCA-LDA-HMM pour les activités ‘Prép. Petit déjeuner’ et ‘Ecouter de la
musique’. L’activité Goûter a été très mal classifiée avec la méthode de classification PCA-
LDA-HMM.
Cependant, nous constatons à partir des deux figures en dessous, que les activités de cuisine
présentent les taux de classification faibles et sont en général difficiles à reconnaitre par
rapport aux autres activités. Cette observation est toujours valable pour les autres activités
dans tous les ensembles de données utilisés.
Figure IV.4- Comparaison des taux de reconnaissance entre les méthodes de classification
HMM, WSVM, PCA-LDA-HMM et PCA-LDA-WSVM pour chaque activité avec la base de
données TK26M.
112
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
chaque activité. Toutes les valeurs obtenues dans les matrices de confusion sont en
pourcentage.
On note d’après les résultats obtenus pour la base de données TK26M dans les tableaux IV2 et
IV.4 que les activités ‘Sortir’, ‘Aux toilettes’, ‘Se doucher’, ‘Dormir’ et ‘Dîner’ sont mieux
reconnus relativement à l’activité ‘Autres activités’ et les deux activités de cuisine ‘Petit
déjeuner’ et ‘Boire’. L’activité ‘Diner’ semble moins reconnue avec PCA-LDA-WSVM par
rapport à la méthode PCA-LDA-HMM. On constate que la plus grande confusion est entre les
activités de cuisine (Petit-déjeuner, Dîner et Boire) et Autres activités.
Figure IV.5- Comparaison des taux de reconnaissance entre les méthodes de classification
HMM, WSVM, PCA-LDA-HMM et PCA-LDA-WSVM pour chaque activité avec la base de
données TAP80F.
Dans le tableau IV.4, 61% des échantillons de l’activité ‘Petit déjeuner’ sont correctement
reconnu, alors que 21% ont été classifies dans ‘Autres activités’ et 16% sont confondus avec
les activités préparation des repas. Les autres classes similaires telles que ‘Dîner’ et ‘Boire’
ont été aussi confondus et partage les erreurs entre elles. Notons que les activités ‘Petit
déjeuner’ et ‘Dîner’ partagent 10% de leurs échantillons entre elles en raison d'être réalisée au
même endroit dans l’habitat intelligent.
113
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Nous remarquons dans le tableau IV.3, pour la base de données TAP80F que toutes les
activités présentent des performances très basses par rapport aux autres bases de données.
L'activité ‘Ecouter de la musique’ a été reconnue avec succès (avec un taux de reconnaissance
de 95%) par rapport aux autres activités dans le tableau IV.3. Nous remarquons aussi que les
activités ‘Prép. Dîner’ et ‘Prép. le Goûter’ n’ont pas été reconnues. Dans le tableau IV.5, les
activités de cuisine: ‘Prep. Petit-déjeuner’, ‘Prep. le déjeuner’, ‘Prep.Dinner’ et ‘Prep. le
Goûter’, ne sont pas bien reconnues par rapport à d'autres activités et plus particulièrement, les
activités ‘Prep.dinner’ et ‘Prep. le Goûter’. Dans l’activité ‘Prendre des médicaments’, 46%
des échantillons sont affectés aux classes correspondantes, alors que 26% des cas ont été
confondues avec l’activité ‘Autres activités’ et 11% avec les activités de préparation des repas.
Intuitivement, cela peut être expliqué par le fait que l’activité ‘Prendre des médicaments’ est
réalisée au cours des activités de préparation des repas.
Si on compare les deux méthodes PCA-LDA-HMM et PCA-LDA-WSVM pour la base de
données TAP80F, on constate que les performances de notre méthode de classification
proposée surpassent celles de la méthode PCA-LDA-HMM pour toute les activités, à
l’exception de l’activité ‘Prep. Petit-déjeuner’. Plus particulièrement, on a obtenu une
amélioration significative pour les activités de cuisine avec PCA-LDA-WSVM et une
diminution pour l’activité ‘Ecouter de la musique’ comparativement à la méthode PCA-LDA-
HMM.
114
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
déjeuner
activités
doucher
Autres-
Dormir
toilettes
Sortir
Dîner
Boire
Petit-
Aux
Se
Activités
115
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
musique
Regarde
activités
Laver la
Vaissell
toilettes
Prendre
déjeuné
déjeuné
Prép. le
Autres-
médica
Goûter
ments
Dîner
Prép.
Prép.
Prép.
r TV
Petit
Aux
des
Activités
e
Autres-activités 26.8 6.2 0.6 1.8 3.5 1.5 0.1 0.4 2.5 56.6
Aux toilettes 18.3 17.9 0.0 3.0 6.2 0.0 1.6 0.8 0.0 52.2
Prendre des 30.3 10.3 10.8 4.8 0.0 6.0 0.0 0.0 1.6 36.2
médicaments
Prép. Petit déjeuné 12.0 7.5 0.0 43.3 23.6 3.2 0.0 4.1 0.9 5.4
Prép. déjeuné 3.1 0.0 0.0 3.3 9.0 7.7 0.0 2.8 1.1 73.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 100
Prép. Dîner
12.5 0.0 0.0 2.5 1.6 0.0 0.9 4.4 0.0 78.1
Prép. le Goûter
11.3 6.7 0.0 1.2 4.0 0.6 0.0 14.3 2.1 59.8
Laver la Vaisselle
Regarder TV 4.1 8.1 0.0 1.9 1.0 0.0 0.0 0.3 17.7 66.9
Ecouter de la 2.9 0.0 0.0 0.0 1.5 0.0 0.0 0.4 0.0 95.2
musique
doucher
Autres-
Dormir
toilettes
Sortir
Dîner
Boire
Petit-
Aux
Se
Activités
Aux toilettes 10.0 2.9 82.2 2.1 2.1 0.5 0.2 0.0
116
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
musique
Regarde
activités
Laver la
Vaissell
toilettes
Prendre
déjeuné
déjeuné
Ecouter
Prép. le
Autres-
médica
Goûter
ments
Dîner
Prép.
Prép.
Prép.
r TV
Petit
Aux
des
Activités
e
Autres-activités 60.4 6.4 9.6 4.3 5.2 1.1 2.5 1.5 5.3 3.7
Aux toilettes 14.7 48.9 7.5 3.3 8.7 1.1 5.1 5.8 3.5 1.4
Prendre des 26.5 10.3 45.9 5.9 0.0 2.6 3.1 4.1 1.6 0.0
médicaments
Prép. Petit déjeuné 13.4 3.8 11.2 33.6 24.8 3.2 1.9 4.7 3.2 0.2
Prép. déjeuné 14.1 2.8 13.7 13.9 30.3 5.9 3.2 7.8 3.4 4.9
Prép. Dîner 10.7 3.1 30.0 6.2 16.8 19.3 3.9 7.9 1.4 0.7
Prép. le Goûter 11.5 5.9 21.5 8.7 10.9 7.2 23.1 5.6 1.9 3.7
Laver la Vaisselle 14.0 3.9 7.3 3.9 9.8 3.3 2.4 47.2 2.7 5.5
Regarder TV 17.6 10.6 1.0 0.7 1.5 0.8 0.8 17.5 49.5 0.0
Ecouter de la 15.7 4.7 4.7 1.3 6.6 1.3 1.6 6.6 1.9 55.6
musique
IV.4. Conclusion
Dans ce chapitre, nous avons présenté le principe de la nouvelle méthode proposée PCA-
LDA-WSVM appliquée à la classification des activités humaine au sein d’une maison
intelligente. PCA vise à trouver les directions de l’espace dans lequel la variance des données
est plus grande. LDA repose sur la maximisation d’un critère appelé critère de Fisher qui est le
rapport entre la dispersion inter-classe et intra- classe. Le résultat de cette transformation est
une réduction de la représentation des dimensions, tout comme pour PCA, mais où les classes
devraient idéalement être séparables et plus compactes. Ensuite pour l’étage de classification
d’activités humaines, nous avons choisi le classificateur WSVM, de part sa capacité à bien
traiter le problème de déséquilibre de données entre les classes d’activités humaines.
Nous avons mené plusieurs expérimentations en utilisant différentes bases de données réelles
issues des réseaux de capteurs sans fil. A ce stade, nous avons utilisé plusieurs approches à
savoir HMM, CRF, SVM, WSVM, PCA-WSVM, LDA-WSVM et PCA-LDA-HMM pour
comparaison avec les résultats obtenus avec notre méthode.
117
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
Les résultats expérimentaux obtenus démontrent que les deux approches PCA-LDA-HMM et
PCA-LDA-WSVM était les plus performantes en termes de bonne classification des activités
humaines. Néanmoins, lors de la prise de la moyenne des résultats dans toutes les bases de
données, la supériorité de l'approche proposée ne peut être ignorée comme on peut le voir dans
le tableau IV.1 et particulièrement son pouvoir à améliorer les performances de
reconnaissance des classes d’activités humaines minoritaires.
Il a été aussi démontré qu’il est extrêmement important d’utiliser des informations sur les
étiquettes des classes dans l’étage d’extraction de caractéristiques pour l’apprentissage
supervisé. On constate que LDA-WSVM surpasse PCA-WSVM pour toutes les bases de
données. Bien que LDA soit une méthode d’extraction de caractéristiques efficace pour la
réduction de la dimensionnalité des données, elle reste insuffisante en raison de sa nature
paramétrique. Ceci explique le pouvoir discriminant de la méthode combinée utilisant les deux
types de caractéristiques PCs-LDs.
HMM était supérieure en termes de performance de reconnaissance comparativement à CRF,
SVM et WSVM pour les bases de données TK26M et TAP80F. HMM est entrainé en utilisant
un modèle distinct P(x | y) qui sera appris pour chaque classe d’activité, et les paramètres
sont appris pour chaque classe séparément. Par conséquent, les activités majoritaires
n’affectent pas la classification des activités minoritaires. Ce qui explique l’obtention de
bonnes performances pour les activités minoritaires.
La reconnaissance des trois activités de cuisine dans la base de données TK26M: Petit-
déjeuner, Dîner et boire est faible par rapport aux autres activités pour toutes les méthodes de
classification. Plus de confusion se produit entre ‘Autres activités’ et les activités de cuisine.
En particulier, ‘Autres activités’ est l'une des activités la plus fréquente dans les quatre
ensembles de données, mais n'est généralement pas une activité très importante à reconnaître.
Il pourrait donc être utile d’omettre cette activité. Les activités de cuisine sont des tâches liées
à l'alimentation, elles ont donné de mauvaises performances de classification pour toutes les
méthodes, car la plupart des instances de ces activités ont été réalisées au même endroit
(cuisine) en utilisant le même ensemble de capteurs. Par exemple, les activités ‘Aux toilettes’
et ‘Se doucher’ sont plus séparables parce qu'elles sont effectuées dans deux pièces
différentes, ce qui rend les informations provenant des capteurs suffisamment discriminantes
118
CHAPITRE ІV : PROPOSITION D’UNE APPROCHE INTEGREE POUR LA RAH
pour séparer les deux activités. Par conséquent, la localisation des capteurs est d'une grande
importance pour la performance du système de reconnaissance des activités humaines.
Une dernière remarque peut être énoncée en cette partie de conclusion; nos simulations
réalisées sur les différentes bases de données montrent que les performances de classification
obtenues avec la base de données TK26M sont supérieures par rapport à celles obtenues avec
les autres bases de données pour toutes les méthodes de classification parce que TK26M
contient moins de classes d’activités que les autres bases de données. Donc on constate que
l’augmentation du nombre de classes influence négativement sur les performances de
classification des activités humaines.
Néanmoins, on remarque qu’avec le même nombre de classes égal à 10 dans les bases de
données TAP80F et OrdonezA, les performances de classification étaient moindres pour la
base de données TAP80F. Nous pensons que l'utilisation d’une annotation des données avec
PDA est moins précise par rapport aux autres types d’annotations qui utilisent soit un rapport
d’activité écrit sur papier ou une oreillette Bluetooth combinée avec le logiciel de
reconnaissance automatique de la parole. Dans la base de données TAP80F, l’occupant peut
spécifier une activité dans PDA et exercer une autre activité. L'utilisateur peut également
sélectionner l'activité incorrecte dans la liste PDA par erreur.
119
CONCLUSION GENERALE ET PERSPECTIVES
120
CONCLUSION GENERALE ET PERSPECTIVES
121
CONCLUSION GENERALE ET PERSPECTIVES
Perspectives
Une étude approfondie des bases de données employées dans nos travaux montre un écart
important en termes des activités intégrées. Par exemple, TK57M contient presque la moitié
des classes d’activités contenue dans TK26M. En outre, seulement ‘Autres activités’, ‘Petit-
déjeuner’ et ‘Aller aux toilettes’ sont présents dans tous les ensembles de données, tandis que
d'autres activités ne se produisent que dans un seul jeu de données (par exemple, ‘Laver la
vaisselle’, ‘Écouter de la musique’). L’indépendance des tâches peut également être remise en
question. Par exemple, la tâche ‘manger’ est finalement liée à l’activité ‘Déjeuner’ et ‘Dîner’
se produisant dans la base de données TK57M. Par conséquent, la généralisation des résultats
d'un classificateur d’une base à l’autre doit être prise en compte. Cette notion est connue sous
le nom : Apprentissage par transfert de connaissances (Transfer learning en anglais) qui vise à
transférer des connaissances d'une ou plusieurs tâches source (s) vers une ou plusieurs cible
122
CONCLUSION GENERALE ET PERSPECTIVES
(s). Dans notre cas, ca sera le transfert de connaissances sur l’apprentissage des activités
humaines d’une maison à l’autre.
Dans ce travail, nous avons utilisé l'inférence hors ligne. Les activités ne pouvaient être
déduites avant qu'une journée complète soit écoulée. A l'avenir, il serait intéressant d’adopter
cette stratégie dans l'inférence en ligne [75] qui est nettement plus difficile, mais qui s’avère
nécessaire pour des applications spécifiques. Il serait aussi intéressant, d’intégrer des
connaissances à priori sur les activités humaines afin d’améliorer les performances de
classification. Par exemple, les connaissances temporelles et spatiales sur le déroulement des
activités seront de bons attributs pour discriminer entre les activités humaines. En effet, la
localisation (attribut spatial) va restreindre les activités possibles et l’heure de la journée
(attribut temporel) va nous donner une indication sur l’activité qui peut être réalisée.
123
REFERENCES
REFERENCES
[1] F. Fusier, V. Valentin, F. Brémond, M. Thonnat, M. Borg, D. Thirde, and J. Ferryman.
Video understanding for complex activity recognition. Machine Vision and Applications, 18(3-
4):167–188, 2007.
[2] L. Chen, J. Hoey, C. Nugent, D. Cook and Z. Yu. Sensor based activity recognition, IEEE
Transactions on Systems, Mans and Cybernetics, Part C, 42(6), p. 790-808, 2012.
[3] G. Singla, D.J. Cook, M. Schmitter-Edgecombe. Recognizing independent and joint
activities among multiple residents in smart environments. Journal of ambient intelligence and
humanized computing 1 (1):57-63, 2010.
[4] G. Singla, D.J. Cook, M. Schmitter-Edgecombe. Tracking activities in complex settings
using smart environment technologies. International journal of biosciences, psychiatry, and
technology (IJBSPT) 1 (1):25-35, 2009.
[5] E. Munguia Tapia. Activity recognition in the home setting using simple and ubiquitous
sensors. Doctoral dissertation, Massachusetts Institute of Technology, 2003.
[6] J. Dupâquier. Le vieillissement de la population dans le monde. Bulletin Rayonnement du
Centre National de la Recherche Scientifique (CNRS), (nº42), 2006.
[7] T. L. M. Kasteren. Activity recognition for health monitoring elderly using temporal
probabilistic models. Doctoral dissertation, Faculty of Science, University of Amsterdam,
2011.
[8] H. Cao, M. Nguyen, C.Phua, S. Krishnaswamy, and X. Li. An Integrated Framework for
Human Activity Classification. Proc. of UbiComp12, pp. 331-340, 2012.
[9] L.R.S. Torres, D.C. Ranasinghe, Q. Shi, et al. Learning from Imbalanced Multiclass
Sequential Data Streams Using Dynamically Weighted Conditional Random Fields. Available
online: http://xxx.lanl.gov/abs/arXiv:1603.03627 (accessed on 11 March 2016).
[10] N. V. Chawla. Data mining for imbalanced datasets: An overview. In Data Mining
and Knowledge Discovery Handbook, pp. 875-886. Springer, New York, US, 2010.
[11] I. Brown, & C. Mues. An experimental comparison of classification algorithms for
imbalanced credit scoring data sets. Expert Systems with Applications, 39(3), 3446-3453,
2012.
124
REFERENCES
[12] B. Raskutti and A. Kowalczyk. Extreme re-balancing for SVMs: a case study, SIGKDD
Explorations, vol. 6, no. 1, pp. 60–69, 2004.
[13] T. Plötz, N.Y. Hammerla, & P. Olivier. Feature learning for activity recognition in
ubiquitous computing. In IJCAI Proceedings-International Joint Conference on Artificial
Intelligence, vol. 22, No. 1, p. 1729-1734, 2011.
[14] Z. A. Khan, & W. Sohn. Feature extraction and dimensions reduction using R transform
and principal component analysis for abnormal human activity recognition. In : 6th
International Conference on Advanced Information Management and Service (IMS), pp. 253-
258, IEEE, 2010.
[15] M.B. Abidine, B. Fergani. Evaluating C-SVM, CRF and LDA Classification for Daily
Activity Recognition. The 3rd International Conference on Multimedia Computing and
Systems, ICMCS’12, IEEE, Morocco, pp. 272 – 277, 10 -12 May 2012.
[16] M.B. Abidine, B. Fergani, M. Oussalah , L. Fergani: A new classification strategy for
human activity recognition using cost sensitive support vector machines for imbalanced data.
Kybernetes Journal, vol. 43 Iss: 8, pp.1150-1164, 2014.
[17] M.B. Abidine, B. Fergani and L. Clavier. Importance-Weighted the Imbalanced data for
C-SVM Classifier to Human Activity Recognition. In 8th International Workshop on Systems,
Signal Processing and their Applications (WoSSPA), pp. 330-335, IEEE, Algiers, Algeria,
2013.
[18] A. Fleury, N. Noury, & M. Vacher. Application des SVM à la classification des Activités
de la Vie Quotidienne d'une personne à partir des capteurs d'un Habitat Intelligent pour la
Santé. In XVI èmes Rencontres de la Société Francophone de Classification (SFC), pp. 33-36,
Grenoble, France, 2009.
[20] V. García, J.S. Sánchez, R.A. Mollineda, R. Alejo, J.M. Sotoca. The class imbalance
problem in pattern classification and learning, In II Congreso Espanol de Informatica, Pattern
Analysis and Learning Group, Universitat Jaume I, pp. 283-291, 2007.
125
REFERENCES
[21] M.B. Abidine, B. Fergani, and F. J. Ordonez. Effect Of Over-sampling Versus Under-
sampling For SVM And LDA Classifiers For Activity Recognition. International Journal of
Design & Nature and Ecodynamics, vol. 11, no 3, p. 306-316, 2016.
[22] M.B. Abidine, L. Fergani, B. Fergani, M. Oussalah. The joint use of sequence features
combination and modified weighted SVM for improving daily activity recognition. Pattern
Analysis and Applications (PAA), Springer-Verlag London, In Press, 16 August 2016.
[25] http://mlr.cs.umass.edu/ml/datasets/Activities+of+Daily+Living+%28ADLs%29+Recogni
tion+Using+Binary+Sensors (accessed April , 2015)
[27] L. Chen, J. Hoey, C. Nugent, D. Cook and Z. Yu. Sensor based activity recognition, IEEE
Transactions on Systems, Mans and Cybernetics, Part C, 42(6), p. 790-808, 2012.
[28] S. Helal, W. Mann, H. El-Zabadani, J. King, Y. Kaddoura, E. Jansen. The Gator Tech
Smart House: a programmable pervasive space, Computer 38(3), pp. 50-60, 2005.
[29] V. Joumier, R. Romdhane, F. Bremond, M. Thonnat, E. Mulin, P. H. Robert, A.
Derreumaux, J. Piano, , and J. Lee. Video Activity Recognition Framework for assessing
motor behavioural disorders in Alzheimer Disease Patients. In International Workshop on
Behaviour Analysis and Video Understanding (ICVS 2011), page 9, Sophia Antipolis, France,
2011.
[30] S. Bonhomme. Méthodologie et outils pour la conception d’un habitat intelligent
(Methodology and tools for the design of an intelligent home), Doctoral dissertation, Institut
National Polytechnique de Toulouse, 2008.
[31] Source: World Population Ageing. Department of Economic and Social Affairs
Population Division, United Nations Publications, New York, pages 35-36, 2002.
126
REFERENCES
[35] http://www.vigilio.fr/documentary-base-5-21.html
[36] M. Ogawa, et T. Togawa, The concept of the home health monitoring, In Proceedings of
the 5th International Workshop on Enterprise Networking and Computing in Healthcare
Industry, Healthcom 2003, June 6-7, pp. 71-73, 2003.
[37] D. H. Stefanov, Z. Bien, et W. C. Bang, The Smart House for Older Persons and Persons
With Physical Disabilities: Structure, Technology Arrangements, and Perspectives, IEEE
Transactions on Neural Systems and Rehabilitation Engineering, vol. 12, no. 2, 2004.
[38] M. Chan, D. Estève, C. Escriba, et E. Campo, A Review of Smart Homes- Present state
and future challenges, Computer Methods and Programs in Biomedicine, vol. 91, iss. 1, pp.
55-81, july 2008.
[39] C. D. Nugent, D. D. Finlay, P. Fiorini, Y. Tsumaki, et E. Prassler, Home Automation as a
Means of Independent Living, IEEE Transactions on Automation Science and Engineering,
vol. 5, no. 1, pp. 1-9, 2008.
[40] S. Katz, A. B. Ford, R. W. Moskowitz, B. A. Jackson, and M. W. Jaffe, Studies of illness
in the aged: The Index of ADL: A Standardized Measure of Biological and Psychosocial
Function, The Journal of the American Medical Association (JAMA), vol. 185, pp. 914-919,
1963.
[41] T. Giovannetti, D. J. Libon, L. J. Buxbaum, and M. F. Schwartz, Naturalistic action
impairments in dementia, Neuropsychologia, vol. 40, pp. 1220-1232, 2002.
[42] M. Powell Lawton, M.B. Elaine, Assessment of older people : self-maintaining and
instrumental activities of daily living, Gerontologist, vol. 9, no. 3, pp.179–186, 1969.
127
REFERENCES
[44] A. Baba, S.Yoshizawa, M. Yamada, A. Lee, and K. Shikano. Acoustic models of the
elderly for large-vocabulary continuous speech recognition. Electronics and Communications
in Japan (Part II : Electronics), 87(7) :49–57, 2004.
[45] M. Fezari, and M. Bousbia-Salah. Speech and sensor in guiding an electric wheelchair.
Automatic Control and Computer Sciences, SpringerLink Publication, 41(1): 39-43, 2007.
[46] M. C. Mozer. The neural network house: an environment that’s adapts to its inhabitants »
– in Proc. of the AAAI Spring Symposium on Intelligent Environments, Technical Report SS-
98-02, AAAI Press, Menlo Park, CA, pp. 110-114, 1998.
[49] K. Matsuoka, Aware home understanding life activities – in Proc. Int. Conf.
ICOST’2004,Towards a Human-Friendly Assistive Environment, IOS Press, pp. 186-193,
2004.
[50] Y. Isoda, S. Kurakake, H. Nakano, Ubiquitous sensors based human behavior modeling
and recognition using a spatio-temporal representation of user states – in Proc. 18th
International Conference on Advanced Information Networking and Application (AINA’04),
p. 512, 2004.
[51] M.Vacher, J. Serignat, S. Chaillol, D. Istrate, and V. Popescu. Speech and sound use in a
remote monitoring system for health care, vol. Lecture Notes in Artificial Intelligence,
4188/2006, pp. 711–718. Springer Berlin/Heidelberg, 2006.
128
REFERENCES
[52] G. Virone, and D. Istrate. Integration of an environmental sound module to an existing in-
home activity simulator. Conf Proc IEEE Eng Med Biol Soc, 2007 :3810–3.
129
REFERENCES
[62] V. Jakkula and D. J. Cook, Mining Sensor Data in Smart Environment for Temporal
Activity Prediction, Poster session at the ACM SIGKDD, San Jose, CA, 2007.
[63] I. H. Witten and E. Frank, Data Mining: Practical machine learning tools and techniques,
(The Morgan Kaufmann Series in Data Management Systems), Second Edition, 525 pages,
2005.
[64] B. Reisberg, S. Finkel, J. Overall, N. Schmidt-Gollas, S. Kanowski, H. Lehfeld, et al.,
The Alzheimer's disease activities of daily living international scale (ADL-IS), International
Psychogeriatrics, vol. 13, pp. 163-181, 2001.
[65] C. R. Wren et E. M. Tapia, Toward scalable activity recognition for sensor networks, In
Proceedings of the Second international conference on Location- and Context-Awareness,
série LoCA’06. Berlin, Heidelberg : Springer-Verlag, pp. 168–185, 2006.
[66] E. M. Tapia, S. S. Intille, & K. Larson. Activity recognition in the home using simple and
ubiquitous sensors, In Proceedings on the 2nd International Conference on Pervasive
Computing, vol. 3001, pp. 158–175, Vienna, 2004.
[67] F.J. Ordóñez, P. de Toledo, A. Sanchis. Activity Recognition Using Hybrid
Generative/Discriminative Models on Home Environments Using Binary Sensors. Sensors,
13, pp.5460-5477, 2013.
[68] T. Van Kasteren, A. Noulas, G. Englebienne, & B. Kröse. Accurate activity recognition
in a home setting, in Proceedings of UbiComp’08. New York, NY, USA: ACM, pp. 1-9, 2008.
[69] F.J. Ordóñez. Modelado Ubicuo del Comportamiento para la Asistencia de Personas
Mayores en el Hogar. TESIS DOCTORAL, Septiembre 2013.
[70] R. O. Duda, P. E. Hart, and D. G. Stork, Pattern classification. John Willy and Sons,
Inc., New York, 2nd edition, 2001.
[71] C. Bishop, Pattern Recognition and Machine Learning, Springer. New York, 2006.
[72] L.R. Rabiner. A tutorial on hidden markov models and selected applications in speech
recognition. In Proc IEEE 77(2):257–286, 1989.
[73] C. Cortes, V. Vapnik. Support vector networks. Machine Learning 20:1–25, 1995.
130
REFERENCES
[74] B. Chikhaoui. Une approche basée sur l'analyse des séquences pour la reconnaissance des
activités et comportements dans les environnements intelligents, Thèse de Doctorat,
Sherbrooke, Québec, Canada, 2013.
[76] J. Y. Yang, J.S. Wang, Y.P. Chen. Using acceleration measurements for activity
recognition: An effective learning algorithm for constructing neural classifers. Pattern
Recognition Letters, 29(16):2213-2220, 2008.
[77] T. van Kasteren et B. Krose, Bayesian activity recognition in residence for elders, IET
Conference Publications, vol. 2007, no. CP531, pp. 209–212, 2007.
[78] P. Rashidi et D. J. Cook, Mining Sensor Streams for Discovering Human Activity
Patterns over Time, dans Proceedings of ICDM, pp. 431–440, 2010.
[79] J. Modayil, T. Bai, et H. Kautz, Improving the recognition of interleaved activities, dans
Proceedings of the 10th international conference on Ubiquitous computing, serie UbiComp
’08. New York, NY, USA : ACM, pp. 40–43, 2008.
[80] R. Helaoui, M. Niepert, et H. Stuckenschmidt, Recognizing Interleaved and Concurrent
Activities : A Statistical-Relational Approach, dans PerCom 2011, pp. 1–9, 2011.
[81] N. C. Augusto J., Designing Smart Homes: the role of artificial intelligence, State of the
Art Survey, Lecture Notes in Artificial Intelligence (LNAI 4008), Springer-Verlag, pp. 1-183,
2006.
[82] Y. Tang, S. Wang, Y. Chen, and Z. Chen. Ppcare: A personal and pervasive health care
system for the elderly. In Proc. of IEEE Int. Conf. on Ubiquitous Intelligence Computing on
Autonomic Trusted Computing, pages 935-939, Fukuoka, Japan, September 2012.
131
REFERENCES
[84] H. S. Jae, L. Boreom, and S. P. Kwang. Detection of abnormal living patterns for elderly
living alone using support vector data description. IEEE Transactions on Information
Technology in Biomedicine, 15:438-448, 2011.
[85] H. Zheng, H.Wang, and N. Black. Human activity detection in smart home environment
with self-adaptive neural networks. In Proc. of IEEE Intl Conf. on Networking, Sensing and
Control, pages 1505-1510, Hainan, China, April 2008.
[86] S. Chatterjee Q. Xie and K. Dutta. A predictive modeling engine using neural networks:
Diabetes management from sensor and activity data. In Proc. of IEEE Int Conf. on e-Health
Networking, Applications and Services, pages 230-237, October 2012.
[87] A. S. Helal, J. King, R. Bose, E.-Z. Hicham, and Y. Kaddourah, Assistive environments
for successful aging, In Advanced Intelligent Environments, ed: Springer, pp. 1-26, 2009.
[88] P. Moradshahi, H. Chatrzarrin and R. Goubran. Improving the performance of cough
sound discriminator in reverberant environments using microphone array. In Proc. of IEEE
Int. Conf. on Instrumentation and Measurement Technology, pages 20-23, Graz, Austria, May
2012.
[89] A. Fleury, N. Noury, and M. Vacher. Introducing knowledge in the process of supervised
classification of activities of daily living in health smart homes. In Proc. of IEEE Int. Conf. on
e-Health Networking Applications and Services, pages 322-329, Lyon, France, July 2010.
[90] T. Duong, D. Phung, H. Bui, and S. Venkatesh. Efficient duration and hierarchical
modelingfor human activity recognition. Artificial Intelligence, 173(7-8) :830–856, May 2009.
[91] U. Naeem and J. Bigham. Activity recognition using hierarchical framework. In 2nd
Conference on Pervasive Computing Technologies for Healthcare, Ambient Technologies for
Diagnosing and Monitoring Chronic Patients Workshop, pages 24 – 27, 2008.
[92] S. D. Tran and L. S. Davis. Event modeling and recognition using markov logic
networks. In Proceedings of the 10th European Conference on Computer Vision : Part II,
pages 610–623, Marseille, France, 2008.
132
REFERENCES
[95] Welch, L. R. Hidden Markov Models and the Baum-Welch Algorithm, IEEE Information
Theory Society Newsletter, vol. 53, n°4, pp. 1-13, 2003.
[96] A. Viterbi. Error bounds for convolutional codes and asymptotically optimum decoding
algorithm, Information Theory, IEEE Transactions on, vol 13, n° 2, p.260-269, 1967.
[98] J. M. Hammersley, and P. E. Clifford. Markov random fields on finite graphs and lattices.
Unpublished manuscript, 1971.
[99] A. Vinel. Champs Markoviens Conditionnels pour l’étiquetage de séquences . PhD thesis,
Université Pierre et Marie CURIE university, France, 2013.
[100] B. Schölkopf and A. Smola. Learning with Kernels. MIT Press, Massachusetts,
Cambridge, 2002.
[101] Y.M. Huang, & S.X. Du. Weighted support vector machine for classification with
uneven training class sizes, In: Proceedings of the IEEE International Conference on Machine
Learning and Cybernetics.Vol. 7, pp. 4365-4369, 2005.
[102] K. Veropoulos, C. Campbell and N. Cristianini, Controlling the sensitivity of support
vector machines, Proceedings of the International Joint Conference on AI, Sweden, Workshop
ML3, pp. 55 – 60, 1999.
[103] CW. Hsu CW, CC. Chang, CJ. Lin (2008). A practical guide to support vector
classification. http://www.csie.ntu.edu.tw/*cjlin/papers/ guide/guide.pdf
[104] C. Platt. Sequential minimal optimization: A fast algorithm for training support vector
machines. Technical Report MSR–TR–98–14, Microsoft Research, 1998. Available at
http://www.research.microsoft.com/˜ jplatt/smo.html
133
REFERENCES
[105] G. M. Weiss. Mining with rarity: a unifying framework. ACM SIGKDD Explorations
Newsletter, 6(1) :7–19, 2004.
[106] T.V. Kasteren T, H. Alemdar, C. Ersoy (2011) Effective performance metrics for
evaluating activity recognition methods. In: Proceedings of the ARCS 2011—24th
international conference on architecture of computing systems, Comot, Italy, p. 10, 24–25
Feb, 2011.
[107] F.Verhein, S.Chawla. Using Significant, Positively Associated and Relatively Class
Correlated Rules For Associative Classification of Imbalanced Datasets. The 2007 IEEE
International Conference on Data Mining (ICDM'07). Pages 28-31, Omaha NE, USA.
October 2007.
[108] R. Akbani, S. Kwek, and N. Japkowicz, Applying Support Vector Machines to
Imbalanced Datasets, in the Proceedings of the 2004 European Conference on Machine
Learning, ECML’2004, Springer Berlin Heidelberg, pp. 39-50, 2004.
[109] S. I. Amari and S. Wu, Improving support vector machine classifiers by modifying
kernel functions. Neural Networks, 12(6), 783-789. 1999.
[110] G. Wu, & E. Y. Chang. Adaptive feature-space conformal transformation for
imbalanced data learning. In Proceedings of the 20th International Conference on Machine
Learning ICML, pp. 816-823, 2003.
[111] J. Shawe-Taylor, and N. Cristianini. Further results on the margin distribution. In
Proceedings of the 12th Conference on Computational Learning Theory, pp. 278-285, ACM,
July 1999.
[112] Y. Freund, & R. E. Schapire. A desicion-theoretic generalization of on-line learning and
an application to boosting. In European conference on computational learning theory, pp. 23-
37, Springer Berlin Heidelberg, March 1995.
[113] L. Breiman. Bagging predictors. Machine Learning, 24(2) :123–140, 1996.
[114] R. Barandela, J. S. Sánchez, V. Garcıa, & E. Rangel. Strategies for learning in class
imbalance problems. Pattern Recognition, 36(3), 849-851, 2003.
[115] N. Japkowicz. Concept-learning in the presence of between-class and within-class
imbalances. In Conference of the Canadian Society for Computational Studies of Intelligence
(pp. 67-77), Springer Berlin Heidelberg, June 2001.
134
REFERENCES
[116] W. W. Cohen. Fast effective rule induction. In Proceedings of the twelfth international
conference on machine learning (pp. 115-123), July 1995.
[117] B. Liu, W. Hsu, and Y. Ma. Integrating classification and association rule mining. In
Proc. of ACM Conf. on Knowledge Discovery and Data Mining (KDD), pages 80–86, 1998.
[118] N. V. Chawla, K. W. Bowyer, L. O. Hall, & W. P. Kegelmeyer. SMOTE: synthetic
minority over-sampling technique. Journal of artificial intelligence research, 16, 321-357,
2000.
[119] I. Guyon, A. Elisseeff. An Introduction to Variable and Feature Selection, Journal of
Machine Learning Research, Special Issue on Variable and Feature Selection, 3(Mar):1157-
1182, 2003.
[120] S. Guérif. Réduction de Dimension en Apprentissage Numérique Non Supervisé, Thèse
de doctorat, Université Paris 13, Villetaneuse, Décembre 2006.
[121] IT. Jolliffe. Principal component analysis, 2nd edn. Springer, NewYork, NY, 2002.
[122] R. A. Fisher. The use of multiple measurements in taxonomic problems. Annals of
Eugenics, 7(2):179–188, 1936.
[123] M.B. Abidine, B. Fergani. News schemes for activity recognition systems using PCA–
WSVM, ICA–WSVM, and LDA–WSVM. Information journal 6(3):505–521, 2015
[124] S. A., Zahorian, & H. Hu. Nonlinear Dimensionality Reduction Methods for Use with
Automatic Speech Recognition (Vol. 6). Speech Technologies Source: INTECH Open Access
Publisher, 2011.
[125] M. Pechenizkiy, A. Tsymbal, S. Puuronen. On Combining Principal Components with
Parametric LDA-based Feature Extraction for Supervised Learning. In: T.Morzy et al. (Eds.),
Proc. of 1st Int. Workshop on Data Mining and Knowledge Discovery, ADMKD’05, Estonia,
pp. 47-56, 2005.
[126] A. Frank, A. Asuncion. UCI machine learning repository, 2010.
https://archive.ics.uci.edu/ml
[127] T.V. Kasteren T, H. Alemdar, C. Ersoy (2011) Effective performance metrics for
evaluating activity recognition methods. In: Proceedings of the ARCS 2011—24th
international conference on architecture of computing systems, Comot, Italy, p. 10, 24–25
Feb, 2011.
135
REFERENCES
[128] T.V. Kasteren, G. Englebienne, BJ. Krose. An activity monitoring system for elderly
care using generative and discriminative models. Personal and ubiquitous computing, vol. 14,
no. 6, pp. 489– 498, 2010.
CONTRIBUTIONS SCIENTIFIQUES
COMMUNICATIONS INTERNATIONALES
136
REFERENCES
COMMUNICATIONS NATIONALES
- M.B. Abidine, B. Fergani and L. Clavier. C-SVM versus CRF Classifier for Human Activity
Recognition. The First International Conference On Electrical Engineering and Control
Applications, Khenchela, Algeria, 20 -22, November 2012.
- M.B. Abidine et B. Fergani. A Comparative Study of Four Classifiers for Activity
Recognition in Smart Home. Première Conférence Nationale sur les Télécommunications,
CNT’2012, Guelma, Algeria, 11&12, November 2012.
137