Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2010, QDC 2010
…
72 pages
1 file
Nous proposons dans cet article une définition formelle de la robustesse pour les règles d'association, s'appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l'évaluation des règles et n'a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règle peut être très fragile par rapport à des variations légères des données. La mesure de robustesse que nous proposons dépend de la mesure de qualité utilisée pour évaluer les règles et du seuil d'acceptation minimal. Il est alors possible à partir de ces deux seuls éléments et de la valeur prise par la règle sur la mesure d'évaluer sa robustesse. Nous présentons plusieurs propriétés de cette robustesse, montrons sa mise en oeuvre et illustrons celle-ci par les résultats d'expériences sur plusieurs bases de données pour quelques mesures. Nous donnons ainsi un nouveau regard sur la qualification des règles.
Revue des Nouvelles …, 2006
Résumé. Cet article propose une comparaison graphique de certains indices de pertinence pour évaluer l'intérêt des règles d'association. Nous nous sommes appuyés sur une étude existante pour sélectionner quelques indices auxquels nous avons ajouté l'indice de ...
Cet article est le prolongement de l'extraction des règles d'association (RA) Support-valides à base de M GK. L'objectif est de donner un éclairage aux valeurs des RA supports-valides et de faire émerger certaines RA à faibles Supports, mais peuvent avoir une très forte Conf iance. Cela présente un réel intérêt. Le modèle créé nous permet de construire un nouvel indice de cohésion, pièce maîtresse d'une Classification Hiérarchique Implicative et Cohésitive.
2000
Le nombre particulièrement important de règles générées par les algorithmes utilisés en extraction de connaissancesà partir de données (Ecd) ne permet pas aux utilisateurs de faire eux-mêmes la sélection des règles pertinentes. Un des problèmes centraux de l'Ecd est le développement de mesuresévaluant l'intérêt des règles découvertes. Ainsi de nombreuses mesures ontété proposées, parmi lesquelles l'expert est censé choisir celle qui est la plus appropriéeà ses besoins. Mais le nombreélevé de mesures est lui-même un freinà la capacité de choix d'un expert. Pour y remédier, de nombreuses publications dressent des panoramas partiels de ces mesures, s'attachant tantôtà leur qualité algorithmique, tantôt a la formalisation de leurs propriétés, etc. Le résultat n'est malheureusement pasà la hauteur des espérances. A la multiplicité des mesures s'ajoute maintenant la diversité des caractéristiques, lesquelles ne reflètent généralement pas les objectifs de l'expert. Enfin, l'hétérogénéité des valeurs prises par ces caractéristiques n'est pas la moindre des difficultés que rencontre l'utilisateur quand il entreprend de comparer les mesures. Dans ce contexte, et malgré les efforts entrepris, le choix, par un utilisateur métier, de mesures répondantà son objectif reste un défi majeur de la recherche en Ecd. La recherche des meilleures règles parmi le vaste ensemble de règles produit, passe aussi par la recherche et l'utilisation des bonnes mesures. On se trouve donc dans une problématique d'aide multicritèreà la décision (Amd). Nous fondons notre approche sur l'évaluation de 20 mesuresà partir de 8 critères.
Le problème de l'utilité et de la pertinence des règles d'association extraites est primordial car, dans la plupart des cas, les jeux de données réels conduisent à plusieurs milliers voire plusieurs millions de règles d'association dont la mesure de confiance est élevée, et parmi lesquelles se trouvent de nombreuses règles redondantes. Utilisant la sémantique basée sur la fermeture de la connexion de Galois, des bases pour les règles d'association, qui sont des ensembles générateurs pour toutes les règles d'association ainsi que leurs supports et leurs confiances, sont définies.
En datamining l'utlité de l'extraction des regles d'association est fortement limitée par la grande quantité et le peu d'importance des règles extraites. Des que le nombre de regles extraites depasse 100 il devient impossible de les utiliser. Les mesures d'intérêt servent à limiter la quantité de règles selectionées et à augmenter la qualité de ces règles. Le choix des mesures adéquates à appliquer à l'ensemble des règles extraites en premier lieu par les algorithmes d'extraction depend des propriétés souhaitables pour les mesures. Ces propiétés sont fonctions du contexte d'extraction,c'est à dire de la structure des données et du point de vue de l'utilisateur. Plusieurs travaux ont porté sur la formalisation des propriétés des mesures d'intérêt.Mais dans tous les travaux existants les auteurs se limitent à un nombre tres limité de propriétés ou seulement à la forme a → b de la règle d'association. Notre objectif est de proposer une formalisation rigoureuse et générale des propriétés des mesures d'intérêt deja identifiées dans la litterature. Pour réaliser cela nous reprenons la matrice de contingence déja proposée par Tan et nous généralisons son travail à toutes les propriétés souhaitables pour les mesures d'intérêt. Nous obtenons ainsi une étude formelle de toutes les propriétés déja proposées.
2019
Dans cet article, nous partons de l'hypothese que les dynamiques spatiales et les usages des objets geographiques peuvent, en partie, etre expliques voire anticipes par leurs historiques de changements de fonctions et de co-localisations. Ainsi, nous proposons une demarche qui, se basant sur la recherche de regles d'association tout en considerant l'asymetrie des donnees, permet de generer des modeles explicatifs voire predictifs de l'evolution d'un territoire. Appliquees sur des donnees issues de Corine Land Cover, les methodes de fouille proposees ont fait leurs preuves dans la gestion du desequilibre des donnees et les regles generees ont mis en evidence des dynamiques urbaines realistes. ABSTRACT. This work starts from the hypothesis that spatial dynamics and the change of geographical objects functions could be, partly, explained or anticipated by the history of their functions and co-locations changes. Hence, a process, based on association rules-based appr...
Inforsid, 2000
Le problème de l'utilité et de la pertinence des règles d'association extraites est primordial car, dans la plupart des cas, les jeux de données réels conduisent à plusieurs milliers voire plusieurs millions de règles d'association dont la mesure de confiance est élevée, et parmi lesquelles se trouvent de nombreuses règles redondantes. Utilisant la sémantique basée sur la fermeture de la connexion de Galois, des bases pour les règles d'association, qui sont des ensembles générateurs pour toutes les règles d'association ainsi que leurs supports et leurs confiances, sont définies.
Résumé. Le choix de mesures d'intérêt pour la validation des règles d'association constitue un défi important dans le contexte de l'évaluation de la qualité en fouille de données. De nombreuses mesures d'intérêt sont disponibles dans la littérature, et de nombreux auteurs ont discuté et comparé leurs propriétés dans ce but. Mais, comme l'intérêt dépend à la fois de la structure des données et des buts de l'utilisateur (décideur, analyste), certaines mesures peuvent s'avérer pertinentes dans un contexte donné, et ne plus l'être dans un autre. Par conséquent, il est nécessaire de concevoir de nouvelles approches contextuelles pour guider l'utilisateur dans son choix. Dans cet article, nous proposons un outil original ARQAT afin d'étudier le comportement spécifique de 35 mesures d'intérêt dans le contexte d'un jeu de règles, selon une approche résolument exploratoire mettant en avant l'interactivité et les représentations graphiques. ...
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.
HAL (Le Centre pour la Communication Scientifique Directe), 2021
Ingénierie des systèmes d'information, 2004
Cahiers de psychologie politique, 2011
Revue internationale de l'économie sociale: Recma, 2009