Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2007, Computing Research Repository - CORR
This paper deals with decision support systems resting on multidimensional modelling of data. Moreover, we intend to offer a set of concepts and mechanisms for personalized multidimensional database specifications. This personalization consists in associating weights to different components of a multidimensional schema. Personalization specifications are specified through the use of a language based on the principle of Event Condition Action. This personalisation determines multidimensional data display as well as their analyses (with the use of drilling or rotating operations).
2010
Les systèmes OLAP se basent généralement sur des Bases de Données Multidimensionnelles (BDM) qui représentent des extractions de l'entrepôt, dédiées à des groupes de décideurs. Les utilisateurs d'un même groupe ont souvent différentes perceptions du contenu d'une BDM. Nous proposons un cadre de personnalisation pour les systèmes de gestion des BDMs basé sur des profils utilisateurs. Ces profils sont constitués de préférences contextuelles qui permettent d'adapter le contenu de la BDM à la perception de chaque utilisateur, formant un contenu personnalisé. Durant l'exécution d'une requête, le système reformule la requête en tenant compte des préférences de l'utilisateur afin de simuler son exécution sur un contenu individuel.
Revue des Nouvelles Technologies de l’Information (RNTI-B-2)-Entrepôts de Données et Analyse en ligne (EDA’06), 2006
Résumé. Cet article présente le concept de Mémoire d'Expertises Décisionnelles (MED). Une MED comprend d'une part des fonctionnalités d'un système d'aide à la décision et d'autre part des fonctionnalités de mémorisation et d'exploitation du capital immatériel des décideurs. Notre système d'aide à la décision repose sur une Base de Données Multidimensionnelles (BDM) composée de faits, dimensions, mesures, hiérarchies et paramètres. Le capital immatériel des décideurs est articulé au travers d'annotations ...
2009
Nous étudions dans cet article les enjeux et les opportunités relevant de la prise en compte des utilisateurs au sein des entrepôts de données. Pour ce faire, nous présentons tout d'abord un panorama des travaux sur la personnalisation dans les domaines connexes des bases de données et de la recherche d'information. Nous présentons ensuite les quelques travaux qui émergent dans le domaine des entrepôts de données et menons une étude comparative selon différents angles d'approche. Ceci nous permet de faire émerger des perspectives de recherche sur la personnalisation dans les entrepôts de données.
EGC, volume RNTI-E-6 of Revue des Nouvelles Technologies de l’Information, 2006
Résumé. Nos travaux visent à proposer une mémoire d'expertises décisionnelles permettant de conserver et de manipuler non seulement les données décisionnelles mais aussi l'expertise analytique des décideurs. Les données décisionnelles sont représentées au travers de concepts multidimensionnels et l'expertise associée est matérialisée grâce au concept d'annotation.
En vue d'assister le concepteur décisionnel, nous présentons une méthode ascendante de construction de schémas en étoile à partir d'une source relationnelle. Pour cela, nous étudions la structure des relations et nous proposons une classification en relation-associations et relation-entités permettant de construire des faits et des dimensions respectivement. Notre méthode a le mérite d'être indépendante de la sémantique du système d'information source. Elle exploite les contraintes de clés primaires et référentielles pour extraire les concepts multidimensionnels et affecte un niveau de pertinence à chaque concept extrait.
Les données des systèmes d'analyse en ligne (OLAP, On-Line Analytical Processing) sont traditionnellement gérées par des bases de données rela-tionnelles. Malheureusement, il devient difficile de gérer des mégadonnées (de gros volumes de données, « Big Data »). Dans un tel contexte, comme alternative , les environnements « Not-Only SQL » (NoSQL) peuvent fournir un passage à l'échelle tout en gardant une certaine flexibilité pour un système OLAP. Nous définissons ainsi des règles pour convertir un schéma en étoile, ainsi que son op-timisation, le treillis d'agrégats pré-calculés, en deux modèles logiques NoSQL : orienté-colonnes ou orienté-documents. En utilisant ces règles, nous implémen-tons et analysons deux systèmes décisionnels, un par modèle, avec MongoDB et HBase. Nous comparons ces derniers sur les phases de chargement des données (générées avec le benchmark TPC-DS), de calcul d'un treillis et d'interrogation.
2005
L'informatique décisionnelle vise à accroître la flexibilité et la réactivité des organisations face aux changements impliqués par l'introduction des nouvelles technologies de l'information et de la communication. C'est un concept générique mettant en cause des concepts plus vastes de Data Warehouses (entrepôts de données), tableaux de bord …etc. L'entrepôt de données correspond à une collection de données extirpées de bases de données. Les bases de données (BD) alimentant l'entrepôt sont multi-sources, distribuées et hétérogènes, traduisant soit une diversité de technologies et d'accès, soit une diversité de perception et de représentation. Alors que les premiers tableaux de bords étaient élaborés dans un cadre étroit de données comptables, ceux-ci ont ensuite évolué, vers l'exploitation de données multi-origines d'où leur intégration dans des environnements de Data Warehouses. Nous avons enfin la toute dernière génération qui nous vient des USA (par Robert S. Kaplan et David P. Norton) à savoir les tableaux de bords prospectifs (Balanced scorecards ou BSC) ensemble de mesures directement liées à la vision et la stratégie d'entreprise, et organisées selon quatre axes : les finances, les clients, les processus opérationnels et l'apprentissage. Nous nous intéressons dans cet article à la construction de tableaux de bord prospectifs dans des environnements de Data Warehouses.
2006
Cet article décrit une approche de la recherche d'information permettant l'accès personnalisé à plusieurs serveurs d'information. L'accès à des serveurs d'informations distribués est souvent effectué en trois étapes, la première consiste à sélectionner les serveurs pertinents pour la requête, puis soumettre la requête à ces serveurs sélectionnés et finalement fusionner les résultats retournés par ces serveurs. L'objectif de cet article est d'intégrer l'utilisateur via son profil dans les processus de sélection et de fusions des résultats des serveurs. Nous avons testé notre approche sur les moteurs de recherches suivant : GOOGLE, YAHOO, ALTAVISTA, MSN, LYCOS, TEOMA, WISENUT, ALLTHWEB. ABSTRACT. This article describes an information retrieval approach giving access personalized to several information servers. The access to distributed information servers often carried out in three stages, the first consists in selecting the relevant servers for the user query, then to send the query to these selected servers and finally merging the results turned by these servers. The objective of this article is to integrate the user via his profile in the server selecting and results merging process. We have tested our approach on the search engines GOOGLE, YAHOO, ALTAVISTA, MSN, LYCOS, TEOMA, WISENUT, and ALLTHWEB. MOTS-CLÉS: recherche d'information distribuée, profil utilisateur, sélection de serveur, fusion de résultats. .
Nous donnons dans ce travail une généralisation de la méthode proposée par Castillo, Sarabia et Hadi (1997) [1] à partir de la bivariante à la multi variante. Soit X=(X 1 , X 2 ,…,X r ) un vecteur de variables aléatoires de fonction de distribution conjointe (CDF) F(X ;θ) ; ou θ est le paramètre vecteur-valué à estimer. Pour estimer θ en se basant sur un échantillon aléatoire observé à partir de F(X ; θ), nous écrivons en un premier lieu les valeurs prédits comme fonction du paramètre θ ; alors un estimateur de θ est obtenu en minimisant la somme des écarts quadratiques entre les valeurs prédits et observés de l'échantillon. L'idée est d'utiliser les fonctions de distributions conjointes et marginales CDFs pour calculer les valeurs prédites comme fonctions de θ ; et ce par généralisation du cas bivariant [1] au cas multi variant. La généralisation de la méthode est illustrée par des applications de la distribution logistique multi-variante. Des résultats de simulation indiquent que la méthode généralisée fonctionne bien. Cette méthode généralisée peut être aussi appliquée à un exemple de données réelles.
Concevoir une base de données à l'aide d'UML ou d'un formalisme entité-association S'adressant aux architectes logiciels, chefs de projet, analystes, développeurs, responsables méthode et étudiants en informatique, cet ouvrage explique comment créer un diagramme conceptuel pour concevoir une base de données optimisée via le langage SQL. La démarche est indépendante de tout éditeur de logiciel et aisément transposable, quel que soit l'outil de conception choisi.
Le code de la propriété intellectuelle du 1 er juillet 1992 interdit expressément la photocopie à usage collectif sans autorisation des ayants droit. Or, cette pratique en se généralisant provoquerait une baisse brutale des achats de livres, au point que la possibilité même pour les auteurs de créer des oeuvres nouvelles et de les faire éditer correctement serait alors menacée.
Coria, 2006
Cet article décrit une approche de la recherche d'information permettant l'accès personnalisé à plusieurs serveurs d'information. L'accès à des serveurs d'informations distribués est souvent effectué en trois étapes, la première consiste à sélectionner les serveurs pertinents pour la requête, puis soumettre la requête à ces serveurs sélectionnés et finalement fusionner les résultats retournés par ces serveurs. L'objectif de cet article est d'intégrer l'utilisateur via son profil dans les processus de sélection et de fusions des résultats des serveurs. Nous avons testé notre approche sur les moteurs de recherches suivant : GOOGLE, YAHOO, ALTAVISTA, MSN, LYCOS, TEOMA, WISENUT, ALLTHWEB. ABSTRACT. This article describes an information retrieval approach giving access personalized to several information servers. The access to distributed information servers often carried out in three stages, the first consists in selecting the relevant servers for the user query, then to send the query to these selected servers and finally merging the results turned by these servers. The objective of this article is to integrate the user via his profile in the server selecting and results merging process. We have tested our approach on the search engines GOOGLE, YAHOO, ALTAVISTA, MSN, LYCOS, TEOMA, WISENUT, and ALLTHWEB. MOTS-CLÉS: recherche d'information distribuée, profil utilisateur, sélection de serveur, fusion de résultats. .
HAL (Le Centre pour la Communication Scientifique Directe), 2015
Les systèmes NoSQL (Not Only SQL) se développent notamment grâce à leurs capacités à gérer facilement de grands volumes de données, et leur flexibilité en terme de type de données. Dans cet article, nous étudions l'implantation d'un entrepôt de données multidimensionnelles avec un système NoSQL orientée documents. Nous proposons des règles de transformation qui permettent de passer d'un modèle conceptuel multidimensionnel vers un modèle logique NoSQL orienté documents. Nous proposons trois types de transformation pour implanter les entrepôts de données multidimensionnelles. Nous expérimentons ces trois approches avec le système MongoDB, et étudions le chargement des données, les processus de transformation d'un type d'implantation à un autre ainsi que le précalcul d'agrégats inhérents aux entrepôts de données multidimensionnelles.
Extraction et Gestion des Connaissances, 2001
Les bases de données multidimensionnelles permettent un support efficace des processus OLAP qui améliorent la prise de décision dans les entreprises. De telles bases s'appuient sur une organisation multidimensionnelle des données regroupant des faits qui sont vus comme des points dans un espace dimensionnel. Cet article propose un modèle de données étendu pour les bases de données multidimensionnelles. Notre approche consiste à modéliser l'information sous la forme d'une constellation de faits et de dimensions pouvant être partagées entre plusieurs faits et qui sont organisées selon des hiérarchies multiples d'attributs. Nous présentons également une série d'opérations permettant la manipulation multidimensionnelle des magasins de données. L'objectif de notre modèle est d'unifier les différentes propositions de modélisation multidimensionnelle.
Une variable est une caractéristique (ou grandeur) permettant d'observer le comportement d'une population ou d'un échantillon d'un individu à un autre. Plus elle est mesurable, c'est donc une variable quantitative (discrète/continue). Plus elle relève de l'appréciation, c'est une variable qualitative (nominale/ordinale). Une taille, en statistique, est le nombre d'observation d'une étude donnée. Elle est notée « N » pour désigner une population et « n » pour un échantillon de cette population. Une Valeur manquante, noté « NA » « N/A » « NaN » selon le logiciel, elle correspond à une valeur n'étant pas renseignée dans la base de données. (Il arrive cependant de confondre avec le chiffre 0, qui lui est bien distincte d'une valeur manquante. Une Valeur extrême représente un cas spécifique dans une distribution et correspond à un attribut très élevé ou plus faible par rapport aux autres observations.
EDA, 2012
Les données d'un entrepôt sont rafraîchies périodiquement et conservées de manière permanente. Cependant, les décideurs portent généralement un intérêt moindre pour les données anciennes. Dans cet article, nous proposons un mécanisme permettant de synthétiser les données les plus anciennes. Nous définissons un modèle conceptuel d'archivage de données multidimensionnelles. Nous présentons, ensuite, le modèle logique correspondant et les principes permettant d'interroger des schémas multidimensionnels archivés.
Ingénierie des systèmes d'information, 2013
De nombreux modèles ont été proposés pour la modélisation de données multidimensionnelles dans les entrepôts. Ces propositions considèrent une même fonction d'agrégation pour déterminer les valeurs d'une mesure aux différents niveaux de granularité de l'espace multidimensionnel. Nous proposons un nouveau modèle conceptuel plus flexible supportant des agrégations multiples différentiées. L'agrégation multiple permet d'associer à une même mesure, une fonction d'agrégation différente pour chaque axe d'analyse. L'agrégation différentiée autorise des agrégations spécifiques à chaque niveau de granularité. Le modèle proposé repose sur des formalismes graphiques suffisamment expressifs pour contrôler la validité des fonctions d'agrégation qui peuvent être distributives, algébriques ou holistiques. Nous montrons également comment la modélisation conceptuelle peut être exploitée au niveau logique R-OLAP pour construire efficacement des treillis de pré-agrégats. ABSTRACT. Many models have been proposed for multidimensional data warehouses modeling. These propositions consider the same aggregate function to determine the values of a measure with different levels of granularity of the multidimensional space. We propose a new conceptual model for multidimensional representation of data supporting multiple differentiated aggregations. Multiple aggregation allows to associate to the same measure, a different aggregation function for each axis of analysis. Differentiated aggregation allows specific aggregations at each level of granularity. The proposed model is based on graphical formalisms expressive enough to control the validity of aggregate functions that can be distributive, algebraic and holistic. We also show how conceptual modeling can be exploited in logic R-OLAP to build effectively lattices of pre-aggregates. MOTS-CLÉS : système décisionnels, base de données multidimensionnelles, modélisation conceptuelle d'entrepôt de données, mécanismes d'agrégations multiples dans les treillis multidimensionnels.
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.