Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2008, Revue Francaise De Linguistique Appliquee
…
22 pages
1 file
Canadian Journal of Information and Library Science, 2011
2009
Thèmes : Web sémantique Résumé : L'examen de différents projets de recherche visantà supporter les activités des membres d'une communautéà l'aide d'une mémoire collective met enévidence l'intérêt de capitaliser les requêtes formuléesà la mémoire et plus généralement les savoir-faire experts d'une communauté en matière de recherche d'information. L'enjeu est de donner les moyens aux membres d'une communauté de réutiliser et partager ces savoir-faire pour retrouver des informations précises et complètes par composition des résultats de requêtes sur différentes sources d'information. Dans cet article, nous proposons un modèle fondé sur les standards du web sémantique pour capitaliser, réutiliser et partager des séquences complexes de requêtes que nous appelons démarches de recherche. Notre modèle est le résultat d'une adaptation de la représentation intentionnelle de processus : nous explicitons les sous-buts qui gouvernent l'organisation d'une démarche de recherche et l'ordre selon lequel ces sous-buts doiventêtre satisfaits. Les démarches de recherche sont représentées en RDF et opérationalisées par des requêtes représentées en SPARQL. L'instanciation d'une démarche repose sur la mise en oeuvre d'un mécanisme de chaînage arrière sur ces règles.
Nous avons mesuré expérimentalement les performances de sujets utilisant un dispositif d'aide à la navigation : le système Agorae basé sur les principes du Web Socio Sémantique et recourant à une approche d'ingénierie des connaissances. Nous avons comparé d'une part ces performances avec celles obtenues en utilisant un moteur de recherche. Nous les avons comparées d'autre part avec celles obtenues par navigation à partir d'une structure simple de mots clés, de type thésaurus, ne faisant pas appel à l'ingénierie des connaissances. Pour ces comparaisons trois groupes d'étudiants débutants se sont vus proposer dans le même temps les mêmes consignes, leur demandant de trouver des unités de valeur (UV) dans le catalogue électronique des enseignements d'une université, équipé par ces trois dispositifs concurrents munis d'un même système de trace. Les résultats nous permettent de conclure à la supériorité à certains égards des performances obtenues avec Agorae, par rapport au moteur et à la structure simple de mot-clés.
2007
Parmi les différentes facettes de la recherche d'information en données textuelles, la recherche d'informations localisées dans l'espace et dans le temps constitue un domaine d'étude à part entière. Celle-ci nécessite en effet, pour l'indexation comme pour la recherche, des analyses linguistiques et des ressources spécifiques. Le projet GéoSem fut le cadre de conception de techniques d'indexation sémantique d'informations géographiques. Ces techniques se trouvent aujourd'hui mises en oeuvre au sein d'un moteur de recherche permettant la localisation intra-documentaire des informations, indexées selon des « axes sémantiques » géographiques (temps, espace et phénomène), sa généricité permettant de le paramétrer pour d'autres axes. Une visualisation de la localisation spatiale et temporelle de l'information est également proposée. Cet article décrit les différentes facettes du moteur.
HAL (Le Centre pour la Communication Scientifique Directe), 2000
Parce qu'il apparaît que le pari en recherche d'information consiste à réduire l'écart entre le niveau du contenu des informations et celui de leur forme, nous nous intéressons ici à une théorie linguistique de la sémantique et choisissons de placer notre travail dans ce cadre. Au fil de cet article, nous sommes amenés à identifier la recherche de documents comme une navigation entre corpus et à définir ce qui relève de l'interactivité et ce qui relève du traitement informatique. Nous intégrons la recherche de documents dans une activité plus large, plus complexe, impliquant d'avantage l'utilisateur et comprenant entre autres l'enrichissement de la description des documents (simples ou structurés) et le partage de cette description avec d'autres utilisateurs. Le but consiste en effet à assister le lecteur de publications savantes en le soulageant des aspects répétitifs de son activité et en le laissant se concentrer sur les aspects créatifs, intuitifs et à haut niveau d'abstraction.
2016
Un modele documentaire permet de definir les unites d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet egalement de definir les liens entre documents ou portions de documents (ex. citation). Les modeles documentaires sont generalement exploites en recherche d’information pour la representation des documents et des requetes et ils autorisent des calculs de pertinence numeriques fondes sur la repartition des unites d’indexation dans la collection de documents. Le modele semantique definit les unites semantiques (concepts, instances de concepts, etc.) qui peuvent etre reliees par des relations (relations hierarchiques ou roles). En recherche d’information, ils permettent d’aller au-dela des mots et de raisonner au niveau des concepts ou instances de concepts. Nous proposons d’unifier les modeles documentaire et semantique dans un unique reseau semantico-documentaire pour representer l’ensemble des proprietes, qu’elles soient num...
2001
L'originalité de notre projet est de se donner les moyens d'accéder au contenu sémantique des textes, pour mieux les cibler et en extraire certaines séquences particulièrement pertinentes. A cet effet, nous nous proposons d'exploiter un savoir de nature purement linguistique, et plus précisément sémantique, en nous appuyant sur la technique d'exploration contextuelle. Le modèle conceptuel et le langage de description des connaissances linguistiques de la plate-forme FilText sont présentés, ainsi que son implémentation logicielle ContextO. Un exemple d'utilisation de ContextO, la production de résumé automatique, est détaillé. ABSTRACT : Our project aims to provide means to identify semantics in texts in order to extract relevant sequences. We present the contextual exploration method which exploits this kind of linguistic knowledge. The conceptual model and the descriptive language used in FilText are presented as well as the workstation ContextO. As an example of the use of ContextO, automatic summarization by semantic labeling is detailed. MOTS-CLÉS : Ingénierie linguistique, étiquetage sémantique, résumé et filtrage automatique, exploration contextuelle, connaissances causales, énoncés structurants.
Conférence en Recherche d'Infomations et Applications, 2012
RÉSUMÉ. Les méthodes de RIS visent à s'affranchir des problèmes classiques de synonymie et polysémie via le passage au niveau conceptuel. Elles reposent souvent sur l'utilisation d'une ressource sémantique. La qualité des résultats dépend des fonctionnalités sémantiques mises en place ainsi que de la qualité de la ressource utilisée. Malgré la profusion des propositions, l'apport d'une sémantique explicite reste à prouver. Nous proposons une décomposition des fonctionnalités qui sont communes aux différentes méthodes de RI. Nous présentons ensuite Terrier SIR qui, via la dissociation des modules sémantiques, favorise aussi bien l'implémenta- tion des méthodes de RIS que leurs éventuelles mises à jour ou adaptations. Nous avons effectué des expérimentations pour mettre en évidence l'intérêt d'une telle plate-forme.
2001
Nous présentons dans cet article un modèle d'exploration contextuelle et une plate-forme logicielle qui permet d'accéder au contenu sémantique des textes et d'en extraire des séquences particulièrement pertinentes. L'objectif est de développer et d'exploiter des ressources linguistiques pour identifier dans les textes, indépendamment des domaines traités, certaines des relations organisatrices des connaissances ainsi que les organisations discursives mises en places par l'auteur. L'analyse sémantique du texte est guidée par le repérage d'indices linguistiques déclencheurs dont l'emploi est représentatif des notions étudiées. In this paper, we present a model of contextual exploration and a workstation dedicated to semantic filtering and relevant sentence extracting. The purpose is to develop and to exploit linguistics resources in order to identify in texts, independently of processed domains, some specific relations which organize knowledge and author discourse. Semantic analysis is driven by the identification of linguistic indicators which are relevant clues for the studied notions.
1996
La sémantique des textes-concepts et applications Cette étude présente synthétiquement un point de vue argumenté par ailleurs dans diverses publications 1. Je commencerai par rappeler les principales approches, pour formuler ensuite des propositions. Je mentionnerai ensuite les besoins nouveaux qu'une sémantique des textes doit contribuer à satisfaire, puis les remaniements épistémologiques qu'elle engage. 1. Problématiques 1.1. La linguistique comme science des textes Admettons tout d'abord que les textes sont l'objet empirique de la linguistique. Isoler des phrases, a fortiori des mots, résulte d'une décision méthodologique ; de même pour abstraire des phrases et des significations, formes typiques décrites par la linguistique. Il n'y a pas en droit deux linguistiques, l'une qui serait centrée sur la morphosyntaxe, et l'autre sur le texte : ce sont seulement deux paliers de description complémentaires. Pour avoir négligé cela, la linguistique restreinte ne s'est pas donné les moyens de penser sa restriction. Quand par exemple Fauconnier estime que Elle a de bonnes jambes est une phrase ambiguë, parce qu'elle peut aussi référer à une scène de cannibalisme, il souligne invo-15
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.
Le Centre pour la Communication Scientifique Directe - HAL - Diderot, 2009
HAL (Le Centre pour la Communication Scientifique Directe), 2021
Conference en Recherche d'Infomations et Applications, 2010
Résolang N°8, 2012