Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2022
…
9 pages
1 file
L'utilisation d'algorithmes de Machine Learning (ML) en fouille d'opinions notamment ceux d'apprentissage supervisé nécessite un corpus annoté pour entrainer le modèle de classification afin de prédire des résultats proches de la réalité. Malheureusement, il n'existe pas encore de ressources pour le traitement automatique de données textuelles exprimées dans le langage urbain sénégalais. L'objectif de cet article est de construire un corpus multilingue pour la fouille d'opinions (COMFO). Le processus de constitution du corpus COMFO est composé de trois étapes à savoir la présentation de la source de données, la collecte et préparation de données, et l'annotation par approche lexicale. La particularité de COMFO réside dans l'intégration des langues étrangères (française et anglaises) et celles locales notamment le wolof urbain afin de refléter l'opinion collective des lecteurs sénégalais.
2ème Congrès Mondial de Linguistique Française, 2010
Since its emergences in the field of education research, the scientific literature on inter-comprehension has steadily increased. Despite this rise, a curricular integration of this approach remains contingent and punctual. In this respect, an evaluation of its learning outcomes would help highlight and promote the variety, multiplicity and richness of this approach and, as consequence, facilitate its curricular integration. This paper proposes to offer initially, an overview of evaluation practices conducted within various projects in intercomprehension. To conclude, the organizational and functional principles of a referential document identifying the competences involved in Inter-comprehension, as prepared for the European project Miriadi, will be presented and discussed. Finally, open questions such as the definition of learning contents or progression will be addressed.
SHS Web of Conferences, 2016
Nous décrivons une méthode semi-automatique pour la création d'un corpus annoté en français. Ce corpus vise à permettre l'apprentissage d'un système d'analyse d'opinions dans des textes portant sur l'évaluation d'établissements de recherche et d'enseignement supérieur. La création de ce corpus s'effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu'un ensemble de patrons syntaxicosémantiques sont créés automatiquement à partir d'annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l'annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d'accélérer et de faciliter le processus d'annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.
2011
Daille}@univ-nantes.fr Résumé. L'identification de la cible d'une d'opinion fait l'objet d'une attention récente en fouille d'opinion. Les méthodes existantes ont été testées sur des corpus monothématiques en anglais. Elles permettent principalement de traiter les cas où la cible se situe dans la même phrase que l'opinion. Dans cet article, nous abordons cette problématique pour le français dans un corpus multithématique et nous présentons une nouvelle méthode pour identifier la cible d'une opinion apparaissant hors du contexte phrastique. L'évaluation de la méthode montre une amélioration des résultats par rapport à l'existant.
Études internationales, 2015
La création d’un espace discursif mondial dans l’enseignement des Relations internationales est confrontée à trois défis majeurs : transcender l’unicité d’une discipline, surmonter les chauvinismes et intégrer les savoirs pratiques. Nous vivons dans un univers d’ordres mondiaux multiples, qui coexistent et s’interpénètrent. Il nous faut, par conséquent, approcher l’enseignement des Relations internationales de façon à comprendre et à transcender ces différences bien réelles. Nous envisageons les façons de parvenir à l’interdisciplinarité (plutôt qu’à la multidisciplinarité), nous identifions et problématisons les différentes formes de chauvinisme et nous explorons les possibilités d’intégrer les savoirs pratiques (de lier la théorie et la pratique). Cet article s’achève sur quelques recommandations dans l’espoir d’atteindre une forme critique de cosmopolitisme dans l’enseignement des Relations internationales.
2014
Un programme de recherche en cours sur l'etude des phenomenes de contact de langues et de leur role dans le changement linguistique s'attache a recueillir des corpus plurilingues, temoignant d'une grande variete de phenomenes de contact sur un echantillon suffisamment varie de langues genetiquement et typologiquement distinctes. Cet effort a implique le developpement d'une chaine de traitement des corpus numeriques qui tienne compte des specificites des corpus plurilingues, pour la representation des donnees linguistiques, leur stockage, leur annotation, leur visualisation, et les traitements de recherche d'information. Les normes existantes ont du etre etendues pour prendre en compte l'appartenance potentielle d'unites a plusieurs langues dans les pratiques langagieres plurilingues. Dans cet article, nous decrivons la maniere dont a ete definie la structure de ces corpus plurilingues, et la conception technique de l'unite linguistique multilingue qui...
Langues & Parole
Pratique millénaire et nouvelle approche de l’enseignement des langues, l’intercompréhension (IC) en langues parentes a connu ces derniers temps un développement certain, sous l’égide et avec le support d’organisations internationales. L’Université Autonome de Barcelone (UAB) y a participé de manière très active. Ses priorités ont été des directions de travail spécifiques moins visées d’autre part, comme le public jeune, l’oral, les TICE’s, l’interculturel, etc. Mais beaucoup reste encore à faire pour développer cet outil fiable pour les approches plurielles. Un ensemble de références sur des travaux théoriques et des programmes interuniversitaires sur l’IC auxquels a participé l’UAB clôt ce bref article.
Nous présentons le projet Papillon dédié à la construction d'une base lexicale multilingue linguistiquement riche. Ce projet s'appuie sur le principe de construction collaborative, qui permet à chacun, professionel ou amateur, institution ou individu, de contribuer, dans la mesure de ses moyens, à ce grand chantier. Pour qu'un tel travail collaboratif puisse s'amorcer, il est nécessaire de fournir un ensemble conséquent d'informations lexicales multilingues, sur lequel les contributeurs pourront s'appuyer. Après avoir présenté les architectures linguistique, lexicale et informatique du projet Papillon, nous détaillons la méthode utilisée pour créer les informations initiales mises à disposition des contributeurs.
à paraître dans les actes des 5 es Journées de linguistique de corpus (Lorient, 13 -15 septembre 2007)
Les Carnets du Cediscor, 8, PSN, p. 57-74., 2004
Échanges plurilingues en ligne : à la recherche de l'objet du discours Patrick Chardenet p. 57-74
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.
Cahiers de Linguistique, 2008
Document numérique, 2014
Ingénierie des systèmes d'information, 2017
RNTI, SHS-2, Hermann, 81-100, 2014
Les carnets du Cediscor, 2004
Actes de RÉCITAL, 2010
La Revue des droits de l'homme, 2022
Études et Documents Berbères, 2014