Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2017
…
78 pages
1 file
L’atelier DiLiTAL se donne pour objectif de sensibiliser la communautescientifique non seulement aux enjeux et aux difficultes rencontrees dans le traitement des langues peu dotees (LPD), mais aussi al’interet de creer des outils generiques permettant de traiter un tres grand nombre de langues, tout en identifiant les besoins specifiques en fonction de leurs particularites. Cet atelier vise a mettre en commun les differentes methodes et techniques utilisees pour dynamiser la construction et la mutualisation des ressources, ainsi que le transfert des savoirs et des savoir-faire.
2017
La détection automatique du langage figuratif dans les réseaux sociaux est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d'analyse d'opinions. Pour la première fois, l'édition 2017 du Défi Fouille de Texte (DEFT) s'intéresse à l'influence du langage figuratif (en particulier l'ironie, le sarcasme et l'humour) dans l'analyse d'opinions à partir de tweets en français. Trois tâches de niveaux de complexité croissants ont été proposées aux participants : (T1) déterminer la polarité globale des tweets non figuratifs, (T2) déterminer si un tweet contient ou non du langage figuratif, et (T3) déterminer la polarité globale des tweets figuratifs et non figuratifs. Douze équipes ont participé à ce défi. Les meilleurs résultats, en macro f-mesure, sont de 0,650 pour (T1), 0,783 pour (T2) et 0,594 pour (T3). Ces résultats montrent clairement que l'usage du langage figuratif complique considérablement l'analyse d'opinions.
2007
Nous proposons une nouvelle approche pour l’intégration du TAL dans les systèmes d’apprentissage des langues assisté par ordinateur (ALAO), la stratégie « moinsdisante ». Cette approche tire profit des technologies élémentaires mais fiables du TAL et insiste sur la nécessité de traitements modulaires et déclaratifs afin de faciliter la portabilité et la prise en main didactique des systèmes. Basé sur cette approche, ExoGen est un premier prototype pour la génération automatique d’activités lacunaires ou de lecture d’exemples. Il intègre un module de repérage et de description des réponses des apprenants fondé sur la comparaison entre réponse attendue et réponse donnée. L’analyse des différences graphiques, orthographiques et morphosyntaxiques permet un diagnostic des erreurs de type fautes d’orthographe, confusions, problèmes d’accord, de conjugaison, etc. La première évaluation d’ExoGen sur un extrait du corpus d’apprenants FRIDA produit des résultats prometteurs pour le développem...
HAL (Le Centre pour la Communication Scientifique Directe), 2020
HAL (Le Centre pour la Communication Scientifique Directe), 2020
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Trait. Autom. des Langues, 2013
Cet article rapporte une serie d’experiences visant a (1) evaluer la contribution du TAL a la problematique de la lisibilite des textes du francais langue etrangere (FLE) et (2) a proposer une nouvelle formule de lisibilite pour le FLE. Ce nouveau modele repose sur 46 variables representatives des niveaux lexical, syntaxique et semantique, ainsi que certaines des specificites du contexte FLE. Nous rapportons des comparaisons entre plusieurs techniques pour la selection des variables et differents algorithmes d’apprentissage. Notre meilleur modele, base sur les machines a vecteurs de support (SVM), surpasse de maniere significative les modeles precedents pour le francais. En ce qui concerne la contribution du TAL a la lisibilite, nos resultats suggerent que les modeles bases sur le TAL ne sont pas significativement superieures aux approches classiques, mais que combiner des deux types d’information conduit a une amelioration significative des performances.
HAL (Le Centre pour la Communication Scientifique Directe), 2020
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
2006
New text analysis softwares issued from fields of research such as Machine Learning and Natural Languages Processing prove to be relevant tools for the language sciences. Littératron is a new data-processing tool for the automatic extraction of syntactic patterns, designed at LIP6 by Jean-Gabriel Ganascia. Associated with a linear text analyser, it reveals the stylistic peculiarities of a text. We
HAL (Le Centre pour la Communication Scientifique Directe), 2004
Le présent article se focalise sur le développement d'outils de traitement automatique des langues (TAL) pour l'apprentissage des langues assisté par ordinateur (ALAO). Après avoir identifié les limitations inhérentes aux outils d'ALAO dépourvus de composantes TAL, nous décrivons le cadre général du projet MIRTO, une plateforme de création d'activités pédagogiques fondé sur des outils TAL en développement au sein de notre laboratoire. Cette plateforme est organisée en quatre couches distinctes et successives : fonctions, scripts, activités et scénarios. À travers plusieurs exemples, nous expliquons en quoi l'architecture de MIRTO permet l'implantation de fonctions TAL classiques au sein de scripts, lesquels facilitent la conception, sans compétence informatique préalable, d'activités didactiques, elles-mêmes éventuellement intégrées au sein de séquences plus complexes, ou scénarios. 'il est généralement admis que l'informatique peut être d'un grand secours pour l'apprentissage des langues, force est de constater que, le plus souvent, informaticiens et didacticiens des langues n'admettent pas la même acception du terme "langue". Pour les uns, il s'agit d'une séquence de codes, pour les autres d'un système de formes et de concepts. Cette différence peut s'expliquer aisément lorsque l'on constate que l'informatique, par définition, ne peut considérer et ne peut traiter que la forme de la langue dénuée de toute interprétation, alors que pour la didactique des langues, la forme n'existe que par ses propriétés et des concepts qu'elle est censée représenter. Les conséquences de cette double approche sont "visibles" dans la grande majorité des logiciels d'apprentissage des langues, et à l'origine de bon nombre de leurs imperfections. La plupart des
Le corps du présent article reprend, à peu près inchangée, la communication lue à l'Académie le 6 janvier 2012. On trouvera en note le contenu de l'exemplier que nous avons distribué lors de la séance ; nous avons inclus, également en note, des compléments pour partie inspirés par les remarques qui nous ont été faites au cours de la discussion. Nous tenons à exprimer toute notre gratitude à MM. A. Crépin, Ch. de Lamberterie, G. Lazard, R. Martin, B. Pottier pour leurs observations et suggestions. Nous remercions également M mes et M. A. Henri, J.-P. Chambon et C. Secretan pour leur lecture attentive et leurs commentaires.
Neophilologica, 2023
Using the notion of predicate in the sense of an element structuring the sentence at the surface level, G. Gross arrives at an interpretation of linguistic facts that is valid for those who adopt the concept of semantic predicate as a tool for analysis. It belongs to the abstract level of meaning and is considered to be an essential part of the mechanism for disambiguation and selecting the meaning of lexemes or grammatical structures. This mechanism is particularly important in the context of machine translation where it is necessary to choose, in the bilingual transfer dictionary, the accurate equivalent of a polysemic lexeme in the target language.
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.
Actes de la 26e conférence sur le Traitement automatique des langues naturelles (TALN). Toulouse, 2019
La Revue pour l’histoire du CNRS, 2009
HAL (Le Centre pour la Communication Scientifique Directe), 2020
HAL (Le Centre pour la Communication Scientifique Directe), 2013
HAL (Le Centre pour la Communication Scientifique Directe), 2007
HAL (Le Centre pour la Communication Scientifique Directe), 2004
HAL (Le Centre pour la Communication Scientifique Directe), 2018
Didactique des langues et apports des sciences neurocognitives et de l’approche neurolinguistique, 2024
Dans : Bigot V., Bretegnier A. & Vasseur M. (dir.), Vers le plurilinguisme ? Vingt ans après, Paris : Editions des archives contemporaines, 2013
2006