A hybrid approach for automatic text segmentation

Jacques Labiche

A hybrid approach for automatic text segmentation

Jacques Labiche

2019, HAL (Le Centre pour la Communication Scientifique Directe)

Sign up for access to the world's latest research

checkGet notified about relevant papers

checkSave papers to use in your research

checkJoin the discussion with peers

checkTrack your impact

Abstract

Cet article 1 propose une approche hybride pour la segmentation de documents basée sur l'agrégation de différentes solutions. Divers algorithmes de segmentation peuvent être utilisés dans le système, ce qui permet la combinaison de stratégies multiples (spécifiques au domaine, supervisées et nonsupervisées). Un ensemble de documents étiquetés, segmentés au préalable et représentatif du domaine ciblé, doit être fourni pour être utilisé comme ensemble d'entraînement pour l'apprentissage des méthodes supervisées, et aussi comme ensemble de test pour l'évaluation de la performance de chaque méthode, ce qui déterminera leur poids lors de la phase d'agrégation. L'approche proposée présente de bonnes performances dans un scénario expérimental issu d'un corpus extrait du domaine juridique.

Solen Quiniou

2016

La segmentation d'un texte en rheses, unites-membres signifiantes de la phrase, permet de fournir des adaptations de celui-ci pour faciliter la lecture aux personnes dyslexiques. Dans cet article, nous proposons une methode d'identification automatique des rheses basee sur un apprentissage supervise a partir d'un corpus que nous avons annote. Nous comparons celle-ci a l'identification manuelle ainsi qu'a l'utilisation d'outils et de concepts proches, tels que la segmentation d'un texte en chunks.

Log In

A hybrid approach for automatic text segmentation

Sign up for access to the world's latest research

Abstract

Related papers

Related topics

Related papers