0% ont trouvé ce document utile (0 vote)
165 vues2 pages

Recherche d'Information : Exercices LSI 2ème

Transféré par

Yassine Tanabéne
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
165 vues2 pages

Recherche d'Information : Exercices LSI 2ème

Transféré par

Yassine Tanabéne
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Matière: Recherche d’information Niveau : 2eme LSI

Responsable : Hanen Samaali A U : 2022 / 2023

TD 2 : Recherche d’information

Exercice 1 :
Considérons deux documents D1 et D2, représentés sur un vocabulaire T={t1, …, t10}.
La formule logique de D1, est : - WD1 est défini par :

La formule logique de D2 est : - WD2 est défini par :

1. Donner la liste de réponse ordonnée pour chaque requête en utilisant la seconde


similarité vue en cours (modèle booléen pondéré) :
Q1 : t7  t5 Q2 : t2  t10

Exercice 2 :
Soient les ensembles des termes obtenus de l'indexation des documents D1 et D2 suivants:

D1 = {efficacité, recherche, mesurée, précision, moyenne}

D2 = {modèles, recherche, efficaces, langage, vectoriel}

1. Donner la table des fréquences : terme, document;


2. Calculer TF*IDF de chaque terme
Exercice 3 :

Soient : un document qui contient le texte ”maison belle maison”

une collection de 100 documents, le terme ”maison” apparaît dans 20 documents pour un
nombre d’occurrences de 35 au total, le terme ”belle” apparaît dans 35 documents pour un
nombre d’occurrences de 40 au total.

1. Quelle est la pondération ”TF*IDF” des termes ”maison” et ”belle” pour le document
? Commentez les valeurs obtenues.

Vous aimerez peut-être aussi