Matière: Recherche d’information Niveau : 2eme LSI
Responsable : Hanen Samaali A U : 2022 / 2023
TD 2 : Recherche d’information
Exercice 1 :
Considérons deux documents D1 et D2, représentés sur un vocabulaire T={t1, …, t10}.
La formule logique de D1, est : - WD1 est défini par :
La formule logique de D2 est : - WD2 est défini par :
1. Donner la liste de réponse ordonnée pour chaque requête en utilisant la seconde
similarité vue en cours (modèle booléen pondéré) :
Q1 : t7 t5 Q2 : t2 t10
Exercice 2 :
Soient les ensembles des termes obtenus de l'indexation des documents D1 et D2 suivants:
D1 = {efficacité, recherche, mesurée, précision, moyenne}
D2 = {modèles, recherche, efficaces, langage, vectoriel}
1. Donner la table des fréquences : terme, document;
2. Calculer TF*IDF de chaque terme
Exercice 3 :
Soient : un document qui contient le texte ”maison belle maison”
une collection de 100 documents, le terme ”maison” apparaît dans 20 documents pour un
nombre d’occurrences de 35 au total, le terme ”belle” apparaît dans 35 documents pour un
nombre d’occurrences de 40 au total.
1. Quelle est la pondération ”TF*IDF” des termes ”maison” et ”belle” pour le document
? Commentez les valeurs obtenues.