0% ont trouvé ce document utile (0 vote)

99 vues5 pages

Le Web Partie 1: Petite Introduction

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

99 vues5 pages

Le Web Partie 1: Petite Introduction

Transféré par

Fyzer

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Le Web

Partie 1 : Petite introduction

Le web est une utilisation particulière d’internet qui est, au même titre que le mail, le transfert de fichier, a
conversation, un moyen utilisé par les personnes pour échanger des informations.
Commençons par une rapide présentation des communications sur internet
Imaginons l’envoi d’un message. Si ce message est une lettre vous avez besoin d’un émetteur, d’un récepteur, d’un
support de transmission (la lettre), d’un support d’envoi (l’enveloppe) et d’un intermédiaire (la poste)
Pour un document électronique c’est pareil, on suit un modèle en couche comportant des protocoles (moyens de
transmission de l’information) spécifiques à chaque couche.
Quand un hôte A envoie un document à un hôte B, le processus d'envoi va de la couche application (protocole
HTTP ou FTP) passe par la couche transport (protocole TCP) qui prépare les fichier pour envoi à la couche réseau
(protocole IP) pour la livraison sur la couche liaison et physique (protocole éthernet puis switch – hub). En
revanche, quand il s'agit de recevoir, le message emprunte le chemin inverse : il part de la couche physique pour
arriver à la couche application.

Partie 2 : Fonctionnement du Web : URL – HTTP - Requêtes

Activité 1 : Faire l’activité 2 p 60

Activité 2 : Observer les images ci dessous et répondre aux questions

Observer la différence entre les deux adresses fournies ci dessus et conclure sur l’origine de la page.
Visualisons des requêtes sur une page (Sous firefox : Menu – developpement web – console web)
2. Quelle est la requête HTTP employée par ce site pour fournir les informations ?
3. Que signifie, à votre avis le 200 encadré de vert ?
4. a) Que représente le bandeau gris se trouvant au dessus de la console web ?
b) Apparaît-il systématiquement ?
c) Pourquoi, à votre avis, est-il apparu ici ?
Un petit peu plus de détail
Une

autre requête sur une page yahoo

5. Quel est le type de fichier demandé par les deux requêtes GET et POST ci dessus ?

Pour se faire une idée rapide de la différence entre les requêtes GET et POST (pas à connaître en détail
évidemment)
https://www.ionos.fr/digitalguide/sites-internet/developpement-web/get-vs-post/
Partie 3 : Les moteurs de recherche ou moteur de réponse
Document 1 : Mode de fonctionnement des moteurs de recherche
Une requête est envoyée : des logiciels robots (spider ou crawler) parcourent, non pas le web, mais l’index du web
préalablement crée par le moteur (40 à 50 milliard de pages pour google, 20 milliards pour bing), pour chercher les
termes de la requête puis se pose une série de questions : combien de fois la page contient les mots, sont-ils dans le
titre ou le texte, la page contient-elle des termes synonyme, la page fait-elle partie d’un site de bonne qualité, est-ce
de la tricherie ? Est-ce que le pageRank est bon ?
Le résultat de la requête est une liste de sites qu’il nous faut consulter pour affiner notre recherche
Mais de plus en plus, les moteurs envoient des contenus comme des billets d’avion , la météo, des définitions,…

Activité 1 : Montrer que google se positionne de plus en plus comme moteur de réponse et non de
recherche et en déduire les conséquences pour l’utilisateur ainsi que pour l’éditeur de site web.

Document 2 : La source de l’information : l’index.

Lors de l’indexation, le spider vient sur un site envoie le code HTML à google pour indexation, puis clique sur tous
les liens de la page et recommence l’envoi (c’est comme un internaute qui clique sur tout les liens). Une mise à jour
de l’index est faite en fonction de la mise à jour de la page
Chaque robot fonctionne à sa manière. Voilà pourquoi les résultats peuvent être différents pour une même requête
selon que l'on utilise tel ou tel moteur. Les 3 principaux systèmes d'indexation utilisés par les robots sont les suivants
(certains en utilisent plusieurs):
par mots clés. Lors de la conception d'une page Web, l'auteur peut indiquer une liste de mots clés (non affichée à
l'écran : balise META keywords) qui sera recherchée par le moteur.
par titre. De même, la balise TITLE indique aux moteurs de recherche le titre du document.
dans le texte. Le robot indexe tous les mots (ou les mots des premières lignes) des pages Web.

Activité 2 : Exemple d’indexation et de requête

Soient les textes suivant (en gras le titre de la page) L’indexation de ces textes donne
1) page justice.html Avocat
En droit, l’avocat est un juriste dont les fonctions traditionnelles
sont de conseiller, représenter, assister et défendre ses clients en avocat (justice,6)(avocat,7)
justice en plaidant pour faire valoir leur droits. droit (justice,2)
2) page avocat.html Avocat
fruit (avocat,1)(fruit, )
L’avocat est le fruit de l’avocatier un arbre originaire du Mexique.
Pour murir l’avocat a besoin de beaucoup d’eau et de Soleil juriste (justice, )
3) page fruit.html Fruit
Un fruit est un aliment végétal, la saveur sucrée généralement
consommé cru
Questions
1. Que représentent les valeurs numérique entre parenthèse dans
l’index ?
2. Compléter le tableau avec les valeurs numériques manquantes.
3. On envoie une requête dans un moteur de recherche avec les mots avocat (page1,20)(page 2, 5) (page 3, 15)
«avocat » « droit ». L’index est fourni ci contre. droit (page2,25)(page 3, 10) (page 4, 5)
a) Dans quel ordre les pages seront données ?
b) Même question si le premier mot clé compte double fruit (Page1,10) (page5,20)
4. A partir de cet index, montrer en quoi une recherche à deux mots
clés (avocat + droit) est plus pertinente qu’une recherche à 1 seul
mot clé (avocat)?

Activité 3 : Parcours du Web

Le principe de parcours du web :
On utilise deux listes
- Les pages déjà visitées (aucune au départ)
- Les pages à visiter à partir du point de départ
1. On prend une page parmi les pages à visiter
2. On la transfère dans la liste des pages visitées, on ajoute à la liste des pages à
visiter les pages accessibles depuis la page atteinte
3. On continue dans l’ordre des pages à visiter jusqu’à ce qu’il n’y ait plus de
pages à visiter.
Questions
1. Donner le parcours du graphe en listant les pages visitées et à N° étape Pages visitées Pages à visiter
visiter à chaque étape en partant du point E (compléter un tableau
comme ci contre) 1 E
2. Même question pour un départ du point A, tirer une conclusion 2 E A,H
sur le référencement (présence dans l’index) de certaines pages.
3. Pourquoi est-il préférable de parcourir le graphe par plusieurs points d’entrée

Activité 4 : Un peu de python

Une fonction faisant partie du programme python du moteur de recherche est présentée ci dessous
visitees et aVisiter sont des listes L = [1,2,3,4] L[0]
def visiterPage(page, listeLiens):
#définition de la fonction avec en entrée une page et la liste des liens associés

visitees.append(page) # On ajoute la page « page » à la liste visitees

aVisiter.remove(page) # On enlève la page « page » de la liste a visiter
for page2 in listeLiens: # On parcours les élements de la liste liste des liens
if (not page2) in visitees and (not page2) in aVisiter: #
aVisiter.append(page2) #
« page » est une page html du graphe et « liste lien » est la liste des liens sortant de cette page.
Questions
1. Quel est le rôle d’une fonction en python ?
2. Quel est le rôle de la fonction présentée ci dessus ?
3. Compléter les commentaires avec ce que vous comprenez du programme.
4. Tester le code sur colaboratory en créant des listes nécessaires constituées de nombres.

Document 3 : Mesure de la notoriété d’une page : L’algorithme PageRank google

Le PageRank est une méthode utilisée par Google pour déterminer l’importance d’une page Web.
Il s’agit de l’un des critères qui permettent la réponse du moteur de recherche à une requête
Elle se base sur un concept très simple : un lien émis par une page A vers une page B est assimilé à un « vote » de A
pour B. Au plus une page reçoit de « votes », au plus cette page est considérée comme importante par Google
L’importance d’une page est sans rapport aucun avec l’intérêt ou la pertinence de celle-ci, ces deux dernières notions
étant totalement absentes de l’algorithme du PageRank. Elles interviennent néanmoins dans les pages de résultat de
recherche.
Supposons qu’une page A reçoit des liens émis par les pages T1…Tn.
Le paramètre d est un facteur d’amortissement pouvant être ajusté entre 0 et 1.
Nous donnons généralement à d la valeur 0,85.
De même, C(A) est défini comme le nombre de liens émis par la page A (liens sortants).
Le PageRank de la page A est défini comme suit : PR(A) = (1-d) + d(PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
L’algorithme donne une valeur initiale à toutes les pages puis calcule une nouvelle valeur pour chaque page à l’aide
de la relation jusqu’à ce que les valeurs soient stabilisées.
Dans notre exercice, nous considérerons que la popularité de la page A (P(A)) se mesure avec la relation
P(A) = P(T1)/C(T1) + … + P(Tn)/C(Tn)

Activité 5 : Evaluons la popularité d’une page

Afin de quantifier la popularité d’une page, l’algorithme calcule
un score qui est proportionnel au nombre de fois qu’un
internaute visite la page quand il clique de manière aléatoire
sur les hyperliens.
On utilisera la calculatrice pour générer un nombre aléatoire
(parmi 2 ou 4 suivant la page) qui permet d’avancer.
1. Partir de la page A et choisir 50 fois votre destination de
manière aléatoire. Vous compterez le nombre de passage par
chaque page
2. Mise en commun des résultats de la classe

Nous trouvons par exemple : A : 15 %, B : 10 % ; C : 10 % ; D : 10 % E : 40 % ; F :15 %

Questions
1. Quelle est la signification des pourcentages calculés ?
2. Les valeurs obtenues vous semblent-elles cohérentes ?
3. Retrouver par la relation, la popularité de E
Partie 4 : Securité et vie privée sur le Web
Activité 5 page 66
https://www.youtube.com/watch?v=HfiJ3ME8Tvs

Vous aimerez peut-être aussi

Le Web-Généralités
Pas encore d'évaluation
Le Web-Généralités
13 pages
Seance 3 Web Corrige
100% (1)
Seance 3 Web Corrige
15 pages
Introduction au Web et à ses concepts clés
Pas encore d'évaluation
Introduction au Web et à ses concepts clés
6 pages
Course Leve 3
Pas encore d'évaluation
Course Leve 3
4 pages
Modélisation du PageRank de Google
Pas encore d'évaluation
Modélisation du PageRank de Google
21 pages
Historique Corrigé
Pas encore d'évaluation
Historique Corrigé
11 pages
Initiation au HTML5 et CSS pour débutants
Pas encore d'évaluation
Initiation au HTML5 et CSS pour débutants
8 pages
Introduction au Web et à ses langages
Pas encore d'évaluation
Introduction au Web et à ses langages
28 pages
TECHNOLOGIE Services Web Chapitre4
Pas encore d'évaluation
TECHNOLOGIE Services Web Chapitre4
7 pages
Séance 1 - Web - Corrigé
Pas encore d'évaluation
Séance 1 - Web - Corrigé
5 pages
Le Web-Bilan
Pas encore d'évaluation
Le Web-Bilan
4 pages
Cours Web
Pas encore d'évaluation
Cours Web
81 pages
Aide 2TI-P2
Pas encore d'évaluation
Aide 2TI-P2
5 pages
Histoire et Fonctionnement d'Internet
Pas encore d'évaluation
Histoire et Fonctionnement d'Internet
4 pages
Sntle Web Fiche Synthese 1 - 231212 - 074657
Pas encore d'évaluation
Sntle Web Fiche Synthese 1 - 231212 - 074657
4 pages
Quiz Révision Web : Client-Serveur et HTTP
Pas encore d'évaluation
Quiz Révision Web : Client-Serveur et HTTP
4 pages
Fonctionnement Web et SEO en SNT
Pas encore d'évaluation
Fonctionnement Web et SEO en SNT
5 pages
Thème WEB - Fiche - 2-05 - Pagerank - Stefperk
Pas encore d'évaluation
Thème WEB - Fiche - 2-05 - Pagerank - Stefperk
7 pages
2 Activité Branchée: Crée Ta Page Web
Pas encore d'évaluation
2 Activité Branchée: Crée Ta Page Web
3 pages
Recherche Et Veille D'information
100% (2)
Recherche Et Veille D'information
55 pages
Web SNT 2 LECR
Pas encore d'évaluation
Web SNT 2 LECR
11 pages
2ndeSNT T2 Le Web
Pas encore d'évaluation
2ndeSNT T2 Le Web
15 pages
CHAP1 Les Evenements
Pas encore d'évaluation
CHAP1 Les Evenements
6 pages
B2 PDF
Pas encore d'évaluation
B2 PDF
97 pages
ST20 TE 01 21 - Partie2 Seance2
Pas encore d'évaluation
ST20 TE 01 21 - Partie2 Seance2
4 pages
Comprendre le fonctionnement du Web
Pas encore d'évaluation
Comprendre le fonctionnement du Web
23 pages
SNT-Poly Web Complet 2024
Pas encore d'évaluation
SNT-Poly Web Complet 2024
5 pages
Histoire et Fonctionnement du Web
Pas encore d'évaluation
Histoire et Fonctionnement du Web
18 pages
2nde Seq2 TP Élève
Pas encore d'évaluation
2nde Seq2 TP Élève
3 pages
Programmation Web1
Pas encore d'évaluation
Programmation Web1
64 pages
Cours Web Eleve
Pas encore d'évaluation
Cours Web Eleve
2 pages
RA19 Lycee G SNT 2nd Pagerank 1156204 PDF
Pas encore d'évaluation
RA19 Lycee G SNT 2nd Pagerank 1156204 PDF
6 pages
Stratégies de recherche sur le web
Pas encore d'évaluation
Stratégies de recherche sur le web
25 pages
Regroupe de Nombreux Outils: Un Modem Une Borne D'Accès Wi-Fi Un Switch, Un Routeur Un Pare-Feu Un Serveur (Web, FTP, Voip)
Pas encore d'évaluation
Regroupe de Nombreux Outils: Un Modem Une Borne D'Accès Wi-Fi Un Switch, Un Routeur Un Pare-Feu Un Serveur (Web, FTP, Voip)
77 pages
HTML RESUMé
Pas encore d'évaluation
HTML RESUMé
5 pages
Comprendre les cookies sur le Web
Pas encore d'évaluation
Comprendre les cookies sur le Web
8 pages
Introduction au langage XHTML et CSS
Pas encore d'évaluation
Introduction au langage XHTML et CSS
30 pages
1nsi 2425 Thème Ihm Eleve
Pas encore d'évaluation
1nsi 2425 Thème Ihm Eleve
27 pages
Examen Orange
Pas encore d'évaluation
Examen Orange
3 pages
Sti 2023-2024fv3
Pas encore d'évaluation
Sti 2023-2024fv3
201 pages
Graphes Web et Algorithme PageRank
Pas encore d'évaluation
Graphes Web et Algorithme PageRank
31 pages
Comprendre le fonctionnement du Web
Pas encore d'évaluation
Comprendre le fonctionnement du Web
4 pages
1.1.4 Acc1
Pas encore d'évaluation
1.1.4 Acc1
19 pages
2005 - 12fiches TD-2
Pas encore d'évaluation
2005 - 12fiches TD-2
13 pages
Formation Complète en Création de Sites Web
Pas encore d'évaluation
Formation Complète en Création de Sites Web
50 pages
Fiches TD1
Pas encore d'évaluation
Fiches TD1
4 pages
Theme 2 Le Web Activite 3
Pas encore d'évaluation
Theme 2 Le Web Activite 3
12 pages
Comprendre le Web pour les Lycéens
Pas encore d'évaluation
Comprendre le Web pour les Lycéens
4 pages
SNT Activite Web Connecte
Pas encore d'évaluation
SNT Activite Web Connecte
4 pages
Cahier de Cours HTML5CSS3
Pas encore d'évaluation
Cahier de Cours HTML5CSS3
10 pages
HTML Et CSS
100% (1)
HTML Et CSS
29 pages
19-20-Web-Seance1 Prof
Pas encore d'évaluation
19-20-Web-Seance1 Prof
4 pages
Programmation Web: Réalisé Par: Pr. Mahraz Med Adnane ANNÉE UNIVERSITAIRE:2020/2021
Pas encore d'évaluation
Programmation Web: Réalisé Par: Pr. Mahraz Med Adnane ANNÉE UNIVERSITAIRE:2020/2021
64 pages
1 Chap1 Web Intro
Pas encore d'évaluation
1 Chap1 Web Intro
3 pages
7ST20TE0124 Partie2ExercicesCorr - Cleaned
Pas encore d'évaluation
7ST20TE0124 Partie2ExercicesCorr - Cleaned
1 page
TP1 HTML5
Pas encore d'évaluation
TP1 HTML5
4 pages
Évaluation SNT Seconde : Devoir Surveillé 2
100% (4)
Évaluation SNT Seconde : Devoir Surveillé 2
8 pages
Affichage 2
Pas encore d'évaluation
Affichage 2
6 pages
LabView Cours
100% (1)
LabView Cours
177 pages
Intégration SSO et SAML v2 avec UiPath
Pas encore d'évaluation
Intégration SSO et SAML v2 avec UiPath
6 pages
Introduction en Visual Basic
Pas encore d'évaluation
Introduction en Visual Basic
21 pages
MS1.7 Partage de Fichiers Simple Avance Cache Et Securise
Pas encore d'évaluation
MS1.7 Partage de Fichiers Simple Avance Cache Et Securise
39 pages
Chapitre 4 TP Installation Des Asterisk Sur Ubuntu 2004
Pas encore d'évaluation
Chapitre 4 TP Installation Des Asterisk Sur Ubuntu 2004
14 pages
Concours de Peche v1
Pas encore d'évaluation
Concours de Peche v1
5 pages
Bluetooth Station Meteo
Pas encore d'évaluation
Bluetooth Station Meteo
5 pages
Mettre en Place Un Serveur IPBX
Pas encore d'évaluation
Mettre en Place Un Serveur IPBX
3 pages
Introduction aux Bases de Données
Pas encore d'évaluation
Introduction aux Bases de Données
91 pages
Rapport TP Programmation 1ere Seance
Pas encore d'évaluation
Rapport TP Programmation 1ere Seance
10 pages
Plan Cours Informatique RDC
Pas encore d'évaluation
Plan Cours Informatique RDC
3 pages
Cahier Charge
Pas encore d'évaluation
Cahier Charge
5 pages
Sujet Linux - SRI 2019 Principal Enonce
Pas encore d'évaluation
Sujet Linux - SRI 2019 Principal Enonce
9 pages
Etude de L'existant
Pas encore d'évaluation
Etude de L'existant
2 pages
Activités Python
Pas encore d'évaluation
Activités Python
6 pages
【百题通关参考答案】面向对象程序设计辅导练习（张庆科编）
Pas encore d'évaluation
【百题通关参考答案】面向对象程序设计辅导练习（张庆科编）
53 pages
Atelier1 Excel
Pas encore d'évaluation
Atelier1 Excel
4 pages
Cours IBD IntroChap I Sept. 2023 VF
Pas encore d'évaluation
Cours IBD IntroChap I Sept. 2023 VF
27 pages
B850 System Spec M1183788-1 Fre
Pas encore d'évaluation
B850 System Spec M1183788-1 Fre
4 pages
Calculabilité
Pas encore d'évaluation
Calculabilité
57 pages
Luận Văn Génération de Population Synthétique Localisée
Pas encore d'évaluation
Luận Văn Génération de Population Synthétique Localisée
16 pages
Storyboard Module ELearning KS
Pas encore d'évaluation
Storyboard Module ELearning KS
3 pages
Javascript: Annexe
100% (1)
Javascript: Annexe
1 page
Presentation Pfa 2
Pas encore d'évaluation
Presentation Pfa 2
31 pages
Youtube Pour Les Noobs
Pas encore d'évaluation
Youtube Pour Les Noobs
3 pages
Analyse fonctionnelle des systèmes techniques
Pas encore d'évaluation
Analyse fonctionnelle des systèmes techniques
4 pages
Offre d'Emploi: 20 Jardiniers à In Amenas
Pas encore d'évaluation
Offre d'Emploi: 20 Jardiniers à In Amenas
12 pages
Associez Périphériques et Ports
Pas encore d'évaluation
Associez Périphériques et Ports
6 pages
C264 Mode
Pas encore d'évaluation
C264 Mode
9 pages
Exercice - Excel
Pas encore d'évaluation
Exercice - Excel
2 pages