Vous lisez : 2 Les principes de fonctionnement
Partie Précédente : 1 World Wide Web : une porte sur Internet
Partie Suivante : 3 Le protocole HTTP
2 Les principes de fonctionnement
D'un point de vue technique, les fondements du World Wide Web sont étonnamment simples.
Il s'agit de permettre l'accès, au moyen d'un système client-serveur, à des documents hypermedia
distribués!
2.1 Le modèle client-serveur
Le World Wide Web fonctionne suivant le modèle classique client-serveur. Deux acteurs
sont mis en jeu: d'un côté le client qui effectue des requêtes en direction du serveur, de l'autre
le serveur qui exécute ces requêtes et renvoie le résultat au client. Client et serveur sont en pratique
deux logiciels différents communiquant au moyen d'un protocole sur une même machine,
à travers un réseau local ou bien à travers un réseau étendu (Figure 1).
Netscape Navigator et MS Internet Explorer sont ainsi les deux programmes clients
World Wide Web les plus répandus mais ce ne sont de loin pas les seuls, on note également le
petit nouveau Opera, Lynx et une foule d'autres. Tous ne sont pas nécessairement graphiques,
il en existe purement textuels ou adaptés à certaines formes de handicap ou de consultation (par
exemple des navigateurs à synthèse vocale permettent de naviguer par téléphone). Côté serveurs,
on note Apache, un logiciel libre (free software) qui est le serveur le plus répandu, et des
produits commerciaux comme les différents serveurs de Netscape ou Microsoft.
Le rôle d'un navigateur client se borne à
- traduire les ordres que lui donne l'utilisateur à travers l'interface graphique en messages conformes à un protocole d'échange avec un serveur
- contacter le serveur adéquat et lui passer la requête
- attendre la réponse du serveur
- mettre en forme cette réponse et la présenter de façon convenable à l'utilisateur.
Le serveur renvoie en effet un fichier "brut" au client et c'est ce dernier qui est responsable
de sa mise en forme. Ceci se remarque facilement en utilisant deux programmes clients différents
pour visualiser le même document Web
2.2 Documents hypermedia
On appelle document hypertexte un document s'apparentant à un simple texte mais que
l'on a pourvu d'un mécanisme permettant d'établir des liens entre différentes parties. L'exemple
actuellement le plus connu de ce type de documents est sans doute celui des encyclopédies
sur CD-ROM où l'utilisateur peut à tout moment sauter à la définition d'un mot qu'il aura trouvé
à un autre endroit dans la définition d'un autre mot. Ainsi, à la différence d'un livre où les
données sont organisées selon une structure linéaire inhérente et suggèrent donc un certain
mode de consultation, un document hypertexte n'a pas de structure apparente unique mais plutôt
une structure "à la carte" définie par celui qui le consulte selon l'enchaînement de liens qu'il
décide de suivre. La notion d'hypermedia est semblable à celle d'hypertexte, cependant on préfère
utiliser le terme hypermedia pour designer des documents contenant non seulement du texte
mais aussi d'autres types de données (son, images fixes ou animées, etc...).
2.3 URL : Uniform Resource Locator
Dans un contexte plus large que celui d'une simple encyclopédie sur CD-ROM se pose le
problème de l'identification des documents, indispensable pour établir une référence vers eux.
Cette difficulté est d'autant plus critique qu'Internet est constitué d'une myriade de serveurs organisés
suivant des modèles totalement différents, sur lesquels l'accès aux documents se fait selon
des protocoles variés. Pour pallier à ceci, une nomenclature standardisée a été définie pour
identifier individuellement les différents documents accessibles à travers l'Internet. Cette nomenclature
est connue sous le nom d'URL (Uniform Resource Locator qui se traduit parfois par
Localisateur Uniforme de Ressource ou par le néologisme Locateur Uniforme de Ressource).
Un URL1 est de la forme suivante :
protocole://serveur[:port]/[chemin/]fichier[#position]
protocole :
| Le nom du protocole. Le plus souvent http ou ftp
|
serveur :
| Le nom d'une machine reliée à Internet (ex: www.epfl.ch ) ou
son numéro IP (ex: 128.178.50.32 ).
|
[port] :
| Numéro du port sur lequel le serveur est en attente. Suivant le
protocole utilisé il existe toujours une valeur par défaut et ce
paramètre est alors omis.
|
[chemin] :
| Le chemin (suite de répertoires séparés par des / ) vers le document
recherché.
|
fichier :
| Le nom du document recherché.
|
[position] :
| Un nom désignant une position (ancre) à l'intérieur du document.
Facultatif.
|
Les documents hypermedia présents sur le World Wide Web sont écrits dans le langage
HTML (HyperText Markup Language) il s'agit de simple texte auquel on a ajouté des constructions
spéciales qui permettent de définir en particulier les liens vers les autres documents au
moyen des URLs. HTML permet d'abréger les URLs pour alléger l'écriture. Ainsi à l'intérieur
d'un document dont l'URL absolu serait http://www.some.server/pub/doc.html
, on
peut trouver des URLs de la forme :
/private/secret.html
- Un URL commençant par un
/
fait référence à la base du document courant. Cet URL est donc équivalent à l'URL absolu : http://www.some.server/private/secret.html
misc/anotherdoc.html
- Un URL non absolu ne commençant pas par le caractère
/
est dit relatif et fait référence au chemin complet du document courant. Cet URL est donc équivalent à http://www.some.server/pub/misc/anotherdoc.html
HTML autorise également des URLs étendus permettant le passage de paramètres . Ainsi:
http://www.some.server/cgi-bin/imagemap.cgi?x=15&y=20
invoque le programme
imagemap.cgi
se trouvant dans le répertoire /cgi-bin
sur le serveur
www.some.server
en lui passant comme paramètres x=15
et y=20.
1
Copyright ©1996,1998 EPFL/DI-LSP.