Introduction à la création de documents pour le World Wide Web - Ch. 2

<body> <H1 class="banner"><A NAME="TOC17">Introduction à la création de documents pour le World Wide Web</A></H1> <p> <a href="index.html"><img align="left" src="images/spider.thumb.gif" alt="Sommaire" width=79 height=59></a> <p> Vous lisez : 2 Les principes de fonctionnement <p>Partie Précédente : <a href="ch1.frm.html">1 World Wide Web : une porte sur Internet</a> <br>Partie Suivante : <a href="ch3.frm.html">3 Le protocole HTTP</a> <br><hr> <a name="997254"> </a> <h2><img class="HeadingBullet" alt="" width="70" height="44" src="images/orangeComputer.gif"> 2 Les principes de fonctionnement </h2> <p class="Body">D'un point de vue technique, les fondements du World Wide Web sont étonnamment simples. Il s'agit de permettre l'accès, au moyen d'un système client-serveur, à des documents hypermedia distribués! </p> <a name="1030563"> </a> <h3><img class="HeadingBullet" alt="" width="50" height="34" src="images/blueComputer.gif"> 2.1 Le modèle client-serveur </h3> <p class="Body">Le World Wide Web fonctionne suivant le modèle classique client-serveur. Deux acteurs sont mis en jeu: d'un côté le <em>client</em> qui effectue des requêtes en direction du serveur, de l'autre le <em>serveur</em> qui exécute ces requêtes et renvoie le résultat au client. Client et serveur sont en pratique deux logiciels différents communiquant au moyen d'un protocole sur une même machine, à travers un réseau local ou bien à travers un réseau étendu (<a target="body" href="ch2.frm.html#1058129">Figure 1</a>). <div class="Figure"> <table width="100%" border="0"> <caption><a name="1058129"> </a>Figure 1: Le modèle client-serveur du World Wide Web </caption> <tr align="center"><td><a href="images/fig1.gif"><img src="images/fig1_thumb.gif" alt="[Le modèle client serveur du WWW]" width="200" height="179"></a> </table> </div> <p> </p> <p class="Body"><em>Netscape Navigator</em> et <em>MS Internet Explorer</em><em> </em>sont ainsi les deux programmes clients World Wide Web les plus répandus mais ce ne sont de loin pas les seuls, on note également le petit nouveau <em>Opera</em>, <em>Lynx</em> et une foule d'autres. Tous ne sont pas nécessairement graphiques, il en existe purement textuels ou adaptés à certaines formes de handicap ou de consultation (par exemple des navigateurs à synthèse vocale permettent de naviguer par téléphone). Côté serveurs, on note <em>Apache</em>, un logiciel libre (<em>free software</em>) qui est le serveur le plus répandu, et des produits commerciaux comme les différents serveurs de Netscape ou Microsoft. </p> <p class="Body">Le rôle d'un navigateur client se borne à </p> <ul type="square"> <li>traduire les ordres que lui donne l'utilisateur à travers l'interface graphique en messages conformes à un protocole d'échange avec un serveur <li>contacter le serveur adéquat et lui passer la requête <li>attendre la réponse du serveur <li>mettre en forme cette réponse et la présenter de façon convenable à l'utilisateur. </ul> <p class="Body">Le serveur renvoie en effet un fichier "brut" au client et c'est ce dernier qui est responsable de sa mise en forme. Ceci se remarque facilement en utilisant deux programmes clients différents pour visualiser le même document Web </p> <a name="1019061"> </a> <h3><img class="HeadingBullet" alt="" width="50" height="34" src="images/blueComputer.gif"> 2.2 Documents hypermedia </h3> <p class="Body">On appelle document hypertexte un document s'apparentant à un simple texte mais que l'on a pourvu d'un mécanisme permettant d'établir des liens entre différentes parties. L'exemple actuellement le plus connu de ce type de documents est sans doute celui des encyclopédies sur <acronym>CD-ROM</acronym> où l'utilisateur peut à tout moment sauter à la définition d'un mot qu'il aura trouvé à un autre endroit dans la définition d'un autre mot. Ainsi, à la différence d'un livre où les données sont organisées selon une structure linéaire inhérente et suggèrent donc un certain mode de consultation, un document hypertexte n'a pas de structure apparente unique mais plutôt une structure "à la carte" définie par celui qui le consulte selon l'enchaînement de liens qu'il décide de suivre. La notion d'hypermedia est semblable à celle d'hypertexte, cependant on préfère utiliser le terme hypermedia pour designer des documents contenant non seulement du texte mais aussi d'autres types de données (son, images fixes ou animées, etc...). </p> <a name="997468"> </a> <h3><img class="HeadingBullet" alt="" width="50" height="34" src="images/blueComputer.gif"> 2.3 URL : <em>Uniform Resource Locator </em></h3> <p class="Body">Dans un contexte plus large que celui d'une simple encyclopédie sur <acronym>CD-ROM</acronym> se pose le problème de l'identification des documents, indispensable pour établir une référence vers eux. Cette difficulté est d'autant plus critique qu'Internet est constitué d'une myriade de serveurs organisés suivant des modèles totalement différents, sur lesquels l'accès aux documents se fait selon des protocoles variés. Pour pallier à ceci, une nomenclature standardisée a été définie pour identifier individuellement les différents documents accessibles à travers l'Internet. Cette nomenclature est connue sous le nom d'<acronym>URL</acronym> (<em>Uniform Resource Locator</em> qui se traduit parfois par <em>Localisateur Uniforme de Ressource</em> ou par le néologisme <em>Locateur Uniforme de Ressource</em>). Un <acronym>URL</acronym><a target="body" href="#997876"><sup>1</sup></a> est de la forme suivante :<p class="URLDetails"> <img src="images/shadowTriangle.gif" alt="" width="38" height="55" align="middle"> <code>protocole://serveur[:port]/[chemin/]fichier[#position]</code> </p> <div class="URLConstituents"> <table width="60%" border="1"> <caption></caption> <tr><td>protocole : <td>Le nom du protocole. Le plus souvent <code class="CellCode">http</code> ou <code class="CellCode">ftp </code> <tr><td>serveur : <td>Le nom d'une machine reliée à Internet (ex: <code class="CellCode">www.epfl.ch</code>) ou son numéro IP (ex: <code class="CellCode">128.178.50.32</code>). <tr><td>[port] : <td>Numéro du port sur lequel le serveur est en attente. Suivant le protocole utilisé il existe toujours une valeur par défaut et ce paramètre est alors omis. <tr><td>[chemin] : <td>Le chemin (suite de répertoires séparés par des <code class="CellCode">/</code>) vers le document recherché. <tr><td>fichier : <td>Le nom du document recherché. <tr><td>[position] : <td>Un nom désignant une position (ancre) à l'intérieur du document. Facultatif. </table> </div> <p class="Body">Les documents hypermedia présents sur le World Wide Web sont écrits dans le langage <acronym>HTML</acronym> (<em>HyperText Markup Language</em>) il s'agit de simple texte auquel on a ajouté des constructions spéciales qui permettent de définir en particulier les liens vers les autres documents au moyen des <acronym>URL</acronym>s. <acronym>HTML</acronym> permet d'abréger les <acronym>URL</acronym>s pour alléger l'écriture. Ainsi à l'intérieur d'un document dont l'<acronym>URL</acronym> absolu serait <code>http://www.some.server/pub/doc.html</code>, on peut trouver des URLs de la forme : </p> <dl> <dt><code>/private/secret.html</code> <dd>Un URL commençant par un <code>/</code> fait référence à la base du document courant. Cet URL est donc équivalent à l'URL absolu : <code>http://www.some.server/private/secret.html</code> <dt><code>misc/anotherdoc.html</code> <dd>Un URL non absolu ne commençant pas par le caractère <code>/</code> est dit relatif et fait référence au chemin complet du document courant. Cet URL est donc équivalent à <code>http://www.some.server/pub/misc/anotherdoc.html</code> </dl> <p class="Body">HTML autorise également des URLs étendus permettant le passage de paramètres . Ainsi: <code>http://www.some.server/cgi-bin/imagemap.cgi?x=15&y=20</code> invoque le programme <code>imagemap.cgi</code> se trouvant dans le répertoire <code>/cgi-bin</code> sur le serveur<code> www.some.server</code> en lui passant comme paramètres <code>x=15</code> et <code>y=20. </code></p> <p class="Body"> </p> <hr> <sup>1</sup><a name="997876"> </a><span class="Footnote">Très précisément on décrit ici un URI (Uniform Resource Identifier) dont l'URL est une sous-partie. Par abus de langage on assimile les deux <a target="body" href="ch12.frm.html#1064922">[3]</a>. </span><br> <p>Copyright ©1996,1998 EPFL/DI-LSP. </body>