Un guide de
la Collection
World Wide Web
Principale Application
du réseau Internet

Mise à jour : Oct. 1996
Accès Direct:
Guides du Net

Sommaire
Internet & WWW
En France...
Internet et le(s) Droit(s)
Le Web
Outils du Net
Internet & L'Entreprise
L'Intranet
Guide Développement
Perspectives
Contenus/Services
Bibliographie


  • Introduction
  • le World Wide Web,
  • les logiciels d'accès,
  • WWW, Un Ensemble de Services d'Information, notamment ses outils d'aide à la navigation et à la recherche,
  • les caractéristiques techniques du WWW,
  • @ : Les principales étapes à suivre pour définir et créer son serveur


  • World Wide Web (WWW ou W3, le 'Web') est le service d'information électronique le plus représentatif de l'Internet. Sur le Web,
    • Tout utilisateur accède à des serveurs d'informations. Aujourd'hui, la grande majorité du World Wide Web fonctionne sur le principe de l'accès gratuit àces services. Selon une étude encore récente (Forrester, 1995), le nombre de serveurs doublerait tous les 53 jours!
      • Novembre 1995 : 15 millions de pages, 80.000/100.000 sites Web.
      • Mai 1996 : 22 million de pages, 225,000 serveurs. (probablement déjà 40 millions de pages réelles...)
      • Juillet 1996: 275 000 serveurs

      • Voir : Chiffres Clés : Le Web
    • Tout particulier ou entreprise peut créer et présenter sous forme multimédia et interactive ses propres informations: catalogues, plaquettes, documents d'information, ouvrages, oeuvres...


    Les origines du projet WEB : Le CERN

    Entre 1990 et 1993, la création de World Wide Web a été dirigée depuis le CERN (Centre Européen de Recherche Nucléaire, à Genève) par Tim Berners Lee et son équipe pour répondre aux problèmes de création, d'accès et de partage d'informations entre équipes de recherche, notamment avec le NCSA (National Center for Superconducting Application) américain.

    WWW devait utiliser l'infrastructure de communication existante, Internet, et créer des protocoles de communication communs et standardisés, notamment des protocoles de communication, pour donner l'accès universellement aux services d'informations présents sur le WWW, quelque soit l'origine de la consultation sur le réseau:

    • Interface normalisée: principes de consultations identiques entre application
    • Normalisation des formats: caractères, documents multimédia
    • Normalisation des protocoles: HTTP, HTML
    Le CERN et NCSA ont également développé en commun le premier logiciel-interfaces permettant de se connecter aux serveurs d'information présents sur Internet, Mosaic. WWW, outil collaboratif de la recherche, est devenu public en 1993, notamment grace à la diffusion gratuite de "Mosaic" et des logiciels serveurs, notamment HTTPD, permùettant de créer son propre serveur WWW.



    Les Browsers : le logiciel d'accès au Web

  • Mosaic : la première interface universelle, en 1993
  • Les "Browsers" Commerciaux
  • Consultation On ou Off-Line & Agents Intelligents

  • En 1993 : Mosaic : Une interface universelle utilisant les techniques hypertextes et multi-média

    Développé en commun par le CERN et NCSA, le programme qui permit en premier la consultation du Web s'appellait "Mosaic". D'emblée, Mosaic fut utilisable sur la plupart des machines du marché (Mac, PC, Unix), et distribué gratuitement . Mosaic mit fin aux rebutantes et fastidieuse saisies de 'chemins' d'accès aux informations, d'identification anonyme ou non: il suffisait de cliquer sur un mot, une phrase, une illustration pour se connecter à une quelconque machine du réseau. Le programme concentrait l'utilisation sur la sélection d'information plus que sur le moyen technique d'accès à celle-ci, qu'il réalise en tâche de fonds.

    Plus que tout, c'est l'existence d'un tel programme qui a simplifié l'usage du réseau et l'a rendu accessible à tous. Mosaic est également complètement multimédia,et permet d'afficher indifférament et en combinaison avec le texte, des sons, images, appels à des programmes...

    Egalement, en 1993, Mosaic illustre pour la première fois concrètement une application grand-public hypertexte pleinement fonctionnelle, qui met en relation des mots entre eux, des pages, et profite du réseau Internet pour faire fonctionner ces interconnexions ... d'un site à l'autre.


    1994/1995 : Les premiers "Browsers" Commerciaux

    Mosaic a dabords été licencié par de nombreuses compagnies, ayant réalisé des ajouts ou développements complémentaires sur ce logiciel.

    Une scission du groupe de développement de Mosaic a donné naissance en 1994 à une nouvelle entreprise, Netscape Corporation, et à un nouveau produit commercial, connu sous le nom de "Netscape Navigator".

    Microsoft a lancé en même temps un produit concurrent : Internet Explorer. Ces deux logiciels rivalisent au fur et à mesure de leurs versions successives en innovations (notamment l'intégration du multimédia) et en recherche de performance.

    Depuis lors, la "guerre des Browsers" s'est fait au bénéfice de l'utilisateur : toujours plus rapides, toujours plus multimédia, toujours plus intégrés au poste de travail... le Browser Internet fait partie intégrante du poste de travail. Le poste de travail est peut être lui-même devenu un browser multitache et multicontenus....




    Le Web, une collection de Serveurs/Services d'Information

    Le Web ou la "Collection", la "Toile"

    Rapidement, Internet est apparu pouvoir devenir une gigantesque base de connaissances.
    Pour l'entreprise qui se connecte, le Web apporte "Un monde d'information au bout des doigts". Informations municipales, administratives, bibliographiques, scientifiques ou techniques, financières, juridiques...

    Information pratique, technique, juridique, administrative, ludique, ... il est peut de domaines qui n'aient pas trouvé leur place sur Internet.

    L'information est le plus souvent gratuite, illimitée, parfois complétée par l'accès réservé à des informations payantes ou réservées à des membres.

    L'information institutionnelle, émise par les administrations, et les entreprises elles-mêmes complète aujourd'hui ces premiers thèmes de connaissances.

    L'usage d'Internet par le grand public a ajouté l'information pratique (mise à jour quotidiennement dans la plupart des cas : programmes télévision, météo...) et l'information commerciale, destinée à la vente en ligne.



    L'hypertexte et le réseau de connaissance


    La technologie permet de s'affranchir de l'aspect linéaire des documents et de la séquentialité de la lecture. La "navigation" permet de designer et agir sur le document, et non plus seulement en parcourir le contenu. Un document comporte souvent des liens à d'autres documents, en plus des informations intrinsèques qu'il véhicule et (des)oriente la recherche par sujet. Aujourd'hui, l'indexation du réseau WWW permet de retrouver l'information pertinente dans cet ensemble en perpétuelle croissance. Des nombreux catalogues de ressources, classant par sujet, par origine, et des index en texte intégral permettent l'interrogation globale de WWW, soit la recherche parmi plus de 25000 sites et 3 milliards de pages ou documents.

    Information Overload? Nous l'avons vu en début de cet article, Internet & WWW, devenus public en 1991, connait une croissance considérable du nombre de services proposés. Aujourd'hui, on recense courrament 300 Millions de pages actives...

    Face à cette prolifération, qui n'est pas sans laisser songer aux concepts d'"Information Overload", de nombreux services d'index et de recherche d'information se sont crées. On pourra se réferer à de nombreux guides de Recherche d'Information sur Internet pour mieux comprendre comment trouver une information sur le 'Net'.


    Les outils d'aide à la navigation et à la recherche:


    Ces annuaires de l'internet sont aujourd'hui pécieux pour multiplier ses chances de retrouver une information sur le réseau. Bien-sûr, à chaque type d'information et de démarche de recherche correspond un outil correspondant au mieux à une stratégie de recherche. Ainsi, parmi plus de deux-cent index de recherche, attardons nous sur quelques uns d'entre eux pour de premières recherches...
    Attention, il existe énormément d'informations sur Internet... mais si ces index échouent dans une recherche... on peut penser que cette information n'est pa encore disponible sur le réseau...

    On distinguera dans notre recherche les répertoires et listes thématiques, offrant ou non un index de recherche dans leur collection, des index dits en "texte-intégral", ou "full-text", qui peuvent prétendre avoir constitué leur base à partir du contenu d'un grand nombre de page de serveurs, dans l'ensemble du réseau Internet.

    RÉPERTOIRES

    Les Répertoires sont des listes, organisées par thèmes de recherches. Ainsi, par exemple, YAHOO, propose un classement de type Générique -> Spécifique. Ainsi, on trouvera :
      Computers_and_Internet/
        Operating_Systems/
          Macintosh_OS/
            Syteme 7/
              7.5.1 : Latest Machintosh Operating System
    Leurs outils de recherche ne concernent alors que ces éléments de description, ainsi que le résumé, le cas échéant. Une recherche dans ce type d'outils, donne donc des résultats précis pour retrouver un serveur ou une page spécialisée. À ce jour, (nov 1995), Yahoo est le meilleur de ces "oracles" pour retrouver une information classifiée.

    En France, particulièrement, on notera Ecila fut l'un des premier moteur de recherche de l'Internet Français (1996). Notons également quel la plupart de ces services proposent les deux approches, organisées sous formes de bases de données thématique et outil de recherche (Ecila, Lycos 200, GNN, Yahoo...)


    Des Exemples de Serveurs


    Voir les selections:
    Citons particulièment
  • Librairie du Congrès Américain, British Library, Ircam, la Bibliothèque du Vatican...
  • Les éditeurs
  • Le Ministère de la Culture et de la Francophonie
  • Digital Equipment Corporation. Produits et services, catalogues interactifs.
  • Hewlett-Packard. Information sur ses produits et services, mais aussi moyens de communication entre les clients et HP.
  • IBM, Sun Microsystems...: informations produits et accès aux services offerts.
  • Apple Computer. Information sur les produits, aides et support produits au clients, aide à l'utilisation d'Internet et WWW.
  • Les Banques. Démonstration intéressantes des services bancaires qui espèrent toutes proposer des services bancaires via le Net à leur clients dès que les conditions de confidentialité et de sécurité sur Internet seront remplies.
  • Voyages, tarifs, produits, services...
  • Tous les pays, les villes, les régions...
  • DataStar, Librairie du Congrès Américain, British Library... le marché des fournisseurs d'information est déjà converti à WWW.
  • Services financiers : le marché des services financiers en ligne est déjà développé, utilisant différents média et techniques de communication. Internet offre un marché supplémentaire pour les applications financières, une fois résolu les problèmes de sécurité et de paiement des informations.

    • Dun & Bradstreet. Information sur les entreprises
    • Global Leasing Services. Information sur le capital risque.
    • QuoteCom. Informations financières payantes

  • Security APL. Informations financières payantes, analyse de portefeuilles, statistiques et cotations boursières.

  • Découverte des Applications de WWW,
    pour le Particulier ou l'Entreprise

    Depuis 1993, L'intérèt des entreprises ou des particuliers pour Internet et WWW est évident. On trouve déjà presque tout sur Internet: des serveurs d'informations officielles du gouvernement et du congrès aux serveurs permettant la vente de Pizza (Pizza Hut) ou de matériel informatique, des régies publicitaires aux producteurs d'information financières, des entreprises industrielles ou universités... Pour l'entreprise, il augure de nouveaux moyens de vente, de communication interne ou externe, ou stimule des formes de travail en collaboration...
    • Apport Documentaire
    • Des serveurs d'information commerciale, Infommercial, spéctacle, alimentation, tourisme, catalogues...) ou culturels
    • Services et Télé-achat : le marché étendu de services commerciaux (billeterie, infos de type "minitel") sur Internet existe potentiellement plus que dans les faits. Si la présence commerciale dédiée à la vente effective est encore faible : (En 1995, sur 100000 serveurs, seules 8.500 entreprises américaines ont un site spécifiquement commercial), on s'attend à une croissance rapide, pouvant atteindre 200.000 entreprises présentes sur le World Wide Web en l'an 2000.

      Pour l'entreprise:

    • Le WWW offre la possibilité de créer un serveur de données spécifique. La présence des entreprises sur le réseau prend des formes diverses, allant de la présence "médiatique" au serveur transactionnel, marginal dans l'attente des développpement transactionnels.
    • Enfin, une évolution remarquable est l'adaptation des ré internes aux échanges d'informations calqués sur ceux du réseau Internet: usage de la messagerie, d'hypertextes "corporate"... Des "Intranet", protégés par des barrières de sécurité (FireWalls) sont en train de naitre...



    Consultation On ou Off-Line?
    Services d'information Automatisés

    En complément naturel des outils de consultation on-line, c'est à dire utilisables lors d'une connexion active, se développent d'autres modes d'accès; et services avancés. Ces modes de consultations sont notamment:
    • La consultation off-line
    • Les services de diffusion sur profil (DSI) (offline Web delivery services)
    L'ensemble de ces services repose sur la notion de profil (user profiling), permettant à ;l'utilisateur de définir précisément la nature des informations qu'il souhaite consulter périodiquement. Les technologies des agents (intelligents) peuvent également permettre ce type de services personalisés;
      Les agent: L'agent est un logiciel (ou un robot, on perle même de 'Robot de Connaissance' (knowbots), capable d'assister un utilisateur dans la réalisation de tâches répétitives, notamment la recherche périodique d'information. A l'heure de la généralisation du on-line et de la multiplication des sources d'information, les agents constituent une solution bien adaptée, voire indispensable, à la recherche d'information, pour faire face au syndrôme 'information overload'. Au départ, l'agent est alimenté par des mots clé ou critères de recherche. Combiné avec des outils d'analyse et d'extrapolation, notamment statistique, le robot peut même proposer de nouveaux thèmes d'information ou élargir la recherche initiale. Le MIT développe un certain nombre de projet dans ce sens.
    L'agent intelligent, peut élargir la problématique de départ, pour trouver de nouvelles sources d'information. Mieux, il peut être un véritable outil d'aide à la décision. La technologie orientée objet et l'intelligence artificielle sont alors associées. Plus réalistement, associé aux outils de recherche du réseau Internet, il constitue une approche efficace dans l'ensemble des problématiques de recherche d'information documentaire pour l'entreprise..

    Les Caractéristiques Techniques du WWW

    WWW échange des informations via Internet, et réparti entre des machines clients et serveurs les opérations de connexion. Browser Web (Mosaic ou Netscape) et WWW sont deux architectures techniques ouvertes, qui travaillent ensemble:
    • le Browser Web réalise la présentation des données sur la machine qui consulte les information. Il est également la boite à outil qui permet de de naviguer, sélectionner, consulter les documents et éventuellement les récupérer.
    • WWW, via des protocoles de communications standardisées, réalise les connexions (l'adressage, la négociation entre ressources, l'acheminement et le contrôle des transferts).

    Le Cern et NCSA ont défini trois protocoles utilisant le réseau: URL, HTTP, et HTML. Ils ont également intégré dans le fonctionnement des logiciels d'accè, l'émulation de la plupart des protocoles et services qui existaient déjà sur Internet. Via Mosaic, ou ses successeur, WWW sait autoriser des connexions sous FTP, Gopher, WAIS, News, afficher textes,images,sons sans précautions particulières...


    WWW : Un modèle client-serveur

    WWW utilise les communications sur le réseau Internet et partage entre "clients" et "serveurs" les étapes d'accès à une information, donc la charge d'utilisation du réseau:

      La machine qui consulte, le "client", émet une requête vers un "serveur" WWW, et lui demande la communication à travers le réseau d'un document et de tous ses composantes.
      1. L'utilisateur souhaite se connecter au serveur http://www.pratique.fr. Il entre directement l'adresse au moyen de la commande Open url. A defaut, sur une page déjà affichée, il sélectionne le lien hypertexte correspondant au document.
        Pour être utilisable, un lien se présente comme suit:
        http://Adresse-machine/Répertoire/fichier.html

      2. Le programme d'accès a WWW utilise l'adresse correspondante à ce lien et se connecte tout d'abords au serveur de nom (DNS), qui lui permet de router la requête vers le serveur WWW correspondant.
    • Le serveur reçoit la demande, et retourne en retour le ou les fichiers texte et images au client. Un protocole spécial, appelé HTTP (HyperText Transfer Protocol) gère cette relation.
    • Le 'client' reçoit le document et le browser qu'il utilise réa lise la mise en page (visualisation, exécution dans le cas d'animation...) sur sa machine. Ainsi, la charge de travail est répartie entre le client (le demandeur de l'information) et le serveur (celui qui la délivre).


    Les Protocoles et les Langages du WEB

    A l'origine, trois standards ont été définis par NCSA, le CERN, puis le Web Consort pour gouverner le fonctionnement du WEB. Ce sont ces standards (de fait) qui ont permi de généraliser des mécanismes d'échanges et de présentation des documents, et surtout des mécanismes d'adressage universels.

    • L'URL : Universal Resource Locator : URL, Uniform Resource Locator, ou la définition unique d'adresses permettant de localiser un document. Associée à une gestion de "Noms de Domaines", l'URL a permis de donner aux sites internet des adresses mémorisables, qui correspondent aux noms ou aux marques des entreprises qui utilisent Internet.

    • HTML : Une syntaxe spécifique à WWW : HTML : HyperText Markup Language. HTML est un sous-ensemble de SGML, associé à une DTD spécifique, permet de décrire et structurer les documents WWW.
    • HTTP : Hypertext Transfer Protocol : Un protocole rapide et sur, aux capacités étendues, HTTP, HyperText Transfer Protocol, permettant le transfert de documents multi-formats,

    Depuis 1993, d'autres standards, permettant de sécuriser l'accès aux sites (https) ou de transférer d'autres types de contenus (vidéo, audio, sgml, xml...) ont progressivement été implantés. Aujourd'hui la plupart des logiciels clients savent nativement ouvrir et consulter des documents aux formats multiples. Le Web est devenue une véritable base d'information mondiale multimédia.



    Suite: Les Autres Applications du Réseau Internet

    Jean-Christophe Patat -