Internet : côté pile et côté face


 

Historique d’Internet


 

Notions de son numérisé


 

Internet : les coulisses


 

Le World Wide Web


 

Conclusion


 

Réalisation d'un serveur Web


 

Glossaire


Internet : côté pile et côté face


Le côté pile

Dans dix ans, vous ne vous interrogerez plus sur la raison d’être d’Internet. elle sera une évidence. Comme l’électricité, le train ou le presse-légumes. Mais, il est probable qu’en 1804, Richard Trevithick et Andrew-Vivian eurent fort à faire pour expliquer à leurs compatriotes quels bienfaits ils allaient pouvoir tirer de la locomotive.

Certains vous diront qu’ils se sont bien passés d’Internet jusqu’alors. Ok. Mais l’homme de Cromagnon n’avait pas de congélateur et il n’est plus là pour pouvoir nous raconter la déliquescence de la viande de mammouth après quinze jours de conservation en plein air... En clair, Internet fait partie des découvertes qui changent la vie et qui paraissent indispensables.

Internet peut se résumer en l’interconnexion de milliers d’ordinateurs (Nous expliquerons plus loin comment tout cela fonctionne). Celui de la Nasa, celui de notre gouvernement, celui de Joe Bingo, agriculteur dans le Tennessee et le mien (peut-être un jour le vôtre ...). Il est évident que lorsque des échanges se produisent sur un tel réseau, vous obtenez un « melting-pot » grandiose.

Le Net est également une source d’informations intarissable. Grâce à lui, l’informatique relie les hommes sans distinction de race, de nationalité, de statut social ou de croyance. Il unit, réconforte et va jusqu’à se poser en garant ultime de la démocratie.

Un des piliers d’Internet est la messagerie (E-Mail). A partir du moment où vous disposez de l’adresse d’un utilisateur, vous pouvez lui adresser un message. Dans 95 % des cas, il vous répondra. La messagerie est plus rapide que le courrier et plus efficace que le téléphone, car l’on peut déposer un message à n’importe quelle heure du jour ou de la nuit. De plus, on peut y joindre du son, des images, de la vidéo, ...

Un autre pilier est constitué par les milliers de forums de discussion, qui regroupent les mordus d’un domaine quelconque. Si vous avez un problème particulier, placez-vous sur le forum adéquat et expliquez ce qui ne va pas. Quelques heures, quelques minutes plus tard, vous allez obtenir des réponses du monde entier de simples utilisateurs, comme vous, ravis de pouvoir vous dépanner. S’ils ont pris le temps de vous répondre, c’est parce que les gens aiment s’entraider, surtout lorsque l’on ne leur demande rien.

Enfin, le pilier le plus connu : le World Wide Web. Plus ou moins 46.000 sites Web sont à votre disposition pour tenter d’étancher votre curiosité sur un sujet donné. Si vous n’en avez pas, il existe un site qui joue le rôle d’une roulette et vous connecte au hasard sur un site donné. Une chose est sûre : si vous ne trouvez pas le sommeil, vous aurez de quoi vous distraire.

Mais l’essentiel est ailleurs. Imaginez une nation où chacun serait libre d’exprimer ses opinions sans crainte d’être inquiété, pourrait converser avec n’importe qui sans avoir à déplier son C.V., et jouirait de droits similaires à ceux de son voisin. La majorité des informations serait accessibles à tous. Cette contrée semble utopique ? Il se trouve que telles sont les règles du jeu sur Internet. Le méga-réseau est une démocratie fondée sur une réelle égalité des participants et un sens aigu du désintéressement. Personne ne rémunère les étudiants qui, patiemment, créent et entretiennent des serveurs sur les stars de cinéma, le Beaujolais Nouveau ou l’astronomie, avant de les mettre à la disposition de tous. Le seul moteur est la passion et le plaisir de partager.

En 1991, lors de la tentative de putch dans l’ex-Union Soviétique, le gouvernement provisoire a pris comme première décision de couper les communications internationales. Il n’avait pas prévu Internet. Les discours de Boris Eltsine furent transmis au monde entier par le biais du réseau. Rien ne pouvait arrêter Internet, conçu de telle façon qu’il soit impossible d’empêcher une communication d’arriver à bon port. L’impossibilité des putshistes russes à couper les liens avec le monde extérieur constitue un fait sans précédent.

En plus, avec Internet vous aurez le sentiment de participer à la crème des branchés du Cyber-Espace !

Le côté face

Il est évident qu’avec tant de monde connecté, le Net comporte également sa pègre et ses mauvais côtés.

En naviguant, vous pourrez trouver toutes les recettes nécessaires à la fabrication de mélanges à base de drogues (douces et dures) peu conseillées pour la santé. Mais aussi des guides et modes d’emplois pour se transformer en parfait petit terroriste. Vous aurez le choix entre plusieurs centaines de modèles de bombes différents qui vont de la bombe téléphonique, à la bombe dans un stylo ou encore à la bombe atomique (avec plans, historique, etc ...).

Il ne faudrait pas oublier les sites néonazis pronant la xénophobie, la violence et le révisionisme. Les sectes sont aussi sur le Net (l’Eglise de Scientologie est même très bien représentée). Des sites de très mauvais goût diffusent des images de cadavres et autres atrocités.

Et c’est sans parler de la pornographie avec toutes ses déviances : pédophilies, zoophilies, sadisme, fétichisme, ...

Cette face cachée d’Internet est, hélas, logique puisque le réseau n’est en fait rien d’autre que le reflet de notre société avec tout ce qu’elle comporte comme bons et mauvais côtés. Le problème est qu’il est interdit d’interdire sur le Net. Et quand bien même on voudrait le faire, ce serait impossible. Cela implique que la censure d’un pays peut sans problème être contournée (exemple : Le livre du Dr Gubler « Le grand secret »). A partir du moment où un document se trouve sur le Net, il y restera, qu’il soit bon ou mauvais.


Historique d’Internet


Introduction

C’est à la fin des années 60 qu’Internet fait pour la première fois son apparition. A cette époque, les ordinateurs étaient de gros systèmes centralisés. Ils étaient puissants mais aussi très volumineux et coûteux. Chaque ordinateur était relié à plusieurs centaines de terminaux qui pouvaient être distants géographiquement de l’ordinateur central. Pour se connecter, les utilisateurs utilisaient le téléphone. A l’époque, la quantité de données à transmettre n’était pas très importante, celles-ci ne comportant que du texte. Cela permettait l’usage de modems lents.

En réalité, les utilisateurs ne faisaient pas travailler l’ordinateur en temps réel, mais ils lui envoyaient des successions d’ordres que l’ordinateur exécutait. Celui-ci renvoyait à son tour le résultat à l’utilisateur. Concrètement, cela revenait à se connecter avec un terminal le soir, lancer les instructions à effectuer par l’ordinateur et revenir chercher les résultats le matin venu. (En espérant que tout se soit passé convenablement ...)

Puis, certains se sont dit que, puisqu’on parvenait à connecter des terminaux à un ordinateur central, on pourrait faire la même chose avec des ordinateurs entre eux. C’est alors que le département de la défense des USA a mis en route un projet d’étude. Ce projet devait permettre de réaliser l’interconnexion de plusieurs ordinateurs (en provenance d’horizons différents) et la communication ainsi que l’échange d’informations à partir de n’importe quel point de ce réseau. L’idéal étant aussi d’assurer l’indépendance de chaque ordinateur (Pour fonctionner, le réseau ne nécessitait pas la connexion de tous les ordinateurs). C’est suite à ce projet qu’une série de protocoles a été élaborée. Ces derniers sont aujourd’hui connus sous le nom générique de TCP/IP. Ils définissent les modes d’identification et de communication des ordinateurs sur les réseaux.

 

Principe du « paquet »

 

En fait, tout ce qui transite par Internet réside dans une toute petite quantité d’informations (quelques octets) appellée paquet. Ce paquet est véhiculé sur le réseau et il comprend les informations de routage, c’est-à-dire l’adresse de l’émetteur et du destinataire. Si jamais on envoie un fichier de plusieurs centaines de Koctets, il sera fractionné en une multitude de paquets qui seront expédiés vers la machine la plus proche de l’émetteur, lequel réexpédiera ceux-ci et ainsi de suite jusqu’à l’arrivée chez le destinataire.

Contrairement au téléphone, l’expéditeur et le destinataire ne sont jamais en connexion directe. Ceci permet de faire arriver les données à destination même si des relais étaient inopérants puisque les paquets sont indépendants. Il est possible que des paquets formant un fichier, empruntent des itinéraires totalement différents pour arriver au but final.

Et c’est au logiciel de communication que revient la tâche de remettre tous les paquets dans le bon ordre, de détecter les erreurs ou encore de demander la réémission de certains.

Arpanet et NSFNet

C'est par l'ARPA (U.S Defense Department's Advanced Research Projects Agency) que tout a commencé dans les années 1960 sur le réseau téléphonique.

Le but de l'opération ? En cas d'attaque nucléaire, trouver un système de réseau d'informations qui soit capable de s'auto-configurer si un des maillons venait à défaillir.

La première idée géniale de ce réseau était la volonté avouée de ne pas avoir de structure centralisée de gestion du réseau mais de laisser l'autonomie de chacun des noeuds. Le système fut nommé ARPANET (c'est-à-dire le réseau de l'ARPA).

Le réseau initial ne disposait que du courrier électronique.

Mis dans le domaine public, il fut repris par les universitaires qui y virent une occasion de faire des conférences au moyen du courrier électronique.

Puis, dans les années 1970, l'ARPA continua ses recherches dans l'étude des protocoles de transfert de données entre des réseaux d'ordinateurs, réseaux qui pouvaient être de natures différentes.

Le nom d'Internet (qui élargissait l'ARPANET à l'Inter networking) fut alors adopté et développé entre les différentes universités américaines. C’est un étudiant d’une université de Caroline du Nord qui a créé les forums de discussions (Usenet News) pour permettre l’échange d’informations avec une université voisine. Aujourd’hui, Internet compte plus de 11 000 forums différents.

A la fin des années 70, la Fondation pour les Sciences des USA (National Science Foundation) donna une nouvelle impulsion au réseau. Elle décida de connecter 5 de ses supers-calculateurs pour permettre au monde entier d’en profiter. Puis, de plus en plus de campus sont venus s’ajouter pour former un nouveau réseau : NSFNet, au détriment d’ARPANet. C’est comme ça qu’NSFNet est devenu une principale composante d’Internet.

Dans les années 1980, le réseau Internet a commencé son expansion, non plus au travers de l'armée mais au travers des universités mondiales, des laboratoires de recherche et des grosses entreprises.

La montée d’Internet

C’est depuis son ouverture aux activités commerciales et à la vente d’accès aux particuliers qu’Internet est devenu « publiquement » connu. Sa croissance est très spectaculaire. Aujourd’hui, 96 pays sont directement connectés. Si on inclut le nombre de pays accessibles par le courrier électronique, on arrive alors à 179. C’est donc aujourd’hui un réseau planétaire.

Si la progression de ces dernières années a été très forte en Europe (près de 200 % par moments), l’Asie semble être le prochain pôle de développement. En effet, la Chine vient de prendre la décision de développer une gigantesque dorsale reliant 9 grands centres urbains et redistribuant l’accès aux communautés locales.

 

  ORDINATEURS 1/1/95 TAUX DE CROISSANCE 94-95
Amérique du Nord 3 372 600 100 %
Amérique du Sud 16 000 116 %
Europe de l'Ouest 1 039 200 88 %
Europe de l'Est 46 100 132%
Asie 151 800 87 %
Moyen-Orient 13 800 98 %
Afrique 27 100 148 %

 


Notions de son numérisé


Introduction

Qu’est-ce qu’un son ? Un son n’est en fait rien d’autre qu’une vibration de l’air. Si nous voulons enregistrer ce son, il faut employer un micro. La membrane extrêmement sensible de celui-ci convertira une première fois la vibration de l’air en vibration électrique. Pour le moment, notre onde électrique est analogue aux vibrations de l’air. Le signal est dit analogique. Pour que l’ordinateur puisse comprendre ce signal, il va donc falloir le convertir en signal numérique. C’est à dire que chaque vibration électrique sera convertie en 1 et 0 puisque c’est la seule et unique langue que l’ordinateur puisse comprendre.

C’est ici qu’interviennent les convertisseurs. Il y en a de deux types différents. Les premiers convertissent de l’analogique au numérique (A/N), les seconds du numérique à l’analogique (N/A).

Le convertisseur A/N doit découper le signal en tranches et, x milliers de fois par seconde (c’est la fréquence d’echantillonnage), mesurer son intensité pour pouvoir déduire à ce moment précis un nombre - tout aussi précis - que l’ordinateur pourra comprendre. Les nombres ainsi créés seront stockés dans la mémoire de l’ordinateur.

Ensuite, il faut pouvoir réécouter les sons enregistrés. C’est la tâche des convertisseurs N/A. Ils vont faire suivre aux nombres le parcours inverse et donc convertir le signal numérique en signal analogique (électrique).

La dernière étape étant le haut parleur qui va faire exactement le même travail que le micro mais dans le sens contraire. La membrane du haut parleur va vibrer selon les impulsions électriques et va ainsi créer des vibrations aériennes.

La numérisation

La numérisation est une étape capitale dans le processus d’échantillonnage. Les résultats, bon ou mauvais, dépendent de plusieurs facteurs : la résolution, la fréquence d ’échantillonnage et la qualité des convertisseurs.

La résolution déterminera le rapport signal/bruit. En fait, il s’agit du nombre de bits que l’ordinateur pourra employer pour coder les sons. C’est de cela que dépend la finesse du codage. Ce sont les bits qui décident de la précision avec laquelle l’ordinateur échantillonnera.

Avec une résolution de 16 bits, l’ordinateur aura le choix entre 65.536 valeurs différentes tandis que 8 bits n’en autoriseront que 256. (Le 20 bits dépasse le million...) Chaque bit supplémentaire apporte un gain de 6 dB; donc avec un enregistrement fait en 8 bits, le rapport signal-bruit sera au plus de 48 dB (La qualité d’un lecteur de K7 bas de gamme). Par contre, en 16 bits, on atteindra 96 dB ce qui est la qualité d’un lecteur de CD.

La fréquence d’échantillonnage est un autre facteur très influent. C’est le nombre de découpes effectuées par seconde. Elle déterminera la fréquence maximale numérisable dans l’aigu. Pour pouvoir calculer cette fréquence, on utilise le théorème de Nyquist. Selon ce théorème, en divisant la fréquence d’échantillonnage par deux, on obtient la fréquence numérisable la plus aiguë. Pour plus de sécurité, on prendra une petite marge. Pour rappel, l’oreille humaine est capable d’entendre les sons se situant entre 20 Hz et 20 kHz. Donc, avec une fréquence d’échantillonnage de 44,1 kHz, on peut théoriquement enregistrer tous les sons perceptibles par notre oreille.

Le stockage

Une fois les sons numérisés, il faut encore les stocker. A l’heure actuelle, l’enregistrement se fait sur le disque dur de l’ordinateur. Dans un futur très proche, on le fera également sur des disques magnéto-optiques. Le problème avec l’audio-numérique, c’est que toutes ces données prennent énormément de place. C’est ainsi qu’une simple minute d’enregistrement, avec une qualité équivalente à un CD (44,1 kHz, 16 bits, stéréo), consommera 10 Mb de votre disque.

Et Internet ?

C’est évidemment à cause de ce problème de quantité de données qu’il vous est impossible de pouvoir écouter directement de la musique depuis Internet avec la qualité de votre chaîne HI-FI. Au fait, est-ce vraiment impossible ?

En réalité, pas totalement car il existe des techniques de compression. Elles permettent de réduire les données au point qu’avec le peu de bande passante qu’offre Internet, vous pouvez écouter en DIRECT des émissions de radio (virtuelles ou non), des concerts, des informations ...

La qualité de ce que vous entendrez, peut-être comparable à la qualité d’émissions de radio en FM. Ceci, toutefois, dans le meilleur des cas. Bien souvent, à cause de l’encombrement du réseau, la qualité sera plus proche des longues ondes. Mais c’est quand même mieux que rien et puis c’est tellement gai de pouvoir entendre une émission en direct d’Hong-Kong...

Si vous recherchez plus de qualité audio et que vous êtes patient, la solution est alors de télécharger (to download) les sons qui vous intéressent. Cela nous renvoie au tableau ci-dessus. Meilleur sera le son, plus la taille du fichier correspondant sera importante. Logique.

Les techniques de compression

Jusqu’il y a peu, l’unique moyen de récupérer des sons sur Internet était donc de télécharger le fichier audio dans son intégralité. Le problème, c’est que cela prend énormément de temps et que seuls les plus patients avaient la chance d’en profiter.

Et c’est l’année passée que sont apparues des technologies permettant de diffuser du son en temps réel sur le réseau. Parmi les sociétés à l’origine de cette petite révolution on trouve Progressive Networks avec son logiciel Real Audio et Xing Technology avec leur système Stream Works.

Real Audio

Le système Real Audio est une application client/serveur qui permet de diffuser de l’audio via Internet. Cela veut dire qu’il suffit de cliquer sur le morceau de musique qui vous intéresse pour qu’il commence à jouer.

Un exemple : disons que vous êtes en train de surfer sur Internet et que vous tombez sur une page comprenant un morceau encodé au format Real Audio. Vous cliquez sur ce morceau et le serveur Web enverra les données concernant celui-ci à votre logiciel de lecture de Web (Browser) qui lancera à son tour le lecteur Real Audio. Et c’est ici que se trouve l’astuce. Le lecteur n’a pas besoin d’avoir reçu l’entièreté des données pour commencer à jouer. Une fois que les premiers octets seront arrivés, il commencera la lecture et pendant ce temps-là arrivera la suite des informations qui complèteront le morceau.

Real Audio fonctionne avec deux algorithmes de compression différents. Le premier est appelé « proche de la qualité FM » (near FM quality) et nécessite une connexion à 28.800 bps. Le second s’appelle « qualité vocale » (voice quality) et demande une connexion à 14.400 bps. Il est évident que le premier sera plus apte à reproduire de la musique que le second. En effet, une oeuvre jouée par un orchestre comprend tellement de fréquences différentes et complexes que l’algorithme de compression ne sait en tenir compte et n’encode pas toutes ces informations.

Ce qui différencie Real Audio de ses concurrents, c’est que le logiciel de lecture peut être mis à jour avec de nouveaux algorithmes plus performants. De cette manière, Real Audio restera toujours dans la course avec des produits de qualité. C’est donc une plate-forme ouverte. Dans les prochains mois, il ne serait pas étonnant d’assister à la sortie d’un nouvel algorithme encore plus performant. En effet, un tel algorithme pourrait par exemple employer plus intensivement le processeur de l’ordinateur sur lequel il tourne, de manière à soulager la communication (moins de données devraient transiter) et il serait plus puissant dans la manière de coder et de décoder les données. Une autre particularité du programme est qu’il est capable de dialoguer avec le serveur de manière à ce qu’il lui envoie les données qui répondent le mieux à la machine de l’utilisateur : le serveur et le lecteur se demandent chacun « Qu’avez-vous reçu comme données et quelle est la meilleure qualité que nous puissions délivrer ? ». Le but que se sont fixés les informaticiens de Progressive Networks est de diffuser la musique avec la meilleure qualité possible et le moins de tracas pour l’utilisateur. Il faut absolument que le logiciel se fasse « oublier » par celui-ci.

Pour que vous puissiez profiter de cette technologie, vous devez posséder le lecteur Real Audio. On le trouve sur le site Web de Progressive Networks (de même que de nombreux liens diffusant des données au format Real Audio). Le lecteur fonctionne avec la plupart des browsers et on le trouve sous forme de plug-in pour Netscape 2.0. Une fois que le lecteur est installé, il faut que vous vous rendiez sur un site diffusant des données Real Audio. Ensuite, vous n’aurez plus qu’à cliquer et écouter.

Mais comment faire pour transformer le fichier audio-numérique en fichier Real Audio ?

La réponse se trouve aussi sur le site de Progressive Networks. Vous pouvez télécharger le programme permettant de coder les fichiers. Il est disponible aussi bien pour les Mac que pour les Pc. Tout ce que vous aurez à faire est d’ouvrir le fichier que vous désirez coder et d’appuyer sur le bouton « encode ». Et ce qui est également assez extraordinaire, c’est que le codeur est capable de travailler en temps réel. Cela revient à dire qu’Internet est capable de diffuser en direct des émissions de radios, des concerts,... La porte est grande ouverte aux animateurs de radio en herbe avec non plus une portée locale mais bien planétaire ! Vive le progrès.

Stream Works

A l’origine Stream Works était destiné à délivrer de l’audio en direct via un réseau. C’est ainsi qu’il a servi à distribuer des flashes d’informations sur les réseaux privés de NBC et de Reuter. Ensuite, il a été capable de donner en plus de l’audio, de la vidéo. Fort de cette expérience, c’est en août dernier que Stream Works a fait son apparition sur Internet. Pour réaliser ce tour de force, il utilise des algorithmes de compression dérivés du MPEG. Le lecteur qui se trouve sur la machine de l’utilisateur effectue la décompression en temps réel.

En fait, Stream Works est un système très performant mais qui nécessite du matériel qui est encore réservé à un public de professionnels. Avec la compression MPEG, vous pouvez recevoir chez vous des données proches de la qualité CD à condition d’être équipé d’une ligne RNIS (ligne téléphonique numérique) qui autorise un plus grand débit que les lignes traditionnelles analogiques.

Le principe de calcul de la compression MPEG est programmable en fonction de la qualité audio ou vidéo que vous voulez avoir. Ce principe est très intéressant et est indépendant du type de vidéo (mouvements rapides ou non) ou de son (un orchestre ou un oiseau). Il compresse jusqu’à un facteur de 50/1 !


Internet : les coulisses


Introduction

Le mot réseau vous fait-il peur ? Il n'y a pas de quoi .... Vous en utilisez un tous les jours, c'est le réseau téléphonique. Mais ce réseau, nous le verrons, n'a pas que des avantages, du moins quand il est utilisé avec son terminal le plus commun, le téléphone. Sur le réseau téléphonique, vous connaissiez le téléphone, le fax,... vous connaissez maintenant Internet.

La première chose qui surprend lorsque vous entrez dans le monde magique d'Internet est votre soudaine proximité avec le Japon et New York. Vous pouvez communiquer avec la même facilité entre votre domicile et New York ou entre votre domicile et votre voisin de palier. Pourtant dans ce monde où l’on ne connaît plus son voisin de palier, il n'est pas dit qu'Internet vous aidera à communiquer plus facilement qu'aujourd'hui avec vos contemporains !

A la différence du réseau téléphonique, qui techniquement ne vous empêche pas de communiquer avec les quatre coins du monde, la communication Internet est gratuite. Lorsque vous avez un accès Internet, vous payez éventuellement le prix de la communication entre votre domicile et votre fournisseur Internet, mais pas de supplément de communication, que vous communiquiez avec le Japon ou la Suisse.

On sait donc que la communication du particulier avec un autre particulier ou avec une entreprise passera de plus en plus par Internet.

Internet vous offre même la communication avec des gens regroupés autour de vos centres d'intérêt dans des forums ou des canaux.

Si on ne parle plus de communication, mais d'accès à des volumes d'information, on peut aussi dire que le jour où vous vous connectez sur Internet, vous disposez dans votre bureau de la plus formidable bibliothèque de documents que l'humanité ait jamais fournie. Ce n'est pas pour autant que vous lirez tous les livres. Ce n'est pas pour autant que vous aurez envie de lire!

Les adresses sur le réseau Internet

Votre bibliothèque, même si elle est en désordre, vous permet de retrouver sans trop de problèmes tous les livres que vous aimez. Par contre, lorsque vous vous rendez dans votre bibliothèque communale, il vous est, la plupart du temps, nécessaire de consulter un fichier pour retrouver la trace du livre que vous aimeriez lire.

Il en va de même avec les adresses de vos amis, vous en connaissez peut-être par coeur, mais vous avez un répertoire pour noter les adresses des moins proches. Heureusement pour ceux que vous avez un peu perdus de vue, il y a toujours les pages de l'annuaire !

On trouve trois types d'adresse pour relier un service Internet ou une personne :

son adresse Internet,

son numéro IP,

son adresse URL.

Les trois méthodes sont équivalentes, la troisième est la plus en vogue aujourd'hui.

Les adresses FQDN ou E-Mail

Lorsque vous recherchez votre ami Dupont dans l'annuaire, vous regardez d'abord la ville où il habite, puis s'il y a deux Dupont, vous départagez les Dupont par leur prénom. Dupont est donc identifié par son prénom, son nom et sa ville.

Sur Internet c'est la même chose, Dupont est connu sous l'adresse : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

Si vous ne recherchez pas Dupont mais le nom d'une société, vous n'avez que le nom de la société et sa ville à rechercher, sachant que dans la société en question Dupont travaille peut-être.

Sur Internet le nom d'un ordinateur centralisant plusieurs personnes est organisation.domaine

Les domaines sont regroupés en grandes classes :

com désigne les entreprises commerciales, edu désigne l'éducation, gov désigne les organismes gouvernementaux, mil désigne les organisations militaires, net désigne les organismes fournisseurs d'Internet, org désigne les autres organismes non référencés.

Ils sont aussi regroupés en pays :

  • au Australie,
  • be Belgique,
  • ca Canada,
  • fr France,
  • uk pour United Kingdom.

    N’oubliez pas que la langue anglaise est la langue d'Internet.

    En jargon Internet, les noms sous la forme Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. sont dits FQDN (Fully Qualified Domain Name) ou adresse E-Mail.

    Voilà ! Plus de mystère, albert@palais_royal.be est un belge (be), il travaille au palais et son nom est Albert.

    On peut noter qu'un nom peut être composé, par exemple Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. désigne un Belge qui a son accès à Internet chez Ping et dont le prénom est Hugues.

    Une organisation peut également être composée. Par exemple, Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. travaille pour la Navy (navy.mil), dans le laboartoire de recherche. (nrl : navy research laboratory)

    Peut-être enverrez-vous un courrier un jour à Paul, sans préciser son domaine et son organisation, c'est que Paul est dans la même organisation que vous.

    Généralement, pour les adresses courrier, les noms en majuscules sont équivalents aux noms en minuscules mais les accents sont interdits.

    Les numéros IP (Internet Potocol)

    Il existe un équivalent des noms précédemment définis, c'est un nombre de 32 bits, que l'on écrit sous la forme de quatre nombres séparés par un point.

    Par exemple, 192.203.245.63 est une adresse TCP/IP donnée sous une forme plus technique mais moins mnémotechnique que la précédente. Ce sont ces adresses que connaissent les ordinateurs qui communiquent entre eux.

    Là aussi on retrouve une certaine logique d'attribution de ces numéros. Le premier groupe de numéros peut être plus ou moins grand (on dit de classe A, B ou C), de telle sorte que plus on réserve de chiffres (digits) pour les premiers numéros, moins il en reste pour la deuxième partie de l'adresse.

    Ainsi on réservera les petits numéros de classe pour les très gros sous-réseaux d'Internet et les grands numéros de classe pour les petits sous-réseaux Internet.

    Ces numéros IP sont les numéros par lesquels les ordinateurs communiquent entre eux. Mais ils ne peuvent pas être donnés arbitrairement puisque deux ordinateurs sur l'Internet ne peuvent pas avoir le même numéro.

    C'est un organisme appelé NIC (Network Information Center) qui fournit les premiers numéros appelés racine du numéro IP à charge de l'administrateur de votre réseau de vous distribuer les numéros disponibles dans la plage des numéros attribués.

    La personne qui administre votre réseau est peut-être un ingénieur système de votre entreprise, ou si vous êtes un particulier, c'est une personne chargée de gérer le site de votre fournisseur.

    Il est à noter que si vous avez une adresse qui vous identifie, par exemple Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser., les fournisseurs Internet qui possèdent un certain nombre d'accès simultanés inférieurs à leur nombre de clients, peuvent vous attribuer une adresse TCP/IP qui n'est pas fixe.

    Enfin l'adresse électronique du NIC, lorsque vous désirez enregistrer un domaine, est Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.. Mais cet organisme vous enverra vers l'organisme compétent de votre pays.

    Les adresses FQDN et les numéros IP (Internet Protocol)

    Vous devez juste vous souvenir que généralement vous pouvez (en tant qu'utilisateur) utiliser les adresses FQDN ou les numéros IP indifféremment. Par contre les ordinateurs, entre eux, ne connaissent que les numéros IP.

    Concrètement, lorsque vous donnez une adresse FQDN à un ordinateur, celui-ci interroge un serveur, qu'il contacte automatiquement, pour la transformer en numéro IP.

    Chaque domaine est servi par un ordinateur que l'on appelle serveur de noms qui est chargé de faire cette transformation d'adresse en numéro IP.

    Les Adresses URL

    Avec les dernières technologies, la tendance est de donner les adresses directement sous la forme d'hypertexte ou d'URL.

    Comment cela marche-t-il?

    D'abord, on place le type de service auquel on s'adresse. Nous verrons que les services peuvent être des serveurs de Web (http), des serveurs de fichier (ftp), et d'autres que nous expliquerons plus en détail dans le chapitre sur le Web.

    Donc, une adresse URL est une adresse de la forme : service://machine/directory/fichier

    par exemple :

  • http://www.microsoft.com
  • ftp://www.cern.fr/public

    L'avantage de ce type d'adresse est qu'il englobe beaucoup plus d'informations que l'adresse FQDN, puisqu'il comprend: l'adresse FQDN,

  • le type de service,
  • l'emplacement sur le serveur,
  • le nom du fichier.

    Souvent le nom du répertoire d'accueil est omis ainsi que le nom du fichier, car le nom service://machine est non ambigu.

    Ces adresses URL sont d'autant plus étonnantes qu'on les trouve au hasard de la lecture des documents hypertextes. Regardons comment cela marche .... Notons que par défaut votre lecteur de Web acceptera même des adresses URL sans les symboles http://. Ainsi l'adresse www.microsoft.com est suffisante pour se rendre chez Microsoft. Comment note-t-on les adresses ? Sans nécessairement comprendre toutes les composantes d'Internet, vous devez retenir la convention suivante: les adresses seront nommées dans ce travail sous la 3 ème forme. Ainsi vous devrez savoir naturellement que :

  • http://www.microsoft.com fait référence à un serveur http d'adresse FQDN www.microsoft.com
  • ftp://nic.sys.edu fait référence à un serveur ftp d'adresse Internet nic.sys.edu
  • ftp://nic.sys.edu/toto fait référence à un serveur ftp d'adresse Internet nic.sys.edu dans la directory ou le fichier toto
  • ftp://nic.sys.edu/toto/titi fait référence à un serveur ftp d'adresse Internet nic.sys.edu dans la directory ou le fichier toto/titi
  • news:comp.internet.library fait référence à la new comp.internet.library
  • telnet://micros.bpo.fr fait référence à l'adresse micros.bpo.fr à laquelle on accède par telnet Cette convention a un gros avantage : une adresse, lorsqu'elle est donnée sous sa forme URL, permet d'y accéder en cliquant dessus depuis votre lecteur de Web. Par contre, vous devez savoir la traduire en adresse Internet FQDN pour les outils ftp, news, telnet ou autre.

    Les connexions physiques

    Mais comment sont connectés les ordinateurs entre eux pour faire ce très gros réseau ?

    On trouve :

  • Les liaisons téléphoniques vont jusqu'à 28800 bits par seconde. Avec de telles liaisons, on peut transporter un fichier de 1 Mo en 4 à 5 minutes théoriques, c'est-à-dire en fait en 8 à 10 minutes. Ce qui veut dire que pour transférer un CD audio (640 Mo), il faudra 4 jours. Les liaisons spécialisées (LS) de 56 Kbps à 2 Mbps sont les plus courantes. Une ligne à 64 Kbits par seconde permet de transférer le même fichier de 1Mo en 15 secondes théoriques, c'est-à-dire 30 secondes en pratique. Cela revient à transférer un CD audio (640 Mo) en 5 heures. Sur les lignes à 2 Mb, c'est uniquement 10 minutes qui sont nécessaires.
  • Sur les lignes téléphoniques on utilise un TCP/IP pour liaison série SLIP ou PPP. Une liaison série SLIP (Serial Line Internet Protocol) est une adaptation de IP pour la transmission de données à travers une liaison par modem, plutôt qu’à travers un réseau local.
  • Une liaison série PPP (Point to Point Protocol) est une autre adaptation de IP pour la transmission de données à travers une liaison par modem.

    Le protocole TCP/IP (Transmission Control Protocol / Internet Protocol)

    Le protocole TCP/IP est né aux USA à l’époque de l’ARPANet. Pendant ce temps là, l’Europe créait également son propre standard permettant l’interopérabilité. Il portera le nom d’OSI (Open Systems Interconnection). Mais chaque jour qui passait, amenait son lot d’utilisateurs nouveaux au profit du standard TCP/IP. Il gagnait aussi de plus en plus de crédibilité et tout cela au détriment de l’OSI. C’est ainsi que le TCP/IP va remporter le match et c’est ce protocole qui définit aujourd’hui la structure d’adressage et les différents types d’adresses (voir plus haut) que l’on retrouve sur le Net.

    Les fournisseurs d’accès

    Les fournisseurs d’accès (acces provider) sont des sociétés privées qui permettent aux particuliers ou aux entreprises de se connecter à Internet. Ils vous donneront une boîte aux lettres (une adresse E-Mail ou FQDN) ainsi que la possibilité de créer votre propre page sur le Worlwide Web.

    Mais comment faire pour choisir un fournisseur plutôt qu’un autre ? Voici les principaux paramètres à prendre en compte :

  • Votre zone téléphonique Les fournisseurs disposent de plusieurs point d’accès au réseau (POP - Point Of Presence) qui sont dispersés sur les différentes zones téléphoniques du pays. Ils vous permettent donc de vous connecter pour le prix d’une communication locale si vous vous trouvez dans une zone couverte.
  • Votre ordinateur Si vous disposez d’un modem à faible débit (2.400 bps), vous avez tout intérêt à trouver un fournisseur qui modulera ses prix en fonction du débit du modem. Si votre modem est rapide (28.800 bps), alors il est préférable de trouver un fournisseur qui supporte ce type de matériel.
  • L’horaire ou le forfait En ce qui concerne l’horaire, vous payez en fonction du temps de connexion. Plus vous êtes connectés longtemps, plus la facture sera salée. Avec le forfait vous avez droit à un certain temps de connexion.
  • L’accès à un serveur de News Tous les fournisseurs ne donnent pas le même accès aux différents services d’Internet. Certains Newsgroups seront présents tandis que d’autres ne le seront pas.

    Le modem

    Le modem est un néologisme pour « modulateur/démodulateur ». En gros, c’est lui qui va s’occuper de transformer les données binaires de l’ordinateur en sons pour pouvoir les transmettre sur la ligne téléphonique (on parle de modulation). De l’autre côté de la ligne, un autre modem fera le travail inverse et transformera les sons en données binaires (c’est la démodulation).

    Un modem peut se présenter sous deux formes différentes. Vous trouverez soit des modems externes ou internes. Un modem interne est une carte d’extension similaire à votre carte vidéo ou à votre carte son. Un modem externe est un boîtier de taille plus ou moins encombrante qui se connecte sur un port série de votre ordinateur par l’intermédiaire d’un cable série.

    Voici quelques années, on exprimait encore la vitesse d’un modem en bauds. En fait, ce n’est plus d’actualité. Les bauds expriment le nombre d’échanges de signaux par seconde à travers la ligne téléphonique. Aujourd’hui, le nombre d’échanges n’a pas tellement augmenté mais on transfère plusieurs bits par échange; donc cette valeur a perdu de son importance. De plus, elle n’intervient qu’entre les deux ordinateurs par l’intermédiaire des modems. La valeur à retenir aujourd’hui est le Bps. Ce sont les bits par seconde. Vous trouverez des modems affichant 2.400 bps, 9.600 bps, 14.400 bps ou encore 28.800 bps. Cette valeur détermine la vitesse de transfert des données numériques. Donc, plus la valeur sera élevée et plus le modem sera rapide. Mais cette rapidité peut amener également quelques soucis. En effet, plus le modem sera rapide et moins il sera stable. Ce qui aura comme conséquence que lors d’une communication instable, il risque de raccrocher purement et simplement.

    Ce qui définit la vitesse à laquelle votre modem peut converser avec le port de communication série de votre ordinateur (Com1, Com2, ...) est le DTE Rate. Ces vitesses sont « normées » et ne peuvent sortir des valeurs suivantes : 300 bps, 1.200 bps, 2.400 bps, 4.800 bps, 9.600 bps, 19.200 bps, 38.400 bps, 57.600 bps et 115.200 bps. Le DTE Rate que vous donnez à votre ordinateur limite sa vitesse de connexion vers le haut uniquement. Elle ne définit en aucun cas la vitesse exacte à laquelle vous souhaitez que le modem se connecte. Une erreur à ne pas commettre est de définir 14.400 ou 28.800 comme DTE Rate, alors qu’il s’agit de la vitesse à laquelle votre modem communique sur la ligne de téléphone qui le sépare d’un autre modem, et non pas sur le câble série qui le sépare de votre ordinateur.


    Le World Wide Web


    Introduction

    L'outil qui a rendu populaire l'Internet, est incontestablement le 3W, le WWW, le World Wide Web, en un mot le Web.

    Le mot Web désigne la toile d'araignée et World Wide Web désigne donc la toile d'araignée couvrant le monde entier. L'outil est graphique, il est puissant, englobe Gopher, New, ftp, telnet et d'autres. Il est très facile à utiliser, il est beau et il ne coûte pas cher. Par le Web, vous pouvez visiter une exposition, lire votre journal, apprendre l'anglais, commander une pizza. De plus, tous les connectés ont leur page Web personnelle, et vous aurez peut-être envie d'écrire la vôtre. Le plus spectaculaire dans le Web est la large utilisation des hypertextes, ce sont des textes de couleur différente (bleu en général) que vous cliquez pour vous retrouver dans un autre document. Ces hypertextes rendent votre lecture plus dynamique : si vous lisez un article traitant de "l'invention du téléphone sans fil" et que votre article cite ATT, un hypertexte vous permettra de voir une présentation d'ATT en cliquant simplement sur le mot ATT. Dans un document, on reconnaît un hypertexte par sa couleur différente du reste du document. Quand, après avoir cliqué sur un hypertexte pour vous rendre sur un autre point du réseau Internet vous revenez sur votre page initiale, vous voyez que la couleur de l'hypertexte a changé. C'est normal, c'est pour vous prévenir que vous êtes déjà passé par là. Le mécanisme de changement de couleur est assez sophistiqué. En effet, prenons un document qui s'appelle A, et dans ce document, prenons deux liens, l'un sur B et l'autre sur C... Si vous cliquez sur B depuis A, vous partez sur B... et si vous revenez sur A vous pouvez voir dans A le lien sur B avec une couleur différente (en général violet). Maintenant si on va sur C et si dans C il y a un lien sur B, la magie s'opère : le lien sur B dans le document C a également changé de couleur. Cela vous évite dans les recherches de parcourir plusieurs fois un même document. Vous vérifierez ce phénomène avec les liens sur l'index. Si vous allez chercher un mot dans l'index, il aura désormais une autre couleur dans toutes les pages où il apparaîtra, ce qui ne vous empêchera d'ailleurs pas d'y revenir autant de fois que vous voudrez... La seule chose à savoir c'est que vous êtes informé que le lien a déjà été parcouru. Des documents contiennent ainsi des références sur d'autres documents, créant une toile d'araignée de documents recouvrant le monde. D'un point de vue théorique, les Webs sont autant de points d'informations se recoupant par des liens et garantissant au NetSurfer (c'est à dire celui qui se promène de Web en Web) des informations toujours mises à jour. Il y a environ 10 millions de Web dans le monde à ce jour sans compter les Web personnels faits par les utilisateurs passionnés. Les Hypertextes peuvent adresser d'autres documents de type Web mais aussi des serveurs de fichier, des serveurs de News etc. Pour accéder à une adresse depuis votre lecteur de Web, vous avez trois possibilités :

  • - cliquer sur un hypertexte de couleur différente dans la page Web
  • - passer par le menu File, et dans la fenêtre qui apparaît, entrer l'adresse http:// correspondant au site auquel vous désirez accéder; si vous utilisez Netscape, il est inutile de passer par le point 2: si le bandeau Location en-dessous de la barre de menu est présent,
  • - entrez directement le nom du site à visiter.

    Les URL (Uniform Resource Locators)

    Introduction

    Les URL sont les noms donnés aux hypertextes.

    Un URL peut être un serveur ftp, un fichier sur votre disque, un serveur gopher, une image, une adresse courrier, un serveur de News, un serveur telnet et bien sûr un serveur http, c'est-à-dire un serveur de Web. Un exemple d'URL est http://www.xerox.fr:8080 un autre est ftp://inria.ftp.fr En général, vous n'avez pas à connaître précisément les adresses de service puisque vous avez à cliquer sur un texte de couleur vous y conduisant. Ainsi le Web numéro 1 vous conduit au Web numéro 2 qui vous conduit au Web numéro 3 et ainsi de suite. Le point sensible des Webs est que les adresses pointées par les URL ont tendance à changer souvent, soit parce que le propriétaire du Web a déménagé soit parce que le serveur est devenu saturé. Donc, il n'est pas exclu qu'en surfant vous tombiez sur quelques impasses! Il se peut que vous vouliez aller un peu plus vite, et atteindre directement une page HTML sans progresser de proche en proche. Ce sera possible en donnant l'adresse URL de votre cible. Ceci se fait dans la majorité des cas en cliquant sur le menu file et open URL de votre lecteur de Web. Parfois vous aurez des références d'adresses de la forme : http://serveur/directory/fichier.html fichier.html est un nom de fichier HTML sur le serveur de Web (html signifiant HyperText Markup Language). Ceci signifie notamment que le fichier n'est pas sur un PC car sur celui-ci les extensions de fichier n'ont que trois caractères. En revanche : http://serveur.directory.fichier.htm est une adresse de fichier HTML qui a de grandes chances de se trouver sur un PC. En général, pour trouver le Web d'une compagnie commerciale, par exemple Compaq, il suffit de taper l'adresse de cette société de la sorte http://www.compaq.com. Ceci se vérifie pour Microsoft, Xerox, IBM et bien d'autres. La plupart du temps vous n'aurez pas à taper ces longues syntaxes car : vous aurez les pages les plus fréquemment utilisées dans votre liste de pages favorites, ou bien vous aurez trouvé l'adresse en passant par un autre Web.

    Types d'URL

    On trouve plusieurs types d'URL, chacun représentant un service donné. Il est important de garder présent à l'esprit que l'architecture WWW permet de couvrir l'ensemble des services cités. Les noms d'URL utilisent les lettres de l'alphabet en général en minuscule, sachant que les noms en majuscules et minuscules sont équivalents.

    Les chiffres sont autorisés. Certains caractères / . : # ont une signification particulière et enfin certains caractères sont dit non sûrs dans la mesure où ils sont interprétés : les blancs, les étoiles, etc. Passons en revue les URL les plus utilisées mais auparavant, regardons la forme générale d'une URL. Une URL est de la forme service://:@:/

  • file

    file:///repertoire/fichier.txt

    Ce type d'URL permet d'accéder à un fichier ici fichier.txt, présent sur votre disque. Ce type d'URL n'est pas très normalisé et on trouvera :

  • sur VAX /VMS : file://vms.host.edu/disk$user/my/notes/note12345.txt
  • sur PC : file:///c|tmp/fichier.txt
  • http (Hyper Text Transmission Protocol)

    http://serveur:port/repertoire/fichier.html

    Ce type d'URL permet d'accéder à un serveur Web, généralement présent sur une autre machine. Le plus souvent ni le port, ni les noms de répertoire, ni le nom de fichier ne sont mentionnés. Ils ont des valeurs par défaut. Note : l'URL d'un serveur http peut être suivie d'un point d'interrogation et d'une chaîne de caractères servant de chaîne de requête sur le serveur http.

  • ftp (File Transfer Protocol)

    ftp://serveur/repertoire/fichier

    Ce type d'URL permet d'accéder à un serveur ftp et:

  • de visualiser l'ensemble des fichiers d'un répertoire si aucun fichier n'est spécifié.
  • De rapatrier le fichier sur votre disque local si un nom de fichier est donné. Un service ftp vous permet d'écrire ou de lire des fichiers à distance sur une autre machine du réseau. Note : l'URL peut être terminé par la séquence ;type=où typecode peut être le caractère i, d ,/ ou a.
  • mailto

    mailto:Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. Ce type d'URL permet d'écrire un courrier électronique (E-Mail) à l'utilisateur dont l'adresse figure dans l'URL.

  • telnet

    telnet://Nom:Password@serveur:port Ce type d'URL permet d'ouvrir une session telnet Une session telnet est une fenêtre représentant la console d'une machine distante présente sur Internet.

  • gopher

    gopher://serveur:port/repertoire/fichier#marqueur Ce type d'URL permet d'ouvrir un menu Gopher. Un menu Gopher est une arborescence de fichiers plus animée que celle que l'on trouve sur ftp. C’est-à-dire que l’interface est plus intuitive et moins ardue que sur les sites ftp.

  • news

    news:nom.de.la.news news:numero de news Ce type d'URL permet d'ouvrir une News sur le serveur de News paramétré dans votre logiciel. Les news sont des forums où des courriers restent stockés par thème pendant une durée de quelques jours. Notes : lorsque l'URL est demandé avec le nom de la news, il est possible de mettre des caractères *, pour spécifier un ensemble de news, par exemple news:alt.binaries.* affichera toutes les News commençant par alt.binaries.

  • Serveur de News

    newsrc://serveur:port/repertoire/nom.de.la.news Ce type d'URL permet d'accéder à une News non pas sur le serveur de News configuré sur le lecteur de Web du client mais bien sur un serveur de News défini.

  • Base WAIS

    wais://:/ wais://:/? wais://:/// Ce type d'URL permet d'accéder à un serveur de base de données WAIS

  • Directory prospero

    prospero//serveur:port/repertoire Ce type d'URL permet d'accéder à un service particulier appelé service de répertoire Prospero.

  • Autres

    En principe, d'autres services peuvent être déclarés par les serveurs http et le lecteur peut être configuré pour accéder à ces nouveaux services. En pratique, aucun serveur http n'utilise d'autres services que ceux décrits ci-dessus sauf pour expérimentation. Un service expérimental doit avoir un nom commençant par x-


    Les logiciels de lecture de Web (Browsers)

    Le premier logiciel lecteur de Web graphique connu par le public fut Mosaic de NCSA (National Center for Supercomputing Applications) de l'université de l'Illinois. Il fut précédé de logiciels précurseurs comme tkWWW, violaWWW et midaswww dans l'année 1992.

    Ces logiciels, s'ils possédaient des options très en avance sur ceux d'aujourd'hui, n'ont pas connu le succès du logiciel du NCSA. Lorsque vous ne disposez pas d'une interface graphique, le logiciel Lynx vous permet de vous connecter à un serveur Web de façon textuelle, sans afficher les images. Ce logiciel n'utilise pas non plus la souris, mais la touche de tabulation permet d'aller d'URL en urloc dans le texte. Le logiciel Netscape est le plus classique parmi les logiciels de visualisation. La version 2.0b n'est pas gratuite (à l'opposé de la version 0.9x). Netscape couvre aujourd'hui 70 % du marché des lecteurs de Web. On trouve des logiciels de lecture de Web (browser) plus ou moins multimédia, qui permettent d'afficher jusqu'aux séquences vidéo. Les logiciels lecteurs de Web permettent de charger des fichiers par ftp, de lire des News, d'envoyer une session telnet. Les lecteurs de News de la société SUN permettent d'afficher des objets animés (norme JAVA). De nouveaux lecteurs permettent d'afficher des images en trois dimensions (norme VRML)

    Description de Netscape

    Version freeware : 0,94

    Version payante : 2.0 (1200 F environ) Originalités :

  • permet d'ouvrir plusieurs pages Web
  • version française
  • gère la lecture et l'écriture des News
  • gère le courrier électronique (E-Mail)
  • permet de franchir un FireWall
  • très bonne gestion des signets
  • supporte Java
  • bibliothèque de Plug-Ins

    Les Web chercheurs d'informations

    Il existe des sites Web spécialisés dans la recherche d'informations sur Internet. Ces sites sont couplés avec des bases de données qui sont alimentées en permanence.

    Ils permettent de retrouver n'importe quel type d'information, que ces informations soient stockées sur un Web ou sur un serveur ftp. En pratique, ils sont presque exhaustifs dans le monde des Web, et encore assez pauvres dans le monde des serveurs ftp. Il est important de mettre un de ces chercheurs dans la liste de vos sites favorits après les avoir utilisés et avoir choisi celui qui vous convenait le mieux.

    Principe de fonctionnement

    Le but de cette section est de s'intéresser au mode de fonctionnement de ces différents moteurs de recherches. Théoriquement, les moteurs de recherche, au sens véritable du terme, sont ceux qui effectuent eux-mêmes la recherche et l'indexation des pages Web sans intervention humaine. Les sites d'indexation automatique comprennent tous :

  • une base de données
  • un logiciel de mise à jour de cette base de données Nous allons expliquer brièvement le fonctionnement d'un programme de mise à jour. Ces logiciels de mise à jour, sont appelés robots, nom qui indique bien qu'ils correspondent à des programmes automatiques. Un robot est un programme simple dans le principe, mais que les optimisations rendent complexe dans sa mise en oeuvre. Tout d'abord, ces programmes ont deux missions essentielles :
  • lire l'information et la gérer,
  • chercher dans ces informations d'autres adresses où aller chercher La première de ces deux étapes est facilement compréhensible; elle permet de faire de l'indexation textuelle qui revient à mémoriser des mots clés, éventuellement les phrases dans lesquelles ils apparaissent et surtout leur localisation, c'est-à-dire leur adresse URL. La recherche des mots clés se fait par des logiciels comme Glimse, agrep ou free Wais qui sont plus ou moins performants et qui ont des fonctionnalités plus ou moins évoluées. Ces logiciels lisent donc un fichier et mettent dans un index les mots lus dans le fichier. Dans cette lecture, ils analysent parmi les mots rencontrés, les adresses d'URL, de façon à connaître de nouvelles adresses de Web à explorer par la suite. Cette analyse doit être assez fine pour prendre en compte les aspects suivants :
  • mémoriser l'adresse IP du site trouvé et les noms des fichiers correpondants, pour éviter la redondance et le bouclage des noms de serveur.
  • ne pas appeler les programmes CGI, les pages ISINDEX afin de ne pas provoquer des requêtes intempestives. De même les URL mailto:, ou telnet: ne sont pas exécutées.
  • mémoriser les dates de visite des pages de manière à ne plus repasser pendant une durée paramétrée. C'est ainsi que les programmes de recherche scrutent en permanence Internet. Et lorsque vous demandez à Lycos de chercher un mot clé, il effectue la recherche non pas sur Internet mais dans son fichier de recherche.

    Historique du Web


    Le Web est un protocole très nouveau qui est basé sur des concepts assez anciens. Regardons de plus près cette histoire du Web qui débuta avant le nom.

    1945 Vannevar Bush, conseiller de Roosevelt publie une note concernant des toiles conceptuelles d'informations. 1965 Ted Nelson donne naissance à l'Hypertexte; puis à un logiciel de navigation hypertexte qui ne fonctionnera jamais. 1987 Hypercard logiciel d'Apple utilisant les Hypertextes est lancé. Mars 1989 Tim Berners-Lee du CERN publie l'article " Hypertexte et le CERN " Octobre 1991 Le premier Web fonctionne au CERN en mode texte. Janvier 1993, Il existe une cinquantaine de serveurs http dans le monde. Le CERN lance la version alpha du premier browser graphique pour Xwindows et Macintosh. Février 1993, Marc Andreesen édite la première version du browser Mosaic par le NCSA. Elle fonctionne sous Xwindows UNIX. Octobre 1993, NCSA lance la première version des browsers Mosaic sous Macintosh et PC Windows. Mars 1993, Andreessen et Clark (le fondateur de Silicon Graphics) s'unissent pour développer Netscape. Juillet 1993, Le Cern et le MIT puis l'INRIA créent le WWW Consortium pour guider à la normalisation du Web. Octobre 1994, Netscape est lancé en beta test sur PC, Macintosh et X Windows. Février 1995, 4 millions d'utilisateurs de Netscape. 75% des browsers sont des Netscape. Mai 1995, Microsoft annonce la distribution de Spry un autre browser sur les versions de Windows 95. Novembre 1995, Netscape sort la version 2.03b de son logiciel, qui devient opérationnelle, supporte les News, le courrier (envoi et lecture) et supporte le langage Java. Décembre 1995, Microsoft lance sa version Internet Explorer 2.0 Mars 1996, Microsoft annonce que la version d'Internet Explorer 3.0 supportera Java, JavaScript, les liens OLE2, les Frames. La guerre Microsoft-Netscape est déclarée.


    Réalisation d’un serveur Web


    Le langage HTML (Hyper Text Markup Language)

    Toutes les pages qui se trouvent sur le WWW ont été programmées en HTML. Ce langage a le gros avantage de créer des documents qui pourront être consultés sur tous les ordinateurs, quel que soit le système d’exploitation employé. Un PC pourra aussi bien lire la page qu’un ordinateur tournant sous Unix ou un Macintosh. Cela s’explique par le fait que ce qui se trouve sur le réseau n’est rien d’autre que du code ASCII codé sur 7 bits et c’est en réalité le browser tournant sur votre machine qui vous permettra de visualiser la page. De même, puisque c’est du code ASCII, le navigateur ne reconnaîtra ni les caractères accentués (dommage pour le français), ni les retours à la ligne, les fins de paragraphe et encore moin le gras ou l’italique. Heureusement, le langage HTML permet de contourner les limitations de l’ASCII. Pour y arriver, il emploie des « tags ». Ils indiqueront au navigateur un enrichissement de texte. Le principe des « tags » est extrêmement simple. Un « tag » commence toujours par le symbole « ». A chaque fois que le browser rencontrera ces symboles, il sait qu’il n’a plus affaire à du texte, mais bien à une commande. Le browser aura compris que tout ce qui se trouve entre les deux tags sera du langage HTML. Un document HTML comporte au minimum deux parties.

  • un en-tête
  • un corps La partie la plus importante sera le corps. C’est là que nous ferons la mise en page du document. Il pourra comporter des éléments très différents les uns des autres. Par exemple du texte, des fichiers audionumériques, des images, ... Des liens hypertextes peuvent également être inclus. Ce sont eux qui permettent de sauter de site en site. Vous pouvez par exemple dans la phrase « Bienvenue au Collège Saint-Vincent » souligner le mot Saint-Vincent et créer un lien qui enverra l’utilisateur sur un site Web parlant de la vie de Saint-Vincent. Une fois la mise en page de votre document terminée, il vous faudra la rendre accessible au monde entier en l’envoyant sur un serveur qui l’hébergera. Un grand nombre de fournisseurs d’accès (Ping, Infoboard, ...) vous offrent gratuitement l’occasion de le faire. Ainsi, vous aurez contribué personellement au développement d’Internet.

    Conclusion


    Je pense que s’il fallait trouver la clé du succès d’Internet, ce serait peut-être bien le fait qu’il est vecteur à la fois d’images, de sons, de texte, d’informations; et qu’il échappe à tout contrôle, à toute réglementation...

    De plus, ce travail ma également permis d’en découvrir le côté pratique puisque tout ce que je connaissais d’Internet était issu de livres et autres articles. Je crois qu’après toutes les heures passées à parcourir le réseau dans tous les sans, j’ai pris conscience que le réseau des réseaux n’est pas seulement un monde binaire, froid et sens vie. Internet est véritablement une « autre planète sur terre ». En effet, vous y rencontrerez des gens comme vous pourriez le faire dans la rue à la seule différence près que la rue s’appelle Terre.


    Glossaire


    Anonymous ftp

    Service ftp sur lequel l'utilisateur peut se connecter sans posséder un compte utilisateur, mais avec le nom anonymous. Il est demandé de renseigner le mot de passe avec son adresse courrier.

    ARPANET

    (Advanced Research Project Administration Network) Développé dans les années 1960-1970 par le département de la défense du gouvernement Américain, c'est le réseau ancêtre d'Internet.

    ASCII

    (American Standard Code for Information Interchange) Ce sont les caractères de A à Z, de a à z et les chiffres, plus les signes de ponctuation et les caractères accentués. Cette norme ne comprend que 92 caractères imprimables 2 x 26 lettres (minuscules et majuscules), 10 chiffres et 30 signes divers. Dans sa version originale elle ne contient pas les lettres accentuées. On parle de caractères ASCII pour un texte sans enrichissement typographique, et sans graphique.

    Bande Passante

    (Bandwidth) C'est la quantité d'information que peut véhiculer un canal de communication. Se mesure en bits par seconde (bps).

    Baud

    Nombre de changements de signaux par unité de temps dans une transmission de données. Les lignes téléphoniques permettent une vitesse maximale de 2400 bauds. Le codage de plus d'un bit sur chaque changement de signal permet d'atteindre des vitesses de 32000 bits par seconde. Il n'y a donc pas d'analogie entre les bits par seconde et les bauds.

    Bit

    (Binary digIT) Une quantité d'information binaire élémentaire (0 ou 1). Un caractère ASCII comprend 8 bits.

    Bps

    Abréviation de Bits Par Seconde. C'est ainsi que se mesure la bande passante d'une ligne de communication.

    Browser

    Un programme qui permet de lire des documents HTML. Netscape est un browser. Le terme français est navigateur.

    Client

    C'est un programme qui est utilisé pour contacter un serveur. On parle alors de modèle client/serveur. L'avantage du modèle est que le client sait faire un certain nombre de tâches et ne soumet au serveur que les informations nécessaires. D'autre part un serveur peut fournir des clients sur PC Macintosh ou machine Unix.

    Connexion

    Installation permettant de relier un ordinateur et le réseau Internet.

    Cyberspace ou CyberEspace

    Cela désigne le monde cybernétique ou virtuel, dans lequel on se plonge lorsqu'on touche à Internet ou à un autre réseau informatique.

    Domaine

    Regroupement de plusieurs adresses Internet dans une organisation.

    E-Mail

    C'est un courrier électronique.

    Firewall

    C'est un ordinateur que l'on met entre un réseau local (celui d'une entreprise) et un autre réseau (qui peut être Internet), et qui fait office de filtre afin d'assurer la sécurité des informations à l'intérieur du réseau local.

    FTP (File Transfer Protocol)

    protocole d'échange de fichiers entre sites informatiques. En général les sites ouverts au public sont dits anonymous ftp car le nom de login est anonymous.

    Gopher

    Un modèle client-serveur permettant de lire des menus distants sur une machine. Largement supplanté par WWW.

    Giga (Go)

    C'est un "milliard" d'octets, ou 1024 Méga Octets (1073741824 octets pour être précis)

    HOST

    Ordinateur sur lequel on se connecte.

    HTML (HyperText Markup Langage)

    Les pages Web sont écrites dans un format assez simple, appelé HTML. Vous pouvez voir le contenu d'une page HTML dans un des menus de votre lecteur de Web en demandant à voir le code source.

    HTTP (HyperText Transfer Protocol)

    Un serveur http est un serveur chargé d'envoyer les pages Web (en HTML) à votre ordinateur, lorsque vous lisez un Web.

    Hypertexte

    Ce sont des textes marqués dans un document qui permettent de naviguer vers d'autres documents. On pourrait parler de lien. Les hypertextes sont d'une couleur particulière pour être facilement identifiables et ils changent de couleur une fois utilisés.

    ISDN (Integrated Services Digital Network)

    Appellation Américaine de RNIS. Réseau numérique à haute vitesse de transmission et à haute intégration de services.

    Java

    Le langage Java est un langage client-serveur, c'est-à-dire indépendant des plates-formes matérielles. De plus, il est orienté objet comme tous les langages modernes.

    KiloOctet (Ko)

    Correspond à 1024 octets (2 puissance 10).

    MégaOctets (Mo)

    Plus d'un million d'octets (1048576 exactement).

    MIME (Multi Purpose Internet Mail Extensions)

    Système d'encodage permettant d'expédier des fichiers attachés aux courriers électroniques.

    Miroir

    Un site miroir est un site ftp contenant les mêmes informations qu'un site principal, et créé pour éviter les concentrations de connexions sur celui-ci.

    Modem (Modulateur/démodulateur)

    Boîtier que l'on met entre un ordinateur et une prise téléphonique pour transformer un signal numérique (informatique) en signal analogique téléphonique, et vice-versa.

    Mosaic

    Le premier lecteur de Web développé par NCSA.

    MPEG (Moving Picture Expert Group)

    Procédé de compression des séquences vidéo.

    NEWS

    Les News sont des forums où chacun dépose des courriers (articles) par thème. Ces courriers sont conservés quelques jours et donnent lieu à des discussions.

    Numéro IP

    C'est une adresse donnée sous la forme 109.123.22.889 qui est la forme d'adresse connue par les ordinateurs.

    Octet

    = huit bits. C'est une unité de mesure pour petits supports d'information. 1000 octets sont 1 Ko, 1 million d'octets est 1Mo. Une image GIF prend 50 Ko. Un disque dur de PC peut avoir une capacité de 800 Mo.

    Plug-In

    Programme qui vient se greffer sur un autre lui ajoutant des fonctionalités. Le programme greffé est un programme à architecture ouverte.

    POP (Point of Presence)

    Point d'accès Internet pour un usager.

    PPP (Point to Point Protocol)

    Protocole permettant d'utiliser une ligne téléphonique et un modem en TCP/IP. Remplace peu à peu le protocole SLIP.

    Protocole

    Le mot protocole désigne en général les messages échangés entre deux machines. L'intérêt d'un protocole est de définir des méthodes d'échange d'information, indépendantes des matériels. Ainsi, une fois le protocole défini, chaque terminal, ou client ou serveur implémente ce protocole sans se soucier des autres ordinateurs.

    Robot

    C'est un programme automatique qui effectue certaines tâches. On trouve des robots puissants, couplés avec des bases de données d'information, chargés de rechercher de nouvelles adresses de données, afin de mettre à jour la base.

    Serveur

    Un ordinateur qui fournit des services à des clients. Il fournit ces services à des ordinateurs par des messages, ce qui permet d'avoir plusieurs types de clients.

    SLIP (Serial Line Internet Protocol)

    Protocole permettant d'utiliser une ligne téléphonique au moyen d'un modem. Il tend à être remplacé par PPP.

    TCP/IP

    TCP/IP est le nom de la partie cachée de l'Internet. Il existe plusieurs protocoles réseau (Netware, LanManager...). TCP/IP est le plus propice aux interconnexions de réseaux. Il existe beaucoup de réseaux TCP/IP qui ne sont pas reliés à l'Internet.

    Telnet

    Logiciel permettant de se connecter sur un serveur pour y exécuter des commandes.

    UNIX

    Système d'exploitation utilisé pour faire fonctionner les serveurs.

    URL (Uniformed Resources Locator)

    Ce sont des textes de couleurs différentes (par défaut ils sont en bleu) dans un document qui permettent lorsqu'on clique dessus avec la souris d'aller vers l'endroit référencé.

    Usenet

    C'est le réseau des News, de l'Internet. Souvent l'amalgame est fait entre les Usenet et Internet, car il y a beaucoup d'utilisateurs qui n'utilisent que les News de l'Internet.

    Web

    En français, toile d'araignée; symbolise le réseau maillé de serveurs d'informations formant une toile d'araignée. Ces serveurs vont des pages personnelles aux interfaces de bases de données. Par extension on parle de Web pour un serveur de page HTML.

    WWW (World Wide Web)

    Système mondial d'interconnexion des informations par le protocole Web.


    Magic Technology 2009