Quelques mots sur les noms de fichiers HTML et autres
paginfo, jpcinfo
Les noms de fichiers rencontrés sur Internet se composent du nom proprement dit et d'une extension, séparés par un point. L'extension est en général caractéristique du type de fichier.Rien de bien original.
Les gros ordinateurs, serveurs ou autres, rencontrés sur la toile tournent la plupart sous UNIX ou LINUX ou encore WINDOWS NT, c'est-à-dire des systèmes d'exploitation 32 bits. Rien n'empêche bien sûr un particulier de relier son ordinateur personnel sous WINDOWS 95 au réseau mondial - ce n'est qu'une question de matériel adéquat - et de finances.
Pour ces machines, les noms de fichiers longs ne sont pas vraiment un problème. On pourra donc rencontrer des fichiers dont le nom lui-même comporte plus de 8 signes et l'extension plus de 3 signes.
Toutefois les espaces à l'intérieur du nom que WIN 95 tolère allègrement ne sont pas acceptés en règle générale. De même il n'est pas recommandé d'utiliser des caractères dits nationaux - les é, â, ü, ß ou autres - que WIN 95 digère parfaitement, ni les points qui peuvent entrer dans un nom de fichier long du même WIN95.
Un Allemand remplacera par exemple les voyelles infléchies par leur équivalent < voyelle+e > et la lettre ß par ss - en toute conformité d'ailleurs avec les règles de l'orthographe allemande:
non pas lübeck.htm mais luebeck.htm
non pas märchen.htm
mais maerchen.htm
non pas köln.htm
mais koeln.htm
non pas maß.htm
mais mass.htm
On rencontre en revanche le trait d'union < - >, le souligné < _.> et les parenthèses ( ):
page-1.htm
page_1.htm
logo(1).htm
L'extension des noms de fichiers de pages HTML était à l'origine justement HTML. Prenant en compte les ordinateurs PC tournant sous un système d'exploitation 16 bits (MS-DOS notamment) qui n'acceptent que 8 et 3 lettres au maximum, il a été convenu que les navigateurs reconnaîtraient aussi les pages HTML par leur extension HTM.
index.htm
index.html
D'autres extensions peuvent se rencontrer:
index.shtml
default.asp
passe.cgi
werbung.php3
fontmapper.pl
index.wml
Lorsqu'un internaute saisit dans le champ de l'adresse de son navigateur une URL sans préciser de nom de fichier, par exemple
http://www.web.de/
le serveur hébergeant le site auquel on tente ainsi d'accéder cherche par configuration avec un ordre de priorité donné l'existence d'un ou de plusieurs fichiers , par exemple:
index.shtml
index.html
index.htm
default.html
welcome.html
ou tout autre nom. S'il ne trouve aucun des noms pour lequel ou lesquels il a été configuré, il enverra simplement au navigateur le contenu [directory, list] du répertoire, par exemple:

(à moins qu'il n'indique tout simplement que l'accès est refusé).
Un double-clic sur un des fichiers image ou HTM de la liste suffira pour l'ouvrir dans son navigateur. Pour empêcher un regard trop indiscret sur le contenu de ses répertoires, on a donc tout avantage à y placer un fichier portant un nom reconnu par le serveur, soit couramment index.htm ou index.html.
La page d'index est donc en général celle qui s'ouvre dans le navigateur en l'absence de toute autre précision de nom, fait fonction de page d'accueil [homepage] et sert souvent à guider le visiteur en affichant le contenu (index) du site.
Pour mettre à jour son site ("publier" ses
pages nouvelles ou mises à jour), le webmestre utilise un programme "client"
spécialisé dans le téléchargement de fichiers (FTP
= File Transfer Protocol).
S'il est sous DOS (et éventuellement WINDOWS
3.xx), les noms de fichier de plus de 8 signes et les extensions de plus de
3 signes lui sont interdits.
S'il est sous WINDOWS 95 ou 98 et si son client
FTP est un programme en 16 bits, il en va de même. Le nom du fichier sera
en effet raccourci et muni d'une tilde dans le genre
averti~1.htm pour
avertissement.htm
index1~.sht
pour index.shtml
Au mieux, le fichier sera téléchargé sous le nom raccourci et conservé comme tel, c'est-à-dire qu'il sera plus ou moins introuvable; au pire, le serveur ne l'acceptera même pas sous cette forme.
Or, les logiciels de téléchargement ne sont pas tous gratuits, cela se comprend. Un des plus connus est WS_FTP. Il existe ne version PRO en 32 bits, mais payante et limitée à l'essai à 30 jours. Sa variante LITE est gratuite, mais si elle est en 16 bits elle n'accepte donc pas les fichiers à nom long tels quels. L'intérêt d'une version 16 bits est qu'elle tient facilement sur une disquette, qu'il n'y a pas de fichiers .dll installés dans le SYSTEME de WINDOWS et qu'elle est donc parfaitement portable d'un ordinateur à l'autre.
Par ailleurs, il faut faire très attention à la manière dont sont écrits les noms de fichiers, car pour UNIX, au contraire de DOS ou WINDOWS y compris NT, une majuscule n'est pas équivalente à une minuscule, et l'on ne retrouvera pas un fichier image1.gif s'il est stocké sur le serveur sous l'appellation IMAGE1.GIF: elle ne sera pas affichée dans la page.
Or WINDOWS a la fâcheuse habitude d'affubler les noms de fichiers "sauvegardés sous..." voire copiés-collés d'une initiale majuscule même quand on a saisi une minuscule dans la fenêtre de dialogue.
Ce n'est pas forcément très grave si, utilisant un éditeur de pages WYSIWYG tel que NamoWeb, on insère une image par un clic sur le nom du fichier. Celà peut l'être si l'on saisit tout à la main. Un problème permanent pour ceux qui ne programment qu'en code.
Index Informatique | Eléments de programmation en HTML
9.1.2001