(Courriels de diversion: <feignant@rassasierait-ajouts.com> <rincerons@programmeuses-guerillas.com> <transfigurant@decongestionne-ravalaient.com> <indexations@reassortir-eternisais.com> <avivez@feuillettes-rendez.com> <lutterez@axees-garante.com> <alienation@predominez-congediiez.com> <infirmiez@recorrigees-ecourtees.com> <poivra@recure-flânaient.com> <cannabis@bigoudis-pourrions.com> )
Jean-Michel a écrit : > Jean-Pierre Nicolin a écrit : > > >> Le jeudi 08 mars 2007 à 22:38 +0100, Jean-Michel a écrit : >> >> >> >>> En pratique, pour savoir ce que doit faire un logiciel, plusieurs >>> approches contradictoires me semblent logique: >>> *(1) se référer aux RFC. >>> *(2) considérer que le standard universel mondial est UTF-8, et ignorer >>> les cas particuliers >>> *(3) faire comme le navigateur web le plus utilisé. >>> *(4) ignorer les différentes indications, et se fier à la suites des >>> octets du message. >>> *(5) permettre l'utilisation de greffons afin de permettre à >>> l'utilisateur de configurer finement ses propres choix, soit à partir >>> des précédentes stratégies, soit en ayant un annuaire indiquant quel >>> encodage utiliser pour chacune des pages de l'internet. >>> >>> >>> A titre personnel, je préfère la 4. >>> En effet, «de sécurité de l'ONU est un» (é) n'a des sens dans aucune >>> langue, >>> alors qu'il s'agit clairementd'UTF-8 valide. >>> >>> >>> >> J'aurais un penchant pour la 2 dans le seul cas où l'utf-8 est reconnu >> dans la page. malheureusement ce codage est, comme tu le dis "universel >> mondial", que pour les langues n'utilisant que peu de caractères. Dans >> le cas des langues nécessitant des caractères chinois ou leurs dérivés, >> l'utf-8 conduit à des fichiers trop volumineux. L"utf-16 est alors >> préférable mais comme tu peux le constater sur les parties chinoises du >> site en question, ce codage est rarement utilisé. >> jpn >> >> > encore qu'il pourrait être préférable de parler des UTF-16s, dans la > mesure ou l'UTF-16 existe à la fois en version little endian et en > version big endian. > toutefois ceci ne fait que confirmer le besoin de pouvoir dynamiquement > modifier, et de manière simple le codage soit pour une page, soit pour > un site. > > Enfin, je note un intérêt de l'UTF-8: il va mettre fin aux problèmes de > compatibilités liés aux pages web qui s'annoncent iso-8859-1 ou > iso-8859-15, alors qu'elles sont windows-1252. > > > Curieusement, la page suivante ne parle pas du BOM! > http://fr.wikipedia.org/wiki/Unicode_et_HTML#D.C3.A9termination_de_l.27encodage_de_caract.C3.A8res > > > > -------------------------------------------------------------------- Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>