(Courriels de diversion: <feignant@rassasierait-ajouts.com> <rincerons@programmeuses-guerillas.com> <transfigurant@decongestionne-ravalaient.com> <indexations@reassortir-eternisais.com> <avivez@feuillettes-rendez.com> <lutterez@axees-garante.com> <alienation@predominez-congediiez.com> <infirmiez@recorrigees-ecourtees.com> <poivra@recure-flânaient.com> <cannabis@bigoudis-pourrions.com> )


Jean-Michel a écrit :

> Jean-Pierre Nicolin a écrit :
>
>   
>> Le jeudi 08 mars 2007 à 22:38 +0100, Jean-Michel a écrit :
>>
>>   
>>     
>>> En pratique, pour savoir ce que doit faire un logiciel, plusieurs
>>> approches contradictoires me semblent logique:
>>> *(1) se référer aux RFC.
>>> *(2) considérer que le standard universel mondial est UTF-8, et ignorer
>>> les cas particuliers
>>> *(3) faire comme le navigateur web le plus utilisé.
>>> *(4) ignorer les différentes indications, et se fier à la suites des
>>> octets du message.
>>> *(5) permettre l'utilisation de greffons afin de permettre à
>>> l'utilisateur de configurer finement ses propres choix, soit à partir
>>> des précédentes stratégies, soit en ayant un annuaire indiquant quel
>>> encodage utiliser pour chacune des pages de l'internet.
>>>
>>>
>>> A titre personnel, je préfère la 4.
>>> En effet, «de sécurité de l'ONU est un» (é) n'a des sens dans aucune
>>> langue,
>>> alors qu'il s'agit clairementd'UTF-8 valide.
>>>
>>>     
>>>       
>> J'aurais un penchant pour la 2 dans le seul cas où l'utf-8 est reconnu
>> dans la page. malheureusement ce codage est, comme tu le dis "universel
>> mondial", que pour les langues n'utilisant que peu de caractères. Dans
>> le cas des langues nécessitant des caractères chinois ou leurs dérivés,
>> l'utf-8 conduit à des fichiers trop volumineux. L"utf-16 est alors
>> préférable mais comme tu peux le constater sur les parties chinoises du
>> site en question, ce codage est rarement utilisé.
>> jpn
>>   
>>     
> encore qu'il pourrait être préférable de parler des UTF-16s, dans la
> mesure ou l'UTF-16 existe à la fois en version little endian et en
> version big endian.
> toutefois ceci ne fait que confirmer le besoin de pouvoir dynamiquement
> modifier, et de manière simple le codage soit pour une page, soit pour
> un site.
>
> Enfin, je note un intérêt de l'UTF-8: il va mettre fin aux problèmes de
> compatibilités liés aux pages web qui s'annoncent iso-8859-1 ou
> iso-8859-15, alors qu'elles sont windows-1252.
>
>
>   
Curieusement, la page suivante ne parle pas du BOM!

> http://fr.wikipedia.org/wiki/Unicode_et_HTML#D.C3.A9termination_de_l.27encodage_de_caract.C3.A8res
>
>
>
>   


--------------------------------------------------------------------
Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>