(Courriels de diversion: <parachuterons@synchronique-irlandais.com> <commencera@decrochees-suggerees.com> <ajournes@espionnent-tyrannisais.com> <craques@discuterons-gemination.com> <centuplant@freina-expectatives.com> <dynamisais@conquête-suspension.com> <questionneront@incriminiez-entraida.com> <radiant@anemone-falaise.com> <generaliserons@surdites-eludent.com> <expanses@surestimerent-artificieuse.com> )


Phil's Free a écrit :
| Cela dit, il me semble que l'UTF8 soit mal digéré dans les messages
| lus par Evolution et comme les dernières Mandrake et RedHat poussent
| dans ce sens ... pb !

En effet, l'UTF-8 est encore « mal digéré » par de nombreux programmes
car cet encodage casse la logique selon laquelle un octet encode un
caractère. L'encodage d'un caractère en UTF-8 réclame de 1 à 6 octets
selon le caractère (encodage multi-octet à taille variable). Par
exemple, en ISO-8859-15, autrement dit, en Latin-9 (ainsi que dans la
quasi-totalité des encodages courants quelque soit la plate-forme
considérée), le mot « été » se code sur 3 caractères. En UTF-8, ce mot
se code sur 5 caractères (1 caractère pour le « t » et 2 pour le « é »).

Démonstration dans mon terminal qui ne supporte pas l'UTF-8 :

=====
$ echo "été" | recode l9..u8
été
=====

L'UTF-8 casse aussi d'autres réflexes. Par exemple, un chiffre peut
être un autre caractère que les classiques 0 (0x30) à 9 (0x39) de
l'US-ASCII repris par tous les jeux de caractères, y compris l'UTF-8.

L'encodage UTF-8 introduit aussi des caractères qui résultent de
l'assemblage d'autres caractères (assemblage qui peut prendre toutes
les formes, comme un lego).

Bref, il faut revoir toutes les macros et fonctions de base du C dont
l'objet est la manipulation du texte comme par exemple strlen(),
isdigit(), etc.

Au dessus, il faut ensuite modifier les routines d'affichage en mode
texte et graphique.

La glibc à d'ores et déjà été modifiée pour encaisser l'UTF-8 sans se
gauffrer. Des projets comme Gnome ont introduit « pango » pour gérer
ces aspects de manière centralisée. La glib de GTK offre des fonctions
spéciales pour compter le nombre de caractères (et non le nombre
d'octets) d'une chaîne UTF-8.

Beaucoup de travail reste à faire et la plupart des applications sont
concernées. C'est une tâche colossale et c'est pour cela que la
migration est lente.

Mais cette migration est inévitable et souhaitable (comme celle vers
l'IPV6) car les jeux de caractères limités qui sont les plus courants
à l'heure actuelle frustrent de nombreuses personnes et leur gestion
est une véritable plaie !

Les seules personnes sérieusement emmerdées par l'UTF-8 sont les
développeurs car leur tâche se complique mais, après tout, ils sont
payés pour cela et pour offrir aux utilisateurs les outils les plus
conviviaux et les plus « naturels » possibles. Par exemple, lorsque je
voyage à l'étranger et que je souhaite envoyer un mail à quelqu'un en
France, je suis le plus souvent obligé de faire une croix sur les
caractères accentués. Je trouve cette limitation des plus agaçantes !

| Enfin, pour positionner la langue, gdm propose un menu. J'ai choisi
| la langue systeme (locale par défaut fr_FR@euro).| 
| Bon. Il ne me reste plus que quelques dizaines de paquetages à
| reconfigurer pour parfaire ma migration de Woody vers Sarge :-)
| (Des détails : Kde, ...)

Je ne sais pas comment cela se passe avec GDM mais je sais que KDM ne
lit pas le fichier ~/.bash_profile. Dès lors, en mode graphique, les
locales fixées par l'utilisateur sont ignorées par toutes les
applications non KDE (notamment Emacs, Mozilla, etc.). Pour remédier
à ce problème, il faut modifier le fichier /etc/X11/Xsession et
ajouter « --login » à la première ligne su script (#!/bin/sh).

Ce faisant, tu n'auras pas besoin de configurer tes logicels un à un
car la plupart prennent en compte les locales. Enfin, cela ne fait pas
de mal de fixer la langue à l'identique dans le panneau de contrôle de
KDE.

A++, Sébastien 

-- 
Sébastien Dinot, sdinot@april.orgSecrétaire de l'APRIL (http://www.april.org)
Association pour la Promotion et la Recherche en Informatique Libre

--------------------------------------------------------------------
Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>