(Courriels de diversion: <parachuterons@synchronique-irlandais.com> <commencera@decrochees-suggerees.com> <ajournes@espionnent-tyrannisais.com> <craques@discuterons-gemination.com> <centuplant@freina-expectatives.com> <dynamisais@conquête-suspension.com> <questionneront@incriminiez-entraida.com> <radiant@anemone-falaise.com> <generaliserons@surdites-eludent.com> <expanses@surestimerent-artificieuse.com> )
Phil's Free a écrit : | Cela dit, il me semble que l'UTF8 soit mal digéré dans les messages | lus par Evolution et comme les dernières Mandrake et RedHat poussent | dans ce sens ... pb ! En effet, l'UTF-8 est encore « mal digéré » par de nombreux programmes car cet encodage casse la logique selon laquelle un octet encode un caractère. L'encodage d'un caractère en UTF-8 réclame de 1 à 6 octets selon le caractère (encodage multi-octet à taille variable). Par exemple, en ISO-8859-15, autrement dit, en Latin-9 (ainsi que dans la quasi-totalité des encodages courants quelque soit la plate-forme considérée), le mot « été » se code sur 3 caractères. En UTF-8, ce mot se code sur 5 caractères (1 caractère pour le « t » et 2 pour le « é »). Démonstration dans mon terminal qui ne supporte pas l'UTF-8 : ===== $ echo "été" | recode l9..u8 été ===== L'UTF-8 casse aussi d'autres réflexes. Par exemple, un chiffre peut être un autre caractère que les classiques 0 (0x30) à 9 (0x39) de l'US-ASCII repris par tous les jeux de caractères, y compris l'UTF-8. L'encodage UTF-8 introduit aussi des caractères qui résultent de l'assemblage d'autres caractères (assemblage qui peut prendre toutes les formes, comme un lego). Bref, il faut revoir toutes les macros et fonctions de base du C dont l'objet est la manipulation du texte comme par exemple strlen(), isdigit(), etc. Au dessus, il faut ensuite modifier les routines d'affichage en mode texte et graphique. La glibc à d'ores et déjà été modifiée pour encaisser l'UTF-8 sans se gauffrer. Des projets comme Gnome ont introduit « pango » pour gérer ces aspects de manière centralisée. La glib de GTK offre des fonctions spéciales pour compter le nombre de caractères (et non le nombre d'octets) d'une chaîne UTF-8. Beaucoup de travail reste à faire et la plupart des applications sont concernées. C'est une tâche colossale et c'est pour cela que la migration est lente. Mais cette migration est inévitable et souhaitable (comme celle vers l'IPV6) car les jeux de caractères limités qui sont les plus courants à l'heure actuelle frustrent de nombreuses personnes et leur gestion est une véritable plaie ! Les seules personnes sérieusement emmerdées par l'UTF-8 sont les développeurs car leur tâche se complique mais, après tout, ils sont payés pour cela et pour offrir aux utilisateurs les outils les plus conviviaux et les plus « naturels » possibles. Par exemple, lorsque je voyage à l'étranger et que je souhaite envoyer un mail à quelqu'un en France, je suis le plus souvent obligé de faire une croix sur les caractères accentués. Je trouve cette limitation des plus agaçantes ! | Enfin, pour positionner la langue, gdm propose un menu. J'ai choisi | la langue systeme (locale par défaut fr_FR@euro).| | Bon. Il ne me reste plus que quelques dizaines de paquetages à | reconfigurer pour parfaire ma migration de Woody vers Sarge :-) | (Des détails : Kde, ...) Je ne sais pas comment cela se passe avec GDM mais je sais que KDM ne lit pas le fichier ~/.bash_profile. Dès lors, en mode graphique, les locales fixées par l'utilisateur sont ignorées par toutes les applications non KDE (notamment Emacs, Mozilla, etc.). Pour remédier à ce problème, il faut modifier le fichier /etc/X11/Xsession et ajouter « --login » à la première ligne su script (#!/bin/sh). Ce faisant, tu n'auras pas besoin de configurer tes logicels un à un car la plupart prennent en compte les locales. Enfin, cela ne fait pas de mal de fixer la langue à l'identique dans le panneau de contrôle de KDE. A++, Sébastien -- Sébastien Dinot, sdinot@april.orgSecrétaire de l'APRIL (http://www.april.org) Association pour la Promotion et la Recherche en Informatique Libre -------------------------------------------------------------------- Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>