(Courriels de diversion: <defibrer@terminez-peignes.com> <programmais@remplirons-rassasiez.com> <enregistrerait@entierete-dialectique.com> <coloniserons@soupconnee-rurale.com> <periclita@budgetisation-bloques.com> <inspiree@annexees-avilis.com> <depose@encrant-secretait.com> <ambree@reexaminant-regretteriez.com> <fusionniez@gauchi-ravisse.com> <crecelle@surestimeriez-repercuter.com> )


Dans le contexte de Emacspeak ou de l'interface speechd-el avec le
Speech Dispatcher, deux navigateurs web sont offerts: emacs-w3 et
w3m-el. Le premier est implanté en Emacs Lisp, et a été innovant dans
son temps (je crois qu'il était le premier à faire du CSS, par
exemple), mais il est assez lent sur des pages complexes, et surtout
il n'est pas très robuste; Emacs se bloque assez souvent lorsque je
l'utilise.

Je me penche donc vers l'utilisation de w3m-el, qui est une interface
Emacs vers le navigateur w3m. C'est un navigateur de type lynx qui est
implanté en C, et qui rend bien les tables et les frames (enfin bien
visuellement, pas en lisant les pages, d'où le problème).

Une piste serait de modifier w3m pour lui ajouter un nouveau mode où
il présenterait autrement les pages. Ca demanderai pas mal de travail.
L'alternative vers laquelle je m'oriente est d'implanter un proxy HTTP
qui réécrit les pages pour les rendre plus parleables.

Dans un premier temps j'ai implanté une fonction de réécriture pour la
linéarisation des tables HTML. Le principe est très simple: remplacer
les balises HTML <table> et <td> etc par des balises de début de
paragraphe. On obtient ainsi une linéarisation de type "Markup Order"
dans l'outil tablin du W3C. J'ai implanté cette fonction dans le proxy
filtrant Privoxy, qui est disponible dans Debian.

Vous pouvez tester ça en utilisant une instance qui j'ai installée
temporairement sur le serveur de l'association, sur le port 8117. Pour
tester avec Emacspeak ou parlemacs,

   http_proxy=http://www.culte.org:8117/ parlemacs &

et w3m devrait utiliser le proxy réécrivant et filtrant (ne pas
diffuser l'adresse du proxy SVP!). Vous pouvez voire ce que ça donne
sur le site de libé à

   http://www.culte.org:8080/~ecm/liberation-privoxy.html


Ca reste assez pénible à utiliser (regardez par exemple ce que ça fait
sur tuxfamily.org) dans la mesure où il faut se taper tous les
éléments de navigation avant d'atteindre le corps de la page. Je
réfléchis à une réécriture plus intelligente, qui chercherait à
identifier le corps du texte et qui le placerait au début de la page,
laissant les éléments de navigation/publicité vers la fin, mais c'est
assez compliqué comme problème. 
  
-- 
Eric Marsden                          <URL:http://www.laas.fr/~emarsden/>