PHWinfo banniere

Titres
PORTAIL ANNUAIRE ARTICLES COMPARATEUR HÉBERGEURS DEVIS FORUMS RÉDUCTEUR D'URL
Précédent   PHWinfo > Autres forums > Forum Programmation & Conception > fr.comp.info.auteurs > [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8
S'inscrire FAQ Membres Recherche Messages du jour Marquer les forums comme lus
[decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Réponse
 
LinkBack Outils de la discussion
Vieux 24/03/2008, 21h41   #1
Lea GRIS
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Bonjour,

Je vous fais part de l'existence d'un petit outil pratique libre et
inédit pour intégrer les codes de césure UTF-8 aux documents XHTML.

xhtml_hyphenate est un programme de césure pour les documents XHTML.

À découvrir ici en anglais :
<http://swolter.sdf1.org/software/article-xhtml_hyphenate.html>

xhtml_hyphenate: An hyphenation program for XHTML documents

As an exÂamÂple for reÂal-world usÂage of libÂhyÂphenÂate, I proudÂly
present you the XHTML hyÂphenÂator. By scruÂtiÂnizÂing the xml:lang tag
present in XML docÂuÂments, it hyÂphenÂates all non-headÂer text nodes
of an XHTML docÂuÂment with stanÂdard UTF-8 soft hyÂphens, which are
used by all stanÂdard browsers exÂcept MozilÂla FireÂfox as
hyÂphenÂation hints. FireÂfox igÂnores them comÂpleteÂly, so no harm is
done.

--
Léa Gris
  Réponse avec citation
Vieux 24/03/2008, 22h06   #2
Olivier Miakinen
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Le 24/03/2008 21:41, Lea GRIS a écrit :
>
> Je vous fais part de l'existence d'un petit outil pratique libre et
> inédit pour intégrer les codes de césure UTF-8 aux documents XHTML.
>
> xhtml_hyphenate est un programme de césure pour les documents XHTML.
>
> À découvrir ici en anglais :
> <http://swolter.sdf1.org/software/article-xhtml_hyphenate.html>
>
> xhtml_hyphenate: An hyphenation program for XHTML documents
>
> As an example for real-world usage of libhyphenate, I proudly
> present you the XHTML hyphenator. [...]


Ainsi que le laisse supposer cette dernière phrase il faut conjointement
récupérer libhyphenate, car c'est cette bibliothèque qui fait tout le
boulot : <http://swolter.sdf1.org/software/libhyphenate.html>.

Si j'en crois la présence de fichiers en, es, fr, de et de-DE-1901, il
y a déjà tout ce qu'il faut pour l'anglais, l'espagnol, le français, et
deux versions de l'allemand (avant et après 1901 ?).
  Réponse avec citation
Vieux 24/03/2008, 23h12   #3
Lea GRIS
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Olivier Miakinen a écrit :

> Ainsi que le laisse supposer cette dernière phrase il faut conjointement
> récupérer libhyphenate, car c'est cette bibliothèque qui fait tout le
> boulot : <http://swolter.sdf1.org/software/libhyphenate.html>.


Tout à fait

Je viens de compiler la bibliothèque et le programme dans Ubuntu Gutsy
(ne pas oublier de faire un (sudo ldconfig pour répertorier la nouvelle
bibliothèque). Tout semble bien fonctionner avec un document mélangé
français/anglais, bien que je ne sois pas allée vérifier l'exactitude du
placement des césures selon les différentes langues.

En bonus, ce que ne précise pas l'auteur, les césures UTF-8 sont bien
prises en compte par Firefox3 (testé avec la nightly 3.0b5pre Minefield).

> Si j'en crois la présence de fichiers en, es, fr, de et de-DE-1901, il
> y a déjà tout ce qu'il faut pour l'anglais, l'espagnol, le français, et
> deux versions de l'allemand (avant et après 1901 ?).


Au sujet de l'allemand, je ne saurais te répondre.


--
Léa Gris

  Réponse avec citation
Vieux 24/03/2008, 23h21   #4
Olivier Miakinen
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Le 24/03/2008 23:12, Lea GRIS a écrit :
>
>> Si j'en crois la présence de fichiers en, es, fr, de et de-DE-1901, il
>> y a déjà tout ce qu'il faut pour l'anglais, l'espagnol, le français, et
>> deux versions de l'allemand (avant et après 1901 ?).

>
> Au sujet de l'allemand, je ne saurais te répondre.


Il y a bien eu une modification des règles de césure en allemand, mais
c'était en 1996. Du coup je suis moins étonné qu'il propose les deux
fichiers car c'est vraiment très récent (devenu obligatoire en 2005).

http://fr.wikipedia.org/wiki/R%C3%A9...96#C.C3.A9sure
  Réponse avec citation
Vieux 25/03/2008, 10h53   #5
Mickaël Wolff
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Lea GRIS a écrit :
> which are
> used by all stanÂdard browsers exÂcept MozilÂla FireÂfox as
> hyÂphenÂation hints. FireÂfox igÂnores them comÂpleteÂly, so no harm is
> done.
>


Aux dernières nouvelles, Mozilla Firefox 3 n'est pas concerné par le
problème.

Cependant, je doute de la pertinence de l'usage d'un tel outil pour
les documents XHTML. Le XHTML n'est pas un média graphique, et selon le
type de caractères, la configuration de l'écran, la disponibilité de la
police de caractère, etc la césure ne sera certainement pas à la bonne
place.
Pour moi c'est le boulot du navigateur web graphique. Insérer les
césures dans le HTML est du même acabit que l'usage des tableaux pour la
mise en page.

Bref, au pire, on peut imaginer que ce genre de manipulations est Ã
reléguer aux CSS en conjugaison des attributs xml:lang et xhtml:lang.
Mais c'est plus facile à dire qu'à faire, visiblement
<http://www.w3.org/TR/css3-text/#hyphenate>.

--
Mickaël Wolff aka Lupus Michaelis
http://lupusmic.org
  Réponse avec citation
Vieux 25/03/2008, 23h48   #6
Olivier Miakinen
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Le 25/03/2008 10:53, Mickaël Wolff a écrit :
> Lea GRIS a écrit :
>> which are
>> used by all standard browsers except Mozilla Firefox as
>> hyphenation hints. Firefox ignores them completely, so no harm is
>> done.

>
> Aux dernières nouvelles, Mozilla Firefox 3 n'est pas concerné par le
> problème.


C'est déjà ce qu'écrivait Léa dans son article de 23 h 12 (heure française).

> Cependant, je doute de la pertinence de l'usage d'un tel outil pour
> les documents XHTML. Le XHTML n'est pas un média graphique, et selon le
> type de caractères, la configuration de l'écran, la disponibilité de la
> police de caractère, etc la césure ne sera certainement pas à la bonne
> place.


Je ne comprends pas ta remarque, ou alors c'est toi qui n'a pas compris
la même chose que moi. Ce que j'ai compris de ce « césureur XHTML »,
c'est qu'il insère à chaque endroit possible un caractère U+00AD, qui
est une autorisation (du moins dans quelques langues telles que le
français et l'anglais) d'afficher un trait d'union suivi d'un saut de
ligne (ou bien rien).

Par exemple, dans la phrase « la césure ne sera certainement pas à la
bonne place », il écrira (en notant § le caractère &shy « la cé§su§re
ne se§ra cer§tai§ne§ment pas à la bon§ne pla§ce », ce que le navigateur,
parmi de multiples autres possibilités, pourra rendre :
--------------------------------------------------------------------
la césure ne sera certainement pas à la bonne place
--------------------------------------------------------------------
la césure ne sera certainement pas à la bonne pla-
ce
--------------------------------------------------------------------
la césure ne sera certainement pas à la bonne
place
--------------------------------------------------------------------
la césure ne sera certainement pas à la bon-
ne place
--------------------------------------------------------------------
la césure ne sera certainement pas à la
bonne place
--------------------------------------------------------------------
....
--------------------------------------------------------------------
la césure ne sera certaine-
ment pas à la bonne place
--------------------------------------------------------------------
la césure ne sera certai-
nement pas à la bonne pla-
ce
--------------------------------------------------------------------
la césure ne sera cer-
tainement pas à la bonne
place
--------------------------------------------------------------------
la césure ne sera cer-
tainement pas à la bon-
ne place
--------------------------------------------------------------------
etc.

> Pour moi c'est le boulot du navigateur web graphique.


C'est donc au navigateur du visiteur de connaître toutes les langues des
sites webs visités. Pourquoi pas, en effet, mais c'est un autre choix.

> [...]
>
> Bref, au pire, on peut imaginer que ce genre de manipulations est à
> reléguer aux CSS en conjugaison des attributs xml:lang et xhtml:lang.
> Mais c'est plus facile à dire qu'à faire, visiblement
> <http://www.w3.org/TR/css3-text/#hyphenate>.


Noter que l'insertion de caractères U+00AD est très loin de résoudre
tous les problèmes : <http://www.cs.tut.fi/~jkorpela/shy.html>.
  Réponse avec citation
Vieux 26/03/2008, 09h37   #7
Mickaël Wolff
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: [decouverte] Programme pour ajouter les codes de césure aux documents XHTML en UTF-8

Olivier Miakinen a écrit :

> C'est déjà ce qu'écrivait Léa dans son article de 23 h 12 (heure française).


Rha... où ais-je donc rangé mes orties fraîches ?

> Je ne comprends pas ta remarque, ou alors c'est toi qui n'a pas compris
> la même chose que moi.


Effectivement, nous n'avions pas compris la même chose. J'avais
compris que le programme agisait comme un coupeur de ligne, mais qu'à la
place d'insérer un retour charriot, il insérait un soft hyphen.

Merci de ton éclairante explication.

>> Pour moi c'est le boulot du navigateur web graphique.

>
> C'est donc au navigateur du visiteur de connaître toutes les langues des
> sites webs visités. Pourquoi pas, en effet, mais c'est un autre choix.


Certes, et je penses que ce serait un plus intéressant. Enfin
l'attribut lang servirait à quelque chose.

--
Mickaël Wolff aka Lupus Michaelis
http://lupusmic.org
  Réponse avec citation
Réponse


Outils de la discussion

Règles de messages
Vous ne pouvez pas créer de nouvelles discussions
Vous ne pouvez pas envoyer des réponses
Vous ne pouvez pas envoyer des pièces jointes
Vous ne pouvez pas modifier vos messages

Les balises BB sont activées : oui
Les smileys sont activés : oui
La balise [IMG] est activée : oui
Le code HTML peut être employé : non
Trackbacks are oui
Pingbacks are oui
Refbacks are oui


Fuseau horaire GMT +1. Il est actuellement 06h32.


Édité par : vBulletin® version 3.7.2
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.2.0 RC5 Tous droits réservés.
Version française #16 par l'association vBulletin francophone
PHWinfo est un site Éducation Sans Frontières
Ad Management by RedTyger
©Tous droits réservés par les parties respectives
Page generated in 0,13545 seconds with 15 queries