Discussion: quel chienlit l'utf8!
Afficher un message
Vieux 01/11/2006, 16h39   #8
Nicolas George
Aucun Avatar
 
Messages: n/a
Hébergeur:
Par défaut Re: quel chienlit l'utf8!

Emmanuel Florac wrote in message
<pan.2006.11.01.12.21.59.330750@imaginet.fr>:
> Un peu, si. Le gros problème c'est qu'un caractère fait selon les cas 1
> ou 2 octets. C'est très très chiant quand on développe et qu'on doit
> mnipuler des chaînes.


Outre le fait que, comme le signalent TiChou et Luc, tu te plantes sur
l'aspect technique, je voudrait souligner que si ça te gène comme ça, c'est
que quelque part tu t'y prends mal.

Pour les manipulations les plus élémentaires du texte, UTF-8 est très
pratique par sa compatibilité avec ASCII: beaucoup d'outils qui traitent du
texte n'ont tout simplement pas besoin d'être adaptés à UTF-8 parce que leur
traitement est assez simple pour que ça passe comme une lettre à la poste.

Pour les manipulations un peu plus complexes, la bonne manière de procéder
est de convertir le plus tôt possible en simples entiers, et de reconvertir
ces entiers le plus tard possible en suites d'octets. Si on travaille en
perl, c'est vraiment très facile, un simple binmode sur le filehandle fait
tout le boulot; avec d'autres langages, ce n'est jamais qu'une paire de
fonctions à écrire.

Pour les manipulations vraiment complexes, on se heurte au problème que
l'écriture des langues du monde, c'est difficile, et qu'entre les ligatures
et les réordonnancements de lettres qu'il y a dans certaines langues, sans
parler du bidi, qu'un caractère soit codé sur un ou 42octets, c'est de la
gnognotte.

> À mon avis, tu utilises un joyeux mélange d'iso-8859-15 et d'utf-8, et
> c'est ce qui déconne.


J'abonde dans ce sens.

> Un seul système utiliser tu dois.


On peut mitiger, mais il faut savoir ce qu'on fait.

Quoi qu'il en soit, mettre des caractères autres que a-zA-Z0-9_.- dans ses
noms de fichiers, c'est chercher les ennuis.
  Réponse avec citation
 
Page generated in 0,06457 seconds with 9 queries