Bonjour,

> > Compter les caractères a un sens, en  UTF-32 c'est immédiat,
> > c'est la taille du fichier x 4, en utf-8 ça l'est beaucoup moins.
> en fait s'est / 4 !

Oui, bien vu.

> > Avancer/reculer de 100000 caractères peut très bien avoir un
> > sens dans l'exploration et l'exploitation de longs textes
> > (encyclopédies, compilations etc.).
> Ah oui est lequel ?

Un adressage absolu qui mentionne à quel endroit
le lecteur est dans l'ensemble des documents, comme
pour une vidéo.

> > Pour les logs, tout dépend du format de log. Par exemple il est tout
> > à fait possible de décider qu'une ligne de log fait toujours
> > 80 caractères (qu'elle peut éventuellement se prolonger sur
> > la ligne suivante si le 80 ième caractère est un \, amis
> > du fortran bonsoir). Dans ce cas utf-8 produit un fichier
> > binaire bordélique à souhait alors que utf-32 est un beau carré
> > très facile à manier.

> Désolé mais je n'ai jamais vu ce genre de fichiers, surtout le fait de
> compléter les lignes avec des espaces pour faire en sorte quelle
> façent 80 caractères !

Tu es trop jeune et tu manques d'imagination.

> > Sur des entrées-sorties en 32 bits (ou plus) avec des bus en 32 bits
> > (ou plus) et des processeurs travaillant aussi en 32 bits ou plus,
> > il n'est pas du tout évident que ce soit plus rapide, sauf si
> > c'est codé par des américains (je blague).
> Dans ce cas ce n'est pas les bus au autre que ralentirent c'est le
> disque dur donc plus le fichier est petit plus c'est rapide !

Il n'y a pas que des disques durs dans la vie des fichiers.

-- 
Au revoir,                               02 99 64 31 77
Gilles Lamiral. France, Chavagne (35310) 06 20 79 76 06

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à