Bonjour, > > Compter les caractères a un sens, en UTF-32 c'est immédiat, > > c'est la taille du fichier x 4, en utf-8 ça l'est beaucoup moins. > en fait s'est / 4 !
Oui, bien vu. > > Avancer/reculer de 100000 caractères peut très bien avoir un > > sens dans l'exploration et l'exploitation de longs textes > > (encyclopédies, compilations etc.). > Ah oui est lequel ? Un adressage absolu qui mentionne à quel endroit le lecteur est dans l'ensemble des documents, comme pour une vidéo. > > Pour les logs, tout dépend du format de log. Par exemple il est tout > > à fait possible de décider qu'une ligne de log fait toujours > > 80 caractères (qu'elle peut éventuellement se prolonger sur > > la ligne suivante si le 80 ième caractère est un \, amis > > du fortran bonsoir). Dans ce cas utf-8 produit un fichier > > binaire bordélique à souhait alors que utf-32 est un beau carré > > très facile à manier. > Désolé mais je n'ai jamais vu ce genre de fichiers, surtout le fait de > compléter les lignes avec des espaces pour faire en sorte quelle > façent 80 caractères ! Tu es trop jeune et tu manques d'imagination. > > Sur des entrées-sorties en 32 bits (ou plus) avec des bus en 32 bits > > (ou plus) et des processeurs travaillant aussi en 32 bits ou plus, > > il n'est pas du tout évident que ce soit plus rapide, sauf si > > c'est codé par des américains (je blague). > Dans ce cas ce n'est pas les bus au autre que ralentirent c'est le > disque dur donc plus le fichier est petit plus c'est rapide ! Il n'y a pas que des disques durs dans la vie des fichiers. -- Au revoir, 02 99 64 31 77 Gilles Lamiral. France, Chavagne (35310) 06 20 79 76 06 _______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr