Hello !

2009/5/7 Gilles LAMIRAL <gilles.lami...@laposte.net>:
> Bonjour,
>
>> > en meme temps, le jour ou t'as des fichiers texte de 250M, tu m'appelles ;)
>> Avoir des fichier de cette taille n'est pas si rare que ça, les
>> fichier de log peuvent facilement être de cette taille, par contre
>> l'operation qui consiste a trouver le 250 millième caractère n'a aucun
>> sens (du moins pas que je sache) !
>
> Compter les caractères a un sens, en  UTF-32 c'est immédiat,
> c'est la taille du fichier x 4, en utf-8 ça l'est beaucoup moins.
en fait s'est / 4 !

>
> Avancer/reculer de 100000 caractères peut très bien avoir un
> sens dans l'exploration et l'exploitation de longs textes
> (encyclopédies, compilations etc.).
Ah oui est lequel ?

>
> Pour les logs, tout dépend du format de log. Par exemple il est tout
> à fait possible de décider qu'une ligne de log fait toujours
> 80 caractères (qu'elle peut éventuellement se prolonger sur
> la ligne suivante si le 80 ième caractère est un \, amis
> du fortran bonsoir). Dans ce cas utf-8 produit un fichier
> binaire bordélique à souhait alors que utf-32 est un beau carré
> très facile à manier.
Désolé mais je n'ai jamais vu ce genre de fichiers, surtout le fait de
compléter les lignes avec des espaces pour faire en sorte quelle
façent 80 caractères !

>
>> par contre trouver la x-ième ligne a en sens et du coup l'utf-8 est
>> bien plus rapide !
>
> Sur des entrées-sorties en 32 bits (ou plus) avec des bus en 32 bits
> (ou plus) et des processeurs travaillant aussi en 32 bits ou plus,
> il n'est pas du tout évident que ce soit plus rapide, sauf si
> c'est codé par des américains (je blague).
Dans ce cas ce n'est pas les bus au autre que ralentirent c'est le
disque dur donc plus le fichier est petit plus c'est rapide !

CU
Stéph

>
> --
> Au revoir,                               02 99 64 31 77
> Gilles Lamiral. France, Chavagne (35310) 06 20 79 76 06
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>



-- 
Stéphane Brunner
mail : stephane.brun...@gmail.com
messageries instantanées : stephane.brun...@gmail.com (http://talk.google.com)
--
Un peu d'espace qui vous suis partout -
https://www.getdropbox.com/referrals/NTk2OTU2Mjk
--
http://mozilla-europe.org - Navigateur internet / Client de messagerie

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à