Re: [Gutl-l] Sobre frecuencia de letras en texto

Paradix ;) Sat, 04 May 2013 13:42:17 -0700

El 04/05/13 07:53, Hugo Florentino escribió:

Hola colegas,


Hace un momento leía sobre diseños alternativos de distribución de los
teclados en dependencia de la frecuencia de ocurrencia de letras, y quise
comprobar que las estadísiticas que encontré para el español fuesen
medianamente correctas, porque la muestra utilizada me pareció pequeña.

De modo que descargué el Quijote del proyecto Gutenberg (pg2000.txt) y
después de eliminar los metadatos irrelevantes al texto, ejecuté este
comando:

fold -w1 < pg2000.txt | tr '[:upper:]' '[:lower:]' | \
grep -vE '^(\s+)?$' | sort | uniq -c | sort -rn > quijote-freq.txt

Sucede que a pesar de utilizar el comando uniq, hay letras que se me
repiten. Alguien sabe por que puede ser esto?

Saludos, Hugo

a peligro de decir alguna tonteria ¿no sera que uniq opera sobre lineasy no sobre letras? ... al menos es lo que interpreté de man uniq


--
Paradix  ;)

Haciendo abogacía por el software libre adonde voy

--

Este mensaje le ha llegado mediante el servicio de correo electronico que 
ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema 
Nacional de Salud. La persona que envia este correo asume el compromiso de usar 
el servicio a tales fines y cumplir con las regulaciones establecidas

Infomed: http://www.sld.cu/


--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] Sobre frecuencia de letras en texto

Responder a