Hola colegas,

Como hace poco acaba de salir la versión 3.6 de wordpress, quisiera
descargar la documentación completa, es decir, el sitio codex.wordpress.org

Como httrack me da problemas, he intentado con este comando:

wget -e robots=off --glob=on --limit-rate=24k --recursive --level=inf --no-
clobber --ignore-length --page-requisites --reject='*index.php\?title=*,
*index.php@title=*' --restrict-file-names=windows --adjust-extension --
convert-links --background 'http://codex.wordpress.org'

Lo que se dice funcionar, funciona. Pero hay dos problemas: el primero es
que se me descargan montones de archivos del tipo:

index.php?title=*

El segundo problema es que se descarga la documentación para todos los
idiomas. Intenté (infructuosamente) excluir lo que no fuera inglés usando
con los parámetros --exclude-directories y --reject esta cadena:

'al%3A*,ar%3A*,azr%3A*,bg%3A*,bn%3A*,br%3A*,bs%3A*,ca%3A*,cs%3A*,da%3A*,de%
3A*,el%3A*,fi%3A*,fr%3A*,he%3A*,hr%3A*,id%3A*,it%3A*,ka%3A*,km%3A*,mk%
3A*,nl%3A*,pl%3A*,pt%3A*,pt-br%3A*,ru%3A*,sk%3A*,sl%3A*,th%3A*,tr%3A*,uk%
3A*,vi%3A*,zh-cn%3A*,zh-tw%3A*,*%80*,*%81*,*%82*,*%83*,*%84*,*%85*,*%86*,*%
87*,*%88*,*%89*,*%8A*,*%8B*,*%8C*,*%8D*,*%8E*,*%8F*,*%90*,*%91*,*%92*,*%93
*,*%94*,*%95*,*%96*,*%97*,*%98*,*%99*,*%9A*,*%9B*,*%9C*,*%9D*,*%9E*,*%9F*,
*%A0*,*%A1*,*%A2*,*%A3*,*%A4*,*%A5*,*%A6*,*%A7*,*%A8*,*%A9*,*%AA*,*%AB*,*%
AC*,*%AD*,*%AE*,*%AF*,*%B0*,*%B1*,*%B2*,*%B3*,*%B4*,*%B5*,*%B6*,*%B7*,*%B8
*,*%B9*,*%BA*,*%BB*,*%BC*,*%BD*,*%BE*,*%BF*,*%C0*,*%C1*,*%C2*,*%C3*,*%C4*,
*%C5*,*%C6*,*%C7*,*%C8*,*%C9*,*%CA*,*%CB*,*%CC*,*%CD*,*%CE*,*%CF*,*%D0*,*%
D1*,*%D2*,*%D3*,*%D4*,*%D5*,*%D6*,*%D7*,*%D8*,*%D9*,*%DA*,*%DB*,*%DC*,*%
DD*,*%DE*,*%DF*,*%E0*,*%E1*,*%E2*,*%E3*,*%E4*,*%E5*,*%E6*,*%E7*,*%E8*,*%E9
*,*%EA*,*%EB*,*%EC*,*%ED*,*%EE*,*%EF*,*%F0*,*%F1*,*%F2*,*%F3*,*%F4*,*%F5*,
*%F6*,*%F7*,*%F8*,*%F9*,*%FA*,*%FB*,*%FC*,*%FD*,*%FE*,*%FF*,*á*,*é*,*í*,
*ó*,*ú*,*ý*,*ç*,*à*,*è*,*ì*,*ò*,*ù*,*ä*,*ë*,*ï*,*ö*,*ü*,*ÿ*,*ñ*,*â*,*ê*,
*î*,*ô*,*û*'

Alguien pudiera sugerirme una manera más eficiente de lograrlo?


-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Responder a