On 02/19/2010 10:55 AM, ivan marchesini wrote:
> quello che mi manca è proprio capire come posso prnedere il dato
> (urllib.urlopen??) e poi "sezionarlo" per ottenere una matrice da
> esportare in csv..
>
Con ulropen tiri fuori l'HTML
poi lo passi a lxml.html.fromstring
cerchi l'elemento TAB
Marco Beri wrote:
> A questo punto io userei Beatiful Soup per tirare fuori la tabella
> dalla stringa html
Io no. Anche di recente abbiamo (hanno) avuto problemi in ditta con
Beautiful Soup, e siamo passati a usare lxml.html . Anche il parser di
html5lib non è male.
Inoltre Beautiful Soup è prat
2010/2/19 Marco Beri
A questo punto io userei Beatiful Soup per tirare fuori la tabella dalla
> stringa html
>
"Beautiful Soup"
Sorry.
--
http://python.thinkcode.tv - Videocorso di Python
http://stacktrace.it - Aperiodico di resistenza informatica
http://beri.it - Blog di una testina di vitel
2010/2/19 ivan marchesini
> Ciao a tutti...
> sono piuttosto nuovo a python urllib, minidom ecc..
>
> credo di aver capito che gli strumenti di cui sopra mi possano servire
> per trasformare automaticamente in csv le tabelle che trovo qui:
>
> http://www.cfcalabria.it/index.php?option=com_wrapper
Ciao a tutti...
sono piuttosto nuovo a python urllib, minidom ecc..
credo di aver capito che gli strumenti di cui sopra mi possano servire
per trasformare automaticamente in csv le tabelle che trovo qui:
http://www.cfcalabria.it/index.php?option=com_wrapper&view=wrapper&Itemid=41
seguendo i vari l