On Wed, Sep 29, 2010 at 04:54:44PM +0200, Marco Beri wrote: > 2010/9/29 Marco Giusti <marco.giu...@gmail.com> > > > On Wed, Sep 29, 2010 at 03:56:07PM +0200, Nicola Larosa wrote: > > [...] > > > Le espressioni regolari non sono l'ideale per grammatiche dipendenti dal > > > contesto come l'HTML: per esempio è difficile estrarre dati in presenza > > > di tag annidati. > > > > Immagino che già conosci questa risposta su stackoverflow[1] ma gli > > altri che hanno proposto di usare le espressioni regolari forse no. > > > > [1] http://tinyurl.com/ydb4j9j > > > FANTASTICA :-)) > > Grazie.
:) si, decisamente. > E dire che dovrei saperlo bene che non si devono usare le regex per parsare > l'HTML :-) > > http://stacktrace.it/2007/11/ce-sempre-leccezione-alla-regular/ si, conoscevo questo aspetto delle espressioni regolari: un paio di volte ero incappato nel blocco totale di kodos (editor di espressioni regolari) e indagando un po' ero anche arrivato all'articolo di Russ Cox. Illuminante anche se non ho approfondito più di tanto. E ora qui smentisco tutto (o in parte) quello che ho detto: avete mai letto i sorgenti di HTMLParser? Forse qui entro nell'OT, ma indagavo sulla possibilità, e sulle performance, di parsare l'html con le coroutine. Avete qualche link che approfondisca la questione (python o non python)? Iniziando un piccolo esperimento in realtà avevo visto fin da subito che le performance erano nettamente peggiori di quelle di HTMLParser e quindi ho abbandonato, ma la curiosità si sa'... ciao m. -- Lo punite del fatto che la sua infanzia ha strisciato sul suolo senza stelo e senza tutore; gli imputate come un misfatto l'isolamento in cui lo avete lasciato; della sua sventura fate il suo delitto! Nessuno gli ha insegnato a sapere ciò che faceva: quest'uomo ignora. La sua colpa appartiene al suo destino, non a lui. Voi colpite un innocente. -- Victor Hugo _______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python