Re: [Python] Algoritmo in CSV

2010-09-07 Per discussione Matteo Mattsteel Vitturi
che un dict... non conosco i dettagli implementativi, ma (sempre > in teoria) un dict è un po' uno spreco per quel che ti serve. > > ciao > > Pietro > > > > > > Matteo. > > __ > &g

Re: [Python] Algoritmo in CSV

2010-09-06 Per discussione Paolo
> > From: vittorio.zucc...@gmail.com > > Date: Thu, 2 Sep 2010 14:41:10 +0200 > > To: python@lists.python.it > > Subject: [Python] Algoritmo in CSV > > Buongiorno, > > chiedo consiglio su un algoritmo da usare che sia veloce. > > Anche solo in meta-codi

Re: [Python] Algoritmo in CSV

2010-09-06 Per discussione Pietro Battiston
osco i dettagli implementativi, ma (sempre in teoria) un dict è un po' uno spreco per quel che ti serve. ciao Pietro > > Matteo. > > > > __________________ > From: vittorio.zucc...@gmail.com > Date: Thu, 2 Sep 2010 14:41:10 +0200 > To: python@lists.python.it > Subject: [Pyth

Re: [Python] Algoritmo in CSV

2010-09-06 Per discussione Matteo Mattsteel Vitturi
ttorio.zucc...@gmail.com Date: Thu, 2 Sep 2010 14:41:10 +0200 To: python@lists.python.it Subject: [Python] Algoritmo in CSV Buongiorno, chiedo consiglio su un algoritmo da usare che sia veloce. Anche solo in meta-codice. Problema: - carico un CSV con 200 colonne e 2 milioni di righe - voglio trov

Re: [Python] Algoritmo in CSV

2010-09-04 Per discussione Andrea Ambu
2010/9/4 enrico franchi : > La teoria, insomma, vince. Il mio discorso era un pelino piu' > generale. Ovvero che dal momento che la teoria nasconde sempre le > costanti moltiplicative, ma nella pratica queste possono avere un > impatto non indifferente, spesso un controllo non guasta. > Puo` esse

Re: [Python] Algoritmo in CSV

2010-09-04 Per discussione Pietro Battiston
Il giorno sab, 04/09/2010 alle 10.09 +0200, enrico franchi ha scritto: > 2010/9/3 Pietro Battiston : > > >> Potrebbe essere. La teoria dice che hai ragione tu; in pratica quello > >> che succede non lo so > > > > Cioè sospetti che _in pratica_ un sort possa prendere meno tempo di un > > max? > >

Re: [Python] Algoritmo in CSV

2010-09-04 Per discussione enrico franchi
2010/9/3 Pietro Battiston : >> Potrebbe essere. La teoria dice che hai ragione tu; in pratica quello >> che succede non lo so > > Cioè sospetti che _in pratica_ un sort possa prendere meno tempo di un > max? Non lo *sospetto*. Ma *dipende*. Il sort di cui parliamo e' il timsort, che e' *molto* ef

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Giuseppe Amato
Grazie per le risposte. Scusate ma mi sono affidato a risorse "poco precise" (ho spulciato qua e là in rete). Quando mi sono occupato di sorting ho dovuto solo scegliere il più veloce e semplice da reimplementare, perchè la struttura dei dati che avevo mi prendeva più tempo per sistemare i dati

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Andrea Ambu
2010/9/3 Giuseppe Amato : > Non mi sono mai occupato di max finding quindi non so se è più veloce o > meno, ho cercato qualcosa, ma con scarsi risultati, mi puoi indicare qualche > risorsa dove trovare informazioni? > In un array non ordinato e` necessario visitare tutti gli elementi una volta per

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Pietro Battiston
Il giorno ven, 03/09/2010 alle 21.44 +0200, Pietro Zambelli ha scritto: > In data venerdì 3 settembre 2010 21:10:11, Giuseppe Amato ha scritto: > > >Ma il problema vero è che il sort ha costo più che lineare, mentre il > > > > > >max ha costo lineare > > > > Non mi sono mai occupato di max finding

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Pietro Battiston
Il giorno ven, 03/09/2010 alle 21.10 +0200, Giuseppe Amato ha scritto: > >Ma il problema vero è che il sort ha costo più che lineare, mentre il > > >max ha costo lineare > > > > Non mi sono mai occupato di max finding quindi non so se è più veloce > o meno, ho cercato qualcosa, ma con scarsi r

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Pietro Zambelli
In data venerdì 3 settembre 2010 21:10:11, Giuseppe Amato ha scritto: > >Ma il problema vero è che il sort ha costo più che lineare, mentre il > > > >max ha costo lineare > > Non mi sono mai occupato di max finding quindi non so se è più veloce o > meno, ho cercato qualcosa, ma con scarsi risultat

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Giuseppe Amato
>Ma il problema vero è che il sort ha costo più che lineare, mentre il >max ha costo lineare Non mi sono mai occupato di max finding quindi non so se è più veloce o meno, ho cercato qualcosa, ma con scarsi risultati, mi puoi indicare qualche risorsa dove trovare informazioni? Però mi sono occ

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Gianluca Esposito
Il 03 settembre 2010 17:50, enrico franchi ha scritto: > 2010/9/3 Pietro Battiston : >> Il giorno ven, 03/09/2010 alle 15.58 +0200, Giuseppe Amato ha scritto: >>> Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando >>> sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Pietro Battiston
Il giorno ven, 03/09/2010 alle 17.50 +0200, enrico franchi ha scritto: > 2010/9/3 Pietro Battiston : > > Il giorno ven, 03/09/2010 alle 15.58 +0200, Giuseppe Amato ha scritto: > >> Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando > >> sort(cmp) sulle colonne. L'algoritmo di sort

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Andrea Ambu
2010/9/3 Giuseppe Amato : > Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando > sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto > ai confronti che hai previsto tu. Se hai bisogno anche dell'indice del > campo butti tutto in un dizionario del tipo {:} però

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione enrico franchi
2010/9/3 Pietro Battiston : > Il giorno ven, 03/09/2010 alle 15.58 +0200, Giuseppe Amato ha scritto: >> Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando >> sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto >> ai confronti che hai previsto tu. Se hai bisogno

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Pietro Battiston
Il giorno ven, 03/09/2010 alle 15.58 +0200, Giuseppe Amato ha scritto: > Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando > sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto > ai confronti che hai previsto tu. Se hai bisogno anche dell'indice del > campo

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Giuseppe Amato
Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto ai confronti che hai previsto tu. Se hai bisogno anche dell'indice del campo butti tutto in un dizionario del tipo {:} però devi fare attenzione alle dupl

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Andrea Ambu
2010/9/3 Marco Mariani : > No, se in postgres crei un indice funzionale su LENGTH(colonna), una volta > creata la tabella e' sufficiente un index scan per recuperare i valori con > lunghezza massima. > > Chiaramente, 200 colonne fanno 200 indici con milioni di righe :") > Infatti il consiglio era

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Marco Mariani
Il cvs lo prepari tu in una parte del tuo progetto? Forse sarebbe meglio mettere tutto in un database che conserva i dati in maniera piu` furba del cvs come diceva Nicola, pero` farlo solo per vedere i massimi non serve a niente perche` dovresti comunque leggerti tutti i righe*colonne dati

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Andrea Ambu
2010/9/2 Vittorio Zuccala' : > Ecco: il mio problema è che vengono effettuati 200*2.000.000 di IF e la cosa > non mi piace molto. > Qualcuno ha un consiglio per ottimizzare? > Se un array non e` ordinato trovare il massimo costa O(n) in tempo e O(1) in spazio. Le colonne del tuo file immagino non

Re: [Python] Algoritmo in CSV

2010-09-03 Per discussione Manuele
On 02/09/2010 14:41, Vittorio Zuccala' wrote: > Buongiorno, > chiedo consiglio su un algoritmo da usare che sia veloce. > Anche solo in meta-codice. > > Problema: > - carico un CSV con 200 colonne e 2 milioni di righe > - voglio trovare la lunghezza maggiore per ogni campo > > Meta-codice > * apri

Re: [Python] Algoritmo in CSV

2010-09-02 Per discussione Pietro Battiston
Il giorno gio, 02/09/2010 alle 15.22 +0200, Daniele Varrazzo ha scritto: > On Thu, 2 Sep 2010 14:41:10 +0200, "Vittorio Zuccala'" > wrote: > > Buongiorno, > > chiedo consiglio su un algoritmo da usare che sia veloce. > > Anche solo in meta-codice. > > > > Problema: > > - carico un CSV con 200 col

Re: [Python] Algoritmo in CSV

2010-09-02 Per discussione Nicola Larosa
Vittorio Zuccala' wrote: > Problema: > - carico un CSV con 200 colonne e 2 milioni di righe > - voglio trovare la lunghezza maggiore per ogni campo > [snip] > Qualcuno ha un consiglio per ottimizzare? Butta tutto in un database e fai fare il lavoro sporco a lui. :-) -- Nicola Larosa - http://www

Re: [Python] Algoritmo in CSV

2010-09-02 Per discussione Pietro Battiston
Il giorno gio, 02/09/2010 alle 14.41 +0200, Vittorio Zuccala' ha scritto: > Buongiorno, > chiedo consiglio su un algoritmo da usare che sia veloce. > Anche solo in meta-codice. > > Problema: > - carico un CSV con 200 colonne e 2 milioni di righe > - voglio trovare la lunghezza maggiore per ogni ca

Re: [Python] Algoritmo in CSV

2010-09-02 Per discussione Daniele Varrazzo
On Thu, 2 Sep 2010 14:41:10 +0200, "Vittorio Zuccala'" wrote: > Buongiorno, > chiedo consiglio su un algoritmo da usare che sia veloce. > Anche solo in meta-codice. > > Problema: > - carico un CSV con 200 colonne e 2 milioni di righe > - voglio trovare la lunghezza maggiore per ogni campo > Ecco

[Python] Algoritmo in CSV

2010-09-02 Per discussione Vittorio Zuccala'
Buongiorno, chiedo consiglio su un algoritmo da usare che sia veloce. Anche solo in meta-codice. Problema: - carico un CSV con 200 colonne e 2 milioni di righe - voglio trovare la lunghezza maggiore per ogni campo Meta-codice * apri file csv * crea un oggetto csv_reader * crea un array "lunghezza