2010/9/3 Giuseppe Amato <giuam...@gmail.com>:
> Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando
> sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto
> ai confronti che hai previsto tu. Se hai bisogno anche dell'indice del
> campo butti tutto in un dizionario del tipo {<campo>:<indice>} però devi
> fare attenzione alle duplicazioni, che comunque dovrai gestire nella
> ricerca del massimo
>
Se e` un CVS molto probabilmente quei dati hanno senso messi in riga,
inoltre riordinare (in python con timsort l'operazione e` O(log(n!))
quindi in questo caso righe*log(colonne!) e` molto piu` oneroso di
righe*colonne quando righe = 2 milioni e colonne = 200, ci sono 9
ordini di grandezza di mezzo.


-- 
Andrea
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a