Re: [Python] E' mai possibile...
Simone Federici gmail.com> writes: Ciao, > > > ... che dopo una settimana che faccio scouting su framework java ... > ... non ne trovi uno? > Sì! :-D > > il troppo python fa male > Anche il troppo poco... :-P Comunque, all'epoca avevo trovato questi: http://www.sparkjava.com/ http://jodd.org/ http://www.playframework.org/ http://www.grails.org Purtroppo non ho utilizzato nessuno di questi in un contesto reale, mi sono limitato agli esempi e farne una valutazione sommaria. Poi, la sparo grossa: http://packages.python.org/django-jython/ HTH, Sani Strap ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] E' mai possibile...
Quasi dimenticavo, come non citare, solo per i posteri, http://www.springsource.org/spring-roo ... eh! :-) ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] E' mai possibile...
On Mon, Jun 4, 2012 at 12:45 PM, Strap wrote: > > Quasi dimenticavo, come non citare, solo per i posteri, > http://www.springsource.org/spring-roo ... > eh! :-) grazie delle dritte... o sarebbe meglio definirle rovesce... ma non certo per colpa tua :-) ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] Aiuto per testi su machine learning e graph clustering
Chiedo scusa se rispondo solo ora ma ammetto di non aver controllato questa mail in questi giorni :P . Rispondo subito ad Enrico che mi accusa ( :D ) di fare statistica. Io qui sono venuto per fare una testi in sicurezza, avrei voluto occuparmi di reti protocolli etc etc ... invece sono finito a fare privacy. L'argomento non mi dispiace e devo dire che il lavoro mi sta appassionando, il problema però è che essendo senza guida ho molta paura di commettere errori grossolani e di fare quindi un lavoro sbagliato. Adesso vi contestualizzo un pò di più il problema. Esistono nuovi sistemi, chiamati Identity managment systems, che appunto dovrebbero garantire la gestione di una identità digitale in maniera da preservare la privacy dell'utilizzatore. es. ci rechiamo in una enoteca per comprare del vino. Possiamo comprare del vino solo se abbiamo più di 18 anni. Quindi la procedura sarebbe quella di mostrare una PROVA (carta d'identità) che ci viene rilasciata da un Identity provider (il nostro stato). Quindi il negoziante diventa un SERVICE PROVIDER ed è contro di loro che noi vogliamo preservare la privacy. Perchè il senso è che lui ha bisogno solo di sapere se siamo maggiorenni ed invece noi stiamo dischiudendo tutte le nostre informazioni personali. Quindi una pratica diffusa nel progetto di Identity managment systems è quella del "data minimization" ovvero io dischiudo solo le informazioni che il service provider necesita, in questo caso l'anno di nascita opportunamente firmato dall'identity provider. Quindi la domanda che il mio professore mi ha posto la prima volta che ci siamo incontrati è stata: Cosa succede se tanti service providers (diversi) mettono insieme le informazioni parziali che hanno su una identità? Riescono a linkarle ? Bene quindi lo scenario come l'ho immaginato io è : Considero un solo identity provider che gestice la nostra identità sotto forma di tupla. Le informazioni parziali che ogni serive provider avrà non sono altro che un sottoinsieme di questa tupla. ok quella era solo una nota di colore... adesso tornando ai dettagli tecnici.. ripeto... non essendo esperto di machine learning ho scelto SVM perchè mi sembrava molto semplice l'ho incontrata per caso navigando in http://mlpy.sourceforge.net/ ed era una dei pochi modelli ad avere un metodo pred_probability() -> bellissimo. Ovviamente poi ho approfondito i miei studi su SVM e devo dire che quasi quasi ho capito di cosa si tratta :D. Quindi se c'è qualcuno che ne capisce qualcosina di machine learning magari potrebbe dare qualche suggerimento :P. Enrico tu per esempio perchè dici che SVM non va bene? Io sto parlando di SVM con kernel esponenziale. Leggendo http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf il documento ufficiale di Libsvm alla voce Probabilità è spiegato come ottengono la probabilità condizionata, che nel mio caso sarebbe p(match | pattern di metriche). Il problema dei vettori di training è molto importante. Li sto generando artificialmente con questo software http://adatagenerator.sourceforge.net/cdc-tutorial/index.html che dovrebbe prendere in input un database (anche lui artificiale http://www.generatedata.com/ ) e basandosi su alcune "regole di errore" generare coppie di tuple ed etichettarle come match o unmatch. Quindi concludendo ... genero i dati -> genero set di training -> parserizzo le coppie di record etichettate in vettori di numeri (con le metriche) -> faccio il training del modello SVM -> potrò chidere al modello: questo pattern (1,1,0.9,0,2,1,0) con che probabilità corrisponde a due stessi record?? e lui mi dirà 0.7 ! Fatemi sapere se tutto questo vi sembra ragionevole o è pura follia perchè c'è ancora un problema che sto cercando di risolvere in relazione a questa fase qui... Per la fase "graph clustering" forse la situazione è più rosea... http://perso.crans.org/aynaud/communities/index.html algoritmo basato su networkx del metodo louvain che altro non è che un'imprementazione greedy dell'algoritmo di Newman su grafi pesati (ovviamente). Ho fatto qualche piccola prova ad utilizzare grafi "ragionevolmente" prodotti dalla fase 1 e devo dire che si comporta come mi aspettavo (raggruppa nodi collegati con pesi elevati)... tra qualche tempo,magari, vi mando uno screenshot per avere un'idea. Grazie 1000 per le opinioni e per il supporto ps. Sono ad Eindhoven ed oggi la temperatura è 1/3 rispetto a quella del mio paese (Bari) :( Il giorno 01 giugno 2012 09:12, Marco De Paoli ha scritto: > > > Il giorno 31 maggio 2012 22:49, Diego Barrera ha > scritto: > > Io ho risolto in questo modo: >> -prendo ciascun campo e mi ricavo lo slug; >> -trovo la sottostringa massima comune degli slug che sto confrontando, >> per ciascun campo; >> -a questo punto se il valore percentuale della sottostringa rispetto allo >> slug supera per ciascun campo una soglia minima stabilita, i due >> destinatari sono lo stesso destinatario >> > > invece che la sottos
Re: [Python] E' mai possibile...
On Fri, Jun 01, 2012 at 04:36:46PM +0200, Simone Federici wrote: > Neo ho visti a carrellate ma uno dove modelli una classe e sei online non > c' . > Ho visto che avete citato grails: è meraviglioso!! Dagli un'occhiata (anche due), funziona davvero bene. Tra l'altro usa Groovy come linguaggio... Una sorta di Java++: fa tutto quello che fa Java e qualcosa di più, è un linguaggio dinamico, molto comodo. L'ho usato in diverse applicazioni, te lo consiglio. Saluti, -- Emanuele Santoro signature.asc Description: Digital signature ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] MAC e python
2012/6/1 Giampaolo Rodolà : > In questo momento non ho un OSX sotto mano ma in genere quello che > riesci a ottenere è nome del processo, parent pid (che è usato da > get_children() nel tuo esempio) e poche altre informazioni. > Altre info relative alla memoria (get_memory_info()), cmdline, e > persino i tempi di CPU (per calcolare l'utilizzo percentuale) > dovrebbero richiedere root. > http://code.google.com/p/psutil/issues/detail?id=215 > http://code.google.com/p/psutil/issues/detail?id=108 > http://code.google.com/p/psutil/issues/detail?id=106 Ok. Chiaro. Effettivamente questi non funzionano. Temo che l'unica sia usare il framework di sicurezza di OS X. Una volta ti avrei detto con sicurezza "AuthorizationExecuteWithPrivileges", ma oggi pare essere deprecata su Lion. Ho idea di come farlo funzionare... ma potrebbe non piacerti. Se vuoi ci diamo un occhio ad europython. Probabilmente per partire non ci vuole molto. -- . ..: -enrico- ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] MAC e python
2012/6/4 enrico franchi > Ok. Chiaro. Effettivamente questi non funzionano. 1° rule of security == "information hiding" ma qui hanno esagerato :-) ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] MAC e python
Il 04 giugno 2012 16:09, enrico franchi ha scritto: > 2012/6/1 Giampaolo Rodolà : > >> In questo momento non ho un OSX sotto mano ma in genere quello che >> riesci a ottenere è nome del processo, parent pid (che è usato da >> get_children() nel tuo esempio) e poche altre informazioni. >> Altre info relative alla memoria (get_memory_info()), cmdline, e >> persino i tempi di CPU (per calcolare l'utilizzo percentuale) >> dovrebbero richiedere root. >> http://code.google.com/p/psutil/issues/detail?id=215 >> http://code.google.com/p/psutil/issues/detail?id=108 >> http://code.google.com/p/psutil/issues/detail?id=106 > > Ok. Chiaro. Effettivamente questi non funzionano. > > Temo che l'unica sia usare il framework di sicurezza di OS X. > Una volta ti avrei detto con sicurezza > "AuthorizationExecuteWithPrivileges", ma oggi pare essere deprecata su > Lion. > > Ho idea di come farlo funzionare... ma potrebbe non piacerti. Se vuoi > ci diamo un occhio ad europython. > Probabilmente per partire non ci vuole molto. Non credo di esserci quest'anno. Ti pingo in privato così non ammorbiamo questa discussione. =) --- Giampaolo http://code.google.com/p/pyftpdlib/ http://code.google.com/p/psutil/ http://code.google.com/p/pysendfile/ ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
Re: [Python] Aiuto per testi su machine learning e graph clustering
Il 01/06/2012 09:12, Marco De Paoli ha scritto: invece che la sottostringa di lunghezza massima potresti prendere la distanza di Levenshtein fra le due stringhe: http://en.wikipedia.org/wiki/Levenshtein_distance puoi valutare se nel tuo caso sia più significativa. Puoi implementarti l'algoritmo o usare uno di quelli già disponibili Googlando ho trovato i seguenti (che non ho verificato): http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Levenshtein_distance#Python http://code.activestate.com/recipes/576874-levenshtein-distance/ Marco Grazie delle dritte ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python