Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-27 Thread Stefano Zacchiroli
On Tue, Feb 27, 2024 at 09:17:10AM +0100, Giuseppe Attardi wrote:
> Facciamolo con fondi pubblici un modello davvero completamente Open,
> dai dati di apprendimento, al codice, ai pesi del modello, ai test di
> valutazione.

Concordo con l'obiettivo e sul fatto che una AI che possa dirsi "open"
(o meglio: "libera") dovrebbe esserlo in tutto: dataset di training,
codice di training, codice di inferenza, pesi del modello.

Ma attenzione al fatto che, a leggi vigenti, tale obiettivo non è
raggiungibile per modelli a-la ChatGPT. Il motivo è che includono nei
loro dataset di training grandi parti del Web (solitamente ottenute via
crawling fatto in casa), che nessuna parte terza può legittimamente
redistribuire, dato che solo una piccolissima parte del Web è
disponibile sotto licenze libere.

Una AI "libera", secondo i criteri accennati sopra, ha quindi oggi uno
svantaggio competitivo enorme rispetto a quelle chiuse --- il che è
molto deprimente. L'evoluzione tecnologica e scientifica sta andando nel
verso giusto, con modelli sempre più aperti che riescono sempre meglio a
rivalizzare con quelli chiusi (o ibridi) ma la strada è ancora lunga e
non è detto che il gap sia completamente colmabile.

Nel mentre dovremmo guardare criticamente alle regolamentazioni che
hanno permesso tutto questo "yolo training", che dà un vantaggio
competitivo enorme a chi libero non vuole essere.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-27 Thread Stefano Zacchiroli
On Tue, Feb 27, 2024 at 12:04:52PM +0100, Marco A. Calamari wrote:
> > Ma attenzione al fatto che, a leggi vigenti, tale obiettivo non è
> > raggiungibile per modelli a-la ChatGPT. Il motivo è che includono nei
> > loro dataset di training grandi parti del Web (solitamente ottenute via
> > crawling fatto in casa), che nessuna parte terza può legittimamente
> > redistribuire, dato che solo una piccolissima parte del Web è
> > disponibile sotto licenze libere.
> 
> Un appunto, nessuna azienda *europea* lo può fare.
> Quelle americane, ad esempio, legalmente possono e lo fanno.

Ho l'impressione che parliamo di diritti diversi.

Io mi riferisco a quello di redistribuire i training dataset acquisiti
via web crawling (o simili). A mia conoscenza, non lo possono fare
nemmeno quelle americane e non lo fanno. E la ragione è abbastanza
ovvia: se fai web crawl recuperi pagine con milioni di detentori di
diritto d'autore diversi e sotto migliaia di licenze diverse, la maggior
parte delle quali non permette redistribuzione.

Se hai controesempi sono i benvenuti.

Credo tu ti riferisca al diritto di fare mining di tali pagine, ai fini
di machine learning, e su quello effettivamente la situazione tra EU e
US e abbastanza diversa. (Anche se la recente riforma del copyright
europea ha liberalizzato parecchio le cose anche qua da noi, per alcuni
use case.)

> Poi nessuno acquisisce più dataset in proprio, tutti lo fanno tramite queste
>  "aziende specializzate", in modo da avere comunque  un ulteriore schermo
>  legale contro cause civili spicciole per diritto d'autore e proprietà
> intellettuale.

Non ho una statistica esaustiva, ma per interazione diretta con gli
autori di LLM sia specifici per il codice che general purpose (a-la
ChatGPT), a me risulta il contrario. C'è molto crawling e mining in
proprio da parte dei grandi attori, in aggiunta a quello che dici tu, ma
che a mia conoscenza non è dominante negli LLM state-of-the-art.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-27 Thread Stefano Zacchiroli
On Tue, Feb 27, 2024 at 12:10:42PM +0100, Guido Vetere wrote:
> infatti i dataset non sono distribuiti, neanche quelli dei modelli c.d.
> aperti, però molti di questi sono comunque reperibili 'a prescindere'

Purtroppo nella maggior parte dei casi è come dici tu, e più in generale
c'è molta confusione sotto il "sole" delle IA cosiddette aperte.

Ma ci sono anche esempi virtuosi, come Starcoder o Eleuther (LLM per il
codice), i cui training dataset (assieme a tutto il resto) sono
interamente disponibili e libri.

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-27 Thread Stefano Zacchiroli
On Tue, Feb 27, 2024 at 03:16:03PM +0100, Marco A. Calamari wrote:
> Non vorrei tediare la lista, quindi sarò sintetico
> https://datarade.ai/data-categories/ai-ml-training-data/datasets

Nel caso di ChatGPT, quello che si sa per GPT-4 (a mia conoscenza) è
questo:

  "trained [...] using both publicly available data (such as internet
   data) and data licensed from third-party providers."

  (fonte: https://arxiv.org/pdf/2303.08774.pdf )

Loro stessi dichiarano di avere un web crawler e come escludere pagine
dal suo crawling qua: https://platform.openai.com/docs/gptbot (Per GPT-3
hanno dichiarato di avere usato anche CommonCrawl, ma era "solo" il 60%
del training set.)

Comunque sia, proprio perché è tutto molto chiuso (e nel caso specifico
anche segreto industriale), possiamo solo tirare a indovinare sulla
esattezza dei dettagli...
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-27 Thread Stefano Zacchiroli
On Tue, Feb 27, 2024 at 05:27:06PM +0100, Stefano Maffulli wrote:
> On Tue, Feb 27, 2024, 14:11 Stefano Zacchiroli  wrote:
> >
> > Ma ci sono anche esempi virtuosi, come Starcoder o Eleuther (LLM per il
> > codice), i cui training dataset (assieme a tutto il resto) sono
> > interamente disponibili e libri.
> 
> Non tutti i dataset di Eleuther AI sono ridistribuibili. Anzi, The Pile è
> purtroppo stato rimosso dalla circolazione, se non ricordo male.

Ah, non lo sapevo, grazie per l'informazione. Ora che mi ci hai fatto
guardare vedo qua
https://huggingface.co/datasets/EleutherAI/pile/discussions/15 che ci
sono versioni di The Pile ripulite dei contenuti problematici, ma
mantenute dalla comunità e non da Eleuther. (Disclaimer: non le ho
testate.)

Starcoder/The Stack invece è ancora vivo e lotta insieme a noi per avere
AI libere: https://huggingface.co/datasets/bigcode/the-stack

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Microsoft, Mistral AI e l'AI Act

2024-02-29 Thread Stefano Zacchiroli
On Thu, Feb 29, 2024 at 10:09:43AM +0100, Enrico Nardelli wrote:
> Mi pare che il quarto fattore alla base dell'analisi di CC del perché si
> tratta di "fair use" (4. Whether the secondary use harms the market for the
> original) possa andare forse bene per la dottrina US, perché si limita a
> considerare i danni per lo specifico originale su cui ci si è addestrati, ma
> nella mia visione più europea andrebbe considerato il danno al mercato per
> l'insieme delle opere su cui ci si è addestrati.

Nel caso europeo si rientra però nella fattispecie della eccezione TDM
(Text & Data Mining) introdotta nella riforma del copyright del 2019.
Secondo i casi d'uso (in particolare: usi a fini di ricerca vs per
qualsiasi altro fine, incluso profitto) il mining è concesso
automaticamente o meno, potenzialmente mitigato da un opt-out esplicito.

(Ci sono su questa lista persone ben più competenti di me per discutere
di questi dettagli. Nel caso, sarei curioso di sapere come l'eccezione
TDM è stata recepita dal diritto italiano, se lo è stata, perché non ho
per nulla seguito questo aspetto.)

Faccio però notare a Giuseppe che il mio commento iniziale riguardava il
diritto di *ridistribuzione* dei dataset, che è altro rispetto a quello
di usarli per fare training.

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] LMs and AI make software development harder

2024-03-04 Thread Stefano Zacchiroli
On Mon, Mar 04, 2024 at 11:11:51AM +0100, Giuseppe Attardi wrote:
> Questo signore si dichiara Agilist, una delle metodologie moderne di
> sviluppo software, ma sembra non aderire ad alcuni suoi principi
> fondamentali, quali:
> 
> 1. Pair[wise] programming: qui un copilot funge benissimo da secondo
>nella coppia

Ma non è vero, dai :)

In pair programming i ruoli si scambiano frequentemente tra i due membri
della coppia, il che è impossibile con Copilot, perché non ha abbastanza
contesto "strategico" (neanche quando addestrato sul codice in house)
per essere observer.

Inoltre uno dei benefici chiave di pair programming è migliorare la
comunicazione tra i membri dello stesso team, il che non è
particolarmente utile con Copilot (non più di quanto lo sia parlare con
lo psicoterapeuta in Emacs con "M-x doctor").

Copilot è molto utile per i programmatori, e diventerà tecnologia
standard (e speriamo libera!) nel futuro dello sviluppo software, ma non
mitizziamola.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] ChatGPT provides false information about people, and OpenAI can't correct it (noyb complaint)

2024-05-02 Thread Stefano Zacchiroli
> In the EU, the GDPR requires that information about individuals is
> accurate and that they have full access to the information stored, as
> well as information about the source. Surprisingly, however, OpenAI
> openly admits that it is unable to correct incorrect information on
> ChatGPT. Furthermore, the company cannot say where the data comes from
> or what data ChatGPT stores about individual people. The company is
> well aware of this problem, but doesn’t seem to care. Instead, OpenAI
> simply argues that “factual accuracy in large language models remains
> an area of active research”. Therefore, noyb today filed a complaint
> against OpenAI with the Austrian DPA.

Continua qui: 
https://noyb.eu/en/chatgpt-provides-false-information-about-people-and-openai-cant-correct-it

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'


Re: [nexa] large language model e open washing (da: una "gemma" da Google)

2024-07-03 Thread Stefano Zacchiroli
On Wed, Jul 03, 2024 at 10:29:39AM +0200, Guido Vetere wrote:
> C'è poi un piccolo particolare che rende la nozione di 'Open Source'
> difficilmente applicabile ai LLM: se pure uno avesse tutti i dataset
> eccetera, gli mancherebbe ancora quel mesetto di GPU che serve per fare
> training anche di pochi miliardi di parametri. Cioè: servirebbe ancora
> Leonardo, o in alternativa un grosso conto in banca.

Questo è un argomento ricorrente e comprensibile, ma che personalmente
non condivido. Propongo alcuni (contro)argomenti:

- un dataset aperto permette (a costi molto inferiori a quelli di
  addestramento) di verificare cosa c'è dentro, per esempio, per
  verificare la presenza di eventuali bias di selezione

- in ambito software: che il codice sorgente del kernel Linux sia
  disponibile è un bene per tutta i suoi utilizzatori, compresi quelli
  che non hanno ne le competenze ne il tempo di capire come funziona o
  metterci mano

- in ambito hardware: l'esistenza di open hardware (che prevede che gli
  schemi di design siano liberamente disponibili) è un bene per tutti,
  anche se in pochi dispongono delle fabbriche per costruire microchip o
  (ancora più difficile) dei laboratori per verificare che il chip che
  hanno in mano corrisponde a quei design

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'


Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Stefano Zacchiroli
On Sun, Sep 08, 2024 at 04:24:00PM +0200, Guido Vetere wrote:
> La memorizzazione, insomma, è un caso degenere. Infatti, si applicano
> usualmente tecniche di filtering per deduplicare i passaggi che occorrono
> molte volte nei dataset di training, magari proprio perché gli umani li
> hanno plagiarizzati molte volte :-)

Esatto, questo è un punto pratico molto importante che spesso si perde
(anche su questa lista) nelle discussioni sul tema della "recitation"
(restituzione di "lunghi" passaggi presenti nel training dataset da
parte di un LLM).

La recitation è assolutamente *possibile* come caso degenere, come
sottolinea Guido. La frequenza dipende da proprietà statistiche del
training dataset, che chi mette sul mercato un LLM può controllare (ma
spesso fa, perché molto costoso).  Quello che invece regolarmente fanno
attori come GitHub con Copilot è di aggiungere a valle della generazione
con gli LLM dei filtri basati su tecniche di code clone detection e
anti-plagio, che sono molto efficaci e relativamente poco costose. Se
una sequenza troppo lunga è presente sia nell'output che nel training
dataset, l'output viene buttato via e rigenerato, fino a quando non si
ottiene un output senza recitation.

Tutto questo non ci aiuta nel dibattito sul decidere se un LLM sia o
meno un opera derivata dei suoi training input. Ne tantomeno ci aiuta
nei casi più complicati nei quali in cui l'output contiene parti del
training dataset, ma non in sequenze verbatim.

Ma in termini di impatto sulla società dei *prodotti* basati su LLM, le
cose sono cambiate parecchio su questi punti dai primi studi empirici su
quanto gli LLM (commercializzati) possano ripetere verbatim i loro input
o meno. È il motivo per cui Microsoft si senza abbastanza sicura di
tutto questo da offrire garanzie legali in termini di violazione del
diritto d'autore quando si usa la suite Copilot. (Non a caso lo fa
*solo* se l'utente non ha disabilitato il filtering a valle di cui
parlavo sopra.)

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'


[nexa] Copyright law makes a case for requiring data information rather than open datasets for Open Source AI - Felix Reda

2024-09-15 Thread Stefano Zacchiroli
https://opensource.org/blog/copyright-law-makes-a-case-for-requiring-data-information-rather-than-open-datasets-for-open-source-ai

(Personalmente ne traggo una conclusione diversa da Felix, ovvero che
bisognerebbe quindi agire per *cambiare* il copyright in modo che
permetta di incorporare lavori protetti in dataset aperti, anziché
limitarsi alla data mining exception. È quella eccezione che ha creato
il disequilibrio di potere che avvantaggia le aziende come Open AI in
questo momento. Ma resta una delle letture più interessanti che mi è
capitato di leggere a supporto della posizione di compromesso adottata
in OSAID.)

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'


Re: [nexa] TomTom Microsoft Meta Amazon e Linuxfoundation creano Overture Maps Foundation: creazione di opendata geografici

2022-12-18 Thread Stefano Zacchiroli
Ciao Napo!,

On Sat, Dec 17, 2022 at 12:36:02PM +0100, Maurizio Napolitano via nexa wrote:
> Anche se qualcosa mi lascia perplesso, preferisco essere ottimista e
> fare presente che una azienda come TomTom (e non solo) alla fine ha
> dovuto abbracciare l'idea di cominciare a rilasciare qualcosa del suo
> asset per poter rimanere sul mercato.
> Di fatto questa ultima, la vedo come una conseguenza della potenza che
> OpenStreetMap ha generato in questi anni.

apprezzo il tuo ottimismo, ma per ora io lo vedo più come un take over
ostile da parte della Linux Foundation (LF). Take over non tanto dei
dati OSM esistenti (che non possono comunque facilmente essere
appropriati/ espropriati), ma delle *risorse* finanziarie e di sviluppo
che sarebbero potute andare verso la comunità OSM e che andranno ora
invece nelle (già pingui) tasche di LF e delle sue innumerevoli
fondazioni sussidiarie. Mi sembra molto rivelatore di questo rischio il
confronto tra i membership tiers della nuova Ouverture Maps Foundation
qua:

  https://overturemaps.org/become-a-member/

e quelli delle membership classes di OSM Foundation qua:

  https://join.osmfoundation.org/

A *brevissimo* le risorse captate da Ouverture saranno immensamente
superiori di quelle captate da OSM Foundation. So benissimo che non è
semplice usare bene risorse economiche per un progetto con basi
comunitarie, ma non posso fare a meno di vedere questa azione come
ostile. Tanto più, che da quando mi sembra di capire, il lancio non è
stato ne coordinato con, ne tanto meno anticipato alla comunità OSM
prima che fosse cosa fatta.

Auguri a voi (e a tutti noi che teniamo ai bene comuni digitali).
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Il diritto universale di installare qualsiasi software su qualsiasi dispositivo (era: Dichiarazione europea sui diritti e i principi digitali per il decennio digitale)

2022-12-23 Thread Stefano Zacchiroli
Care tutte e tutti, il dibattito etico sul diritto alla modifica del
software delle autovetture è risolto da parecchi anni. Lo riassumo in
brevissimo così: (1) si, Andrea dovrebbe avere il diritto e la capacità
pratica di modificare il software dell'ABS (o altro), e allo stesso
tempo (2) l'auto con il software modificato potrebbe benissimo *non*
avere diritto a circolare in strada fino ad una nuova verifica di
omologazione da parte della motorizzazione civile. Non c'è nulla di
diverso dalla modifica meccanica che tutti possiamo effettuare da
decenni sulla marmitta di un motorino: può aumentare le prestazioni, ma
lo rende normativamente inadatto alla circolazione (per principio di
precauzione) fino a che i freni (o altro) non siano stati adattati di
conseguenza. Il problema è che oggi *non* è tecnicamente possibile
modificare il software in questione, con una perdita netta di "agency"
(per dirla con M.) con il passaggio dal regno meccanico a quello
informatico. Non esiste conflitto etico tra il desiderare modificare il
software dell'ABS e desiderare che di default un auto con il software
dell'ABS modificato non possa circolare in strada.

Quindi vogliatevi bene :-)
Saluti festivi,
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] "EU chat control law will ban open source operating systems"

2023-02-01 Thread Stefano Zacchiroli
Si, l'impatto potenziale del CRA sull'open source è molto dibattuto da
un paio di mesi a questa parte. In Europa tra le associazioni più attive
sul tema c'è Open Forum Europe (OFE) e parleremo di questo molto al loro
evento pre-FOSDEM questa settimana: https://summit.openforumeurope.org/

Se ne parlerà anche a FOSDEM, tra l'altro, con partecipazione di DIGIT,
in una sessione dedicata qua:
https://fosdem.org/2023/schedule/event/cyber_resilience/

Una buona lista di opinioni sul CRA da parte di fondazioni e imprese
(quindi sia non-profit che for-profit) del mondo FOSS è stata pubblicata
scritta da Simon Phipps e pubblicata un paio di giorni fa da OSI:
https://blog.opensource.org/the-ultimate-list-of-reactions-to-the-cyber-resilience-act/

Il commento più dettagliato che conosco è quello della Eclipse
Foundation:
https://blogs.eclipse.org/post/mike-milinkovich/european-cyber-resiliency-act-potential-impact-eclipse-foundation

A presto

On Wed, Feb 01, 2023 at 10:29:24AM +, Marco Fioretti wrote:
> Ho appena visto questo, di cui non avevo mai sentito parlare prima, a qualcun 
> altro risulta? Commenti?
> https://mullvad.net/en/blog/2023/2/1/eu-chat-control-law-will-ban-open-source-operating-systems/
>  
> (https://mullvad.net/en/blog/2023/2/1/eu-chat-control-law-will-ban-open-source-operating-systems/)
> Marco

> ___
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] "DPReview.com to close"

2023-03-24 Thread Stefano Zacchiroli
On Fri, Mar 24, 2023 at 04:48:57PM +0100, J.C. DE MARTIN wrote:
> Nel caso non abbiate letto il comunicato, faccio presente che il
> proprietario di DPreview non è un associazione di volontari o una
> "boita" squattrinata: è nientepopodimeno che Amazon, al quale non
> mancano, credo, risorse di calcolo, banda, dischi, competenza tecnica,
> risorse finanziarie, ecc. ecc.

Personalmente, da utente/lurker di lunga data di DPreview, avevo letto
questo "dettaglio" e rilancio qui un "subplot" che mi sembra degno di
nota. Qui:

  https://twitter.com/slashdot/status/1638257681181073409

  We'd be interested in acquiring DPReview's assets to keep it alive. Let me 
know @scotteverett @amazon @ajassy

Slashdot [Media] dichiara pubblicamente di essere interessata ad
acquistare DPReview's e tenerlo in vita. Seguendo un po' di discussioni
sul tema (sia su Twitter e su Reddit) c'è chi insinua che Amazon in
realtà *voglia* chiudere DPreview e non per motivi di costi che, come
osserva JC, sono risibili. Non ho elementi per valutare se sia vero o
meno, ma strategicamente ha perfettamente senso: Amazon vuole
controllare le review, quindi non ha alcun interesse a tenere in vita un
sito a parte. Sarà interessante vedere se la vendita accade o meno.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] "DPReview.com to close"

2023-03-24 Thread Stefano Zacchiroli
On Fri, Mar 24, 2023 at 04:26:24PM +0100, Maria Chiara Pievatolo wrote:
> Però, una cosa è aver emanato una legge e averne sperimento, limitatamente,
> l'applicazione (https://www.depositolegale.it/), un'altra attuarla in modo
> pervasivo *e* sistematico, ammesso e non concesso che sia possibile farlo.

Esatto. Da archivista digitale (di codice sorgente) mi permetto di
commentare che questo è esattamente il motivo per cui creammo Software
Heritage quasi 8 anni fa. Il codice "interessante" qualcuno lo archivia
di sicuro, ne fa copie, lo [git] clona, lo distribuisce, etc. Ma c'è
molto altro codice la fuori liberamente disponibile, che contiene
conoscenza umana importante, che purtroppo è fuori dal radar di
interesse degli sviluppatori, e che è quindi a rischio di sparizione
definitiva per mille ragioni. Il nostro approccio di archiviazione
sistematica di tutto il codice sorgente che troviamo si basa sul
principio di prevenzione che io leggo nel messaggio di Maria Chiara.
Prevenire è meglio che dovere correre dietro agli annunci di chiusure
imminenti (di site web, nel caso di DPReview; di forge di sviluppo
software, nel caso di Software Heritage).

L'archiviazione del Web è purtroppo (o per fortuna nostra) più ingente
da un punto di vista volumetrico. Archive.org fa un lavoro eccellente.
Ma da un punto di vista di politiche digitali pubbliche sarebbe
preferibile se anche attori pubblici sparsi in giro per ilmondo
facessero lo stesso.

Saluti,
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Pause Giant AI Experiments: An Open Letter

2023-03-29 Thread Stefano Zacchiroli
Aspetto che trovo insopportabile di questa lettera: il claim (falso) 
"Contemporary AI systems are now becoming human-competitive at general tasks" è 
supportato bibliograficamente da ricerca svolta da investitori in OpenAI (e non 
peer reviewed).

Quindi la lettera che si auto promuove come "contro", contribuisce in realtà ad 
alimentare lo hype dei prodotti che vorrebbe rallentare.

Come astroturfing abbiamo visto di meglio...

On March 29, 2023 8:47:53 AM GMT+02:00, "J.C. DE MARTIN" 
 wrote:
>Primi firmatari: Yoshua Bengio, Stuart Russell, Elon Musk, Steve Wozniak.
>
>jc*
>
>Pause Giant AI Experiments: An Open Letter**
>*
>/We call on all AI labs to immediately pause for at least 6 months the 
>training of AI systems more powerful than GPT-4.
>/
>
>https://futureoflife.org/open-letter/pause-giant-ai-experiments/
>
>//
>
>AI systems with human-competitive intelligence can pose profound risks to 
>society and humanity, as shown by extensive research^[1] and acknowledged by 
>top AI labs.^[2] As stated in the widely-endorsed Asilomar AI Principles 
>, /Advanced AI could 
>represent a profound change in the history of life on Earth, and should be 
>planned for and managed with commensurate care and resources/. Unfortunately, 
>this level of planning and management is not happening, even though recent 
>months have seen AI labs locked in an out-of-control race to develop and 
>deploy ever more powerful digital minds that no one – not even their creators 
>– can understand, predict, or reliably control.
>
>Contemporary AI systems are now becoming human-competitive at general 
>tasks,^[3] and we must ask ourselves: /Should/ we let machines flood our 
>information channels with propaganda and untruth? /Should/ we automate away 
>all the jobs, including the fulfilling ones? /Should/ we develop nonhuman 
>minds that might eventually outnumber, outsmart, obsolete and replace us? 
>/Should/ we risk loss of control of our civilization? Such decisions must not 
>be delegated to unelected tech leaders. *Powerful AI systems should be 
>developed only once we are confident that their effects will be positive and 
>their risks will be manageable.* This confidence must be well justified and 
>increase with the magnitude of a system's potential effects. OpenAI's recent 
>statement regarding artificial general intelligence 
>, states that /"At some 
>point, it may be important to get independent review before starting to train 
>future systems, and for the most advanced efforts to agree to limit the rate 
>of growth of compute used for creating new models."/ We agree. That point is 
>now.
>
>Therefore, *we call on all AI labs to immediately pause for at least 6 months 
>the training of AI systems more powerful than GPT-4*. This pause should be 
>public and verifiable, and include all key actors. If such a pause cannot be 
>enacted quickly, governments should step in and institute a moratorium.
>
>AI labs and independent experts should use this pause to jointly develop and 
>implement a set of shared safety protocols for advanced AI design and 
>development that are rigorously audited and overseen by independent outside 
>experts. These protocols should ensure that systems adhering to them are safe 
>beyond a reasonable doubt.^[4] This does /not/ mean a pause on AI development 
>in general, merely a stepping back from the dangerous race to ever-larger 
>unpredictable black-box models with emergent capabilities.
>
>AI research and development should be refocused on making today's powerful, 
>state-of-the-art systems more accurate, safe, interpretable, transparent, 
>robust, aligned, trustworthy, and loyal.
>
>In parallel, AI developers must work with policymakers to dramatically 
>accelerate development of robust AI governance systems. These should at a 
>minimum include: new and capable regulatory authorities dedicated to AI; 
>oversight and tracking of highly capable AI systems and large pools of 
>computational capability; provenance and watermarking systems to help 
>distinguish real from synthetic and to track model leaks; a robust auditing 
>and certification ecosystem; liability for AI-caused harm; robust public 
>funding for technical AI safety research; and well-resourced institutions for 
>coping with the dramatic economic and political disruptions (especially to 
>democracy) that AI will cause.
>
>Humanity can enjoy a flourishing future with AI. Having succeeded in creating 
>powerful AI systems, we can now enjoy an "AI summer" in which we reap the 
>rewards, engineer these systems for the clear benefit of all, and give society 
>a chance to adapt. Society has hit pause on other technologies with 
>potentially catastrophic effects on society.^[5]   We can do so here. Let's 
>enjoy a long AI summer, not rush unprepared into a fall.
>

-- 
Sent from my mobile phone. Please excuse my brevity and top-posting.
_

Re: [nexa] ChatGPT disabled for users in Italy

2023-04-02 Thread Stefano Zacchiroli
On Sun, Apr 02, 2023 at 06:34:50PM +0200, Maurizio Borghi wrote:
> aggiungerei soltanto che il problema principale emerge a mio parere
> dall'effetto congiunto di due dei profili di illegittimità individuati
> dal Garante: il trattamento di milioni di dati personali senza base
> giuridica E la sistematica produzione di informazioni false su
> soggetti interessati. Questo secondo profilo (riscontrabile da
> chiunque faccia uso del sistema), oltre a costituire un illecito di
> per sè, esclude secondo me categoricamente il "legittimo interesse"
> come possibile base giuridica del trattamento. Dunque si configura una
> violazione grave del GDPR che può anche motivare un provvedimento
> d'urgenza.

Se capisco bene, la seconda parte del tuo "E" qui sopra è il punto
seguente evocato da Carlo nella sua (ottima!, grazie!!) analisi:

> iii) l’inesattezza di dati personali rivelata dagli out-put errati
> della chat (questa è davvero significativa di un grave problema di
> comprensione del servizio stesso)

Che GhatGPT dica panzane a proposito di persone specifiche (viventi) è
in effetti evidente a tutti. Ma, da non giurista, faccio veramente
fatica a capire perché questo ponga problemi al Garante per la
protezione dei dati personali. Se pubblico un sito web pieno di panzane
su persone viventi, il Garante ha il potere di farmelo chiudere? Direi
(sempre da non giurista), che al massimo rischio una querela per
diffamazione dagli interessati.

Cosa sbaglio nella analogia e/o nella mia comprensione di questo aspetto
del problema?

Grazie a tutt*,
a presto!
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] ChatGPT disabled for users in Italy

2023-04-02 Thread Stefano Zacchiroli
Certo. Ma questo è l'altro aspetto: quello del trattamento dei dati in *input* 
a ChatGPT, che esiste ed è potenzialmente problematico dal punto di vista della 
privacy, a prescindere dalla veridicità delle risposte date.

La mia domanda era su quale sia l'impatto della falsità dell'*output* (che 
sollevavi come fattore a se stante nella mail precedente) sui profili giuridici 
di violazione della privacy.

Saluti

On April 2, 2023 11:22:03 PM GMT+02:00, Maurizio Borghi 
 wrote:
>On Sun, 2 Apr 2023 at 20:19, Stefano Zacchiroli  wrote:
>
>>
>> Che GhatGPT dica panzane a proposito di persone specifiche (viventi) è
>> in effetti evidente a tutti. Ma, da non giurista, faccio veramente
>> fatica a capire perché questo ponga problemi al Garante per la
>> protezione dei dati personali. Se pubblico un sito web pieno di panzane
>> su persone viventi, il Garante ha il potere di farmelo chiudere? Direi
>> (sempre da non giurista), che al massimo rischio una querela per
>> diffamazione
>
>
>Se la produzione di quelle panzane richiede il trattamento dei dati di
>milioni di ignari cittadini, allora sì, attrai le ire del Garante (oltre
>che quelle dei destinatari delle tue panzane).
>
>>
>> --
>___
>*Maurizio Borghi*
>Università di Torino
>https://www.dg.unito.it/persone/maurizio.borghi
>Co-Director Nexa Center for Internet & Society <https://nexa.polito.it/>
>
>My Webex room: https://unito.webex.com/meet/maurizio.borghi

-- 
Sent from my mobile phone. Please excuse my brevity and top-posting.
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Samsung workers made a major error by using ChatGPT. Samsung meeting notes and new source code are now in the wild after being leaked in ChatGPT

2023-04-06 Thread Stefano Zacchiroli
Grazie per la segnalazione. Osservo che questo passaggio:

On Wed, Apr 05, 2023 at 02:09:26PM +, Daniela Tafani wrote:
> The upshot is that in just under a month, there were three recorded
> incidences of employees leaking sensitive information via
> ChatGPT. Since ChatGPT retains user input data to further train
> itself, these trade secrets from Samsung are now effectively in the
> hands of OpenAI, the company behind the AI service.

smentisce alcuni delle ipotesi che sono circolate qui in lista nei
giorni scorsi, sul fatto che ChatGPT *non* usasse gli input per il
(re)training futuro. (Personalmente lo trovo poco sorprendente: non si
capisce perché dovrebbero rinunciare ad utilizzare dati "gentilmente
offerti" dagli utenti del servizio...)

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Samsung workers made a major error by using ChatGPT. Samsung meeting notes and new source code are now in the wild after being leaked in ChatGPT

2023-04-06 Thread Stefano Zacchiroli
On Thu, Apr 06, 2023 at 10:14:37AM +0200, Marco A. Calamari wrote:
> Pur senza avere certezze, non credo che sia possibile effettuare un retraining
> incrementale di un LLM.

Non conosco il caso specifico di ChatGPT, ma conosco abbastanza bene
quello dei large language models (LLMs) per il solo codice sorgente, dei
quali ChatGPT è un sovrainsieme.

Nello stato dell'arte nessuno fa retraining incrementale di LLM per il
codice, anche se è tecnicamente fattibile, perché è troppo costoso in
relazione a quanto ci si guadagna in termini di miglioramento dei
risultati. Ciò che si fa invece è periodicamente rifare l'addresstamento
di tutto il modello da zero, solitamente su dataset che nel frattempo
sono molto aumentati di volume (e potenzialmente qualità), e usando
pipeline di addestramento che sono anch'esse evolute rispetto alla
generazione precedente del LLM.

Da un punto di vista di politiche pubbliche, però, trovo che sia
assolutamente irrilevante se il (re)training di ChatGPT sia incrementale
o rifatto ogni volta a partire da zero. Il punto importante è che OpenAI
può tecnicamente stoccare e utilizzare in futuro gli input degli utenti
e quindi molto probabilmente lo farà --- nel modo tecnico che trova più
adeguato ai bisogni dell'azienda e fino a quando qualcuno, ad esempio un
regolatore pubblico, non impedirà loro di farlo.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] incontro OpenAI e Garante privacy

2023-04-06 Thread Stefano Zacchiroli
On Thu, Apr 06, 2023 at 01:08:47PM +0200, Stefano Quintarelli wrote:
> https://www.washingtonpost.com/technology/2023/04/05/chatgpt-lies/
> 
> se prima pensavo che l'opt out fosse sufficiente, forse mi ricredo e forse
> si arrivera' all'opt in.

Sulla stessa linea argomentativa:

  
https://arstechnica.com/tech-policy/2023/04/stable-diffusion-copyright-lawsuits-could-be-a-legal-earthquake-for-ai/

Sai mai che si riveli falsa l'ipotesi presa per buona dalla maggior
parte degli attori (a partire da GitHub Copilot, che in questo è stato
precursore) --- ovvero che sia fair use secondo il diritto americano
fare addestramento su contenti protetti da diritto d'autore...

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] China to require ‘security assessment’ for new AI products

2023-04-16 Thread Stefano Zacchiroli
On Sun, Apr 16, 2023 at 12:13:20PM +0200, Enrico Nardelli wrote:
> QUALUNQUE altro prodotto immesso nell'uso pubblico DEVE soddisfare
> requisiti di sicurezza.

... tranne il software. Certamente ci sarà qualche requisito che si
applica in automatico anche al software --- e mi appello anche io ai
giuristi in lista per precisarlo --- ma la barra di accesso al mercato
del software è bassissima. Di default, chiunque può pubblicare prodotti
software su svariati app store senza alcun controllo a monte (salvo
quelli automatici implementati dagli app store dei vari GAFAM).

Il CRA (Cyber Resilience Act) europeo va nella direzione di aggiungere
tali controlli, sotto forma di (auto-)certificazioni e questo ha
provocato una sollevata di scudi da parte del mondo free/open source
software. (Ne abbiamo già parlato separatamente in lista.)

Dico questo non per controbattere al tuo argomento, Enrico, che trovo in
se ragionevole. Ma per osservare che qui siamo anche perché per decenni
l'industria del software (compresa quella FOSS!, fatta anche di
volontari/ non-profit/ etc. che non potrebbero permettersi l'overhead
dei controlli) è fiorita grazie all'assenza dei controlli che ora si
invocano.

Trovare un giusto mezzo tra lo status quo ed il desiderio di
regolamentare prodotti "che contengono AI" non sarà affatto banale.

Saluti a tutti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Digital Services Act: Commission designates first set of Very Large Online Platforms and Search Engines

2023-04-26 Thread Stefano Zacchiroli
On Tue, Apr 25, 2023 at 03:38:19PM +, Daniela Tafani wrote:
> Today, the Commission adopted the first designation decisions under the 
> Digital Services 
> Act<https://digital-strategy.ec.europa.eu/en/policies/digital-services-act-package>
>  (DSA), designating 17 Very Large Online Platforms (VLOPs) and 2 Very Large 
> Online Search Engines (VLOSEs) that reach at least 45 million monthly active 
> users. These are:

Grazie Daniela. Per i francofoni segnalo questa lunga intervista
radiofonica a Thierry Breton di domenica scorsa, dove discuteva questo
tema (prima della pubblicazione della lista delle piattaforme):

  
https://www.radiofrance.fr/franceinter/podcasts/questions-politiques/questions-politiques-du-dimanche-23-avril-2023-4560369

Sulla lista in se, sono perplesso dall'inclusione di Wikipedia.

Certo: come traffico/numero di utenti i vari siti web di Wikipedia
rientrano negli obiettivi. Ma essendo operati da una non-profit
(Wikimedia Foundation) che ha un modello economico basato interamente
sulle donazioni, molte degli obiettivi politici del DSA risultano essere
"stonati" rispetto a Wikipedia/Wikimedia. Idem per il fatto che il
contenuto dell'enciclopedia è completamente curato da volontari, non da
staff della fondazione.

È lampante come tutte gli obblighi sulla pubblicità non siano
applicabili a Wikipedia, ma temo comunque che il costo di compliance con
il DSA possa finire per buttare un bel po' di sabbia negli ingranaggi
dell'enciclopedia libera. Vedremo...

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Fwd: The role of FOSS in preventing a recurrence of vehicle emissions scandals

2023-05-08 Thread Stefano Zacchiroli
È (purtroppo) un argomento fallace che vedo spesso circolare in ambiti
FOSS.

Se qualcuno (VW/Audi in questo esempio) sta commettendo qualcosa di
illegale, non si capisce perché ci si dovrebbe fidare degli stessi
quando dicono "tutto il software dell'auto è software libero; abbiamo
pubblicato i sorgenti qua: ". Se sono disposti a barare, possono
benissimo farlo anche quando dichiarano che il codice sorgente
pubblicato corrispondo a quello installato nei veicoli (quando ciò non è
vero). Non è certo la paura di non rispettare una licenza FOSS (ammesso
e non concesso che ci sia del copyleft nell'equazione) che farà loro
cambiare la bilancia costi/rischi/benefici.

Quindi serve un modo di permettere agli utenti delle auto di verificare
che il codice sorgente pubblicato corrisponda ai binari installati
nell'auto. Per tutto questo non bastano nemmeno i Reproducible Builds
(R-B) https://reproducible-builds.org/ , perché le auto di oggi sono
sistemi molto chiusi nel quale l'utente difficilmente riesce ad avere
accesso diretto al software installato. Ergo non ci si può basare sul
threat model di R-B (cf.: [1]) per una verifica basata su consenso di
build o terzi di fiducia.

Ricapitolando, una soluzione tecnologica lungo questo asse richiede: (a)
100% open source, (b) reproducible builds, (c) accesso completo ai
binari installati nell'auto. E tutto questo mi farebbe UN SACCO PIACERE.

Ma da un punto di vista di policy pubbliche, se dobbiamo imporlo per
legge, allora è molto più facile imporre il libero accesso per audit a
tutto il software in esecuzione in un'auto da parte del regolatore.

Ciao

[1]: Lamb, Chris, and Stefano Zacchiroli. "Reproducible builds:
 Increasing the integrity of software supply chains." IEEE Software
 39.2 (2021): 62-70. (Per farmi perdonare della auto citazione, ecco
 qua il preprint open access dell'articolo:
 https://hal.science/hal-03196519/ )


On Mon, May 08, 2023 at 06:11:37PM +0200, Andrea Trentini wrote:
> (mi allaccio al thread
> https://server-nexa.polito.it/pipermail/nexa/2022-December/049933.html e
> seguenti)
> 
> 
>  Forwarded Message 
> Subject: The role of FOSS in preventing a recurrence of vehicle emissions 
> scandals
> Date: Sat, 06 May 2023 16:58:09 +0300
> From: Lars Noodén 
> To: libreplanet-disc...@libreplanet.org
> 
> Recent news¹ reminds us that back in 2015 a whistleblower exposed the
> VW/Audi emissions scandal, which I guess had been going on since 1999.
> The companies executives used closed source, proprietary software in the
> vehicles to hide the fact that the vehicles were emitting 40 times the
> allowed NOx when actually out on the roads and not in the testing
> centers.  Even with fines and prison sentences, there is no way to be
> sure the companies are not working on more of the same -- unless the
> development is done out in the open.
> 
> Clearly we see both physical and economic harm from neglecting to
> require FOSS even in embedded computers, such as the 100+ now found in
> each new car.  because these companies have already shown that the
> closed source model *cannot* be trusted such style of development should
> not be allowed any more in regards to vehicles.  Surely a FOSS-based
> workflow can be figured out.
> 
> Perhaps it is a timely and appropriate topic for institutions like FSF,
> OSI, EFFI, and so on to address that publicly?  Even a short statement
> in passing would at least raise awareness and provide an opportunity to
> ratchet things forward in regard to Software Freedom.
> 
> /Lars
> 
> 
> ¹ Many sites on this topic, too, here is a small sample of three:
> 
> "Former Audi Chief to Plead Guilty in Emissions Scandal"
> https://www.nytimes.com/2023/05/03/business/diesel-emissions-scandal-audi-rupert-stadler.html
> 
> "Ex-Audi CEO to Plead Guilty Over 'Dieselgate' Scandal "
> https://www.voanews.com/a/ex-audi-ceo-to-plead-guilty-over-dieselgate-scandal-/7076658.html
> 
> "Former head of Audi to confess in 'dieselgate' fraud trial|
> https://www.dw.com/en/former-head-of-audi-to-confess-in-dieselgate-fraud-trial/a-65084639
> 
> ___
> libreplanet-discuss mailing list
> libreplanet-disc...@libreplanet.org
> https://lists.libreplanet.org/mailman/listinfo/libreplanet-discuss
> ___
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Sulla riproducibilita' del software

2023-05-29 Thread Stefano Zacchiroli
Salvo Marco, in termini generali: si molti partecipanti abituali di
questa lista si interessano al tema della riproducibilità del software,
sia in termini scientifici generali che più specificamente legati al
software. Personalmente sono implicato nei progetti seguenti che
potrebbero interessarti (e che molto probabilmente conosci già):

- Reproducible Builds (progetto spesso citato in lista):
  https://reproducible-builds.org/

- Software Heritage (idem): https://www.softwareheritage.org --- abbiamo
  parlato dei casi d'uso di Software Heritage per la riproducibilità
  scientifica, e più in generale per la scienza aperta, sia in un
  Mercoledì di Nexa di molti anni fa, sia più recentemente all'ultima
  Biennale Tecnologia in un paio di lezioni.

All'istituto Politecnico di Parigi dove lavoro abbiamo un paio di
tesi+PhD in corso su Nix/Guix (ambito: empirical software engineering),
ma per ovvi motivi geografici non rientrano nella tua specifica di
"mondo accademico italiano" :-)

A presto!
  

On Sun, May 28, 2023 at 09:27:04PM +0200, Marco via nexa wrote:
> Buonasera,
> sono uno studente dell'universita degli studi di Milano (UniMi), /lurker/ di 
> Nexa,
> amministratore di Sistema (DevOps/SRE) e da sempre "ambasciatore" della 
> liberta di espressione che
> per mia idea, si estende anche al concetto di liberta nel software (FOSS).
> 
> Negli ultimi anni mi sono avvicinato al concetto di /riproducibilita/,
> in particolare collegato al software (ma non sarebbe male averlo anche 
> hardware, trusting trust problem);
> questo mi ha portato a conoscere alcune tecnologie, in particolare guix 
> (https://guix.gnu.org/) e nix (https://nixos.org/).
> 
> Quindi mi (e vi) chiedo che genere di sensibilita c'e' qui sull'argomento e
> se qualcuno di voi ha avuto a che fare con le tecnologie da me citate, o in
> qualche modo con il tema della riproducibilita.
> 
> Mi interessa capire se ci sono i presupposti per dare un seguito ottimo lavoro
> accademico svolto dalla Francia sino ad ora sul tema, cfr.:
> 
> https://www.inria.fr/en/towards-reproducible-software-environments-hpc
> https://gitlab.inria.fr/guix-hpc/guix-hpc
> https://guix.gnu.org/en/publications/
> 
> Il fine ultimo, nel mio caso,
> sarebbe in qualche modo convergere verso un progetto di tesi che coinvolga
> in qualche misura la riproducibilita, sfruttando le tecnologie da me citate.
> Ma trasversalmente mi piacerebbe vedere piu attivita in generale, nel mondo 
> accademico italiano, sulla riproducibilita.
> 
> Vi ringrazio per l'attenzione :)
> 
> _______
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] From progress to innovation: neoliberalism and the expansion of intellectual property [Was: The Santiago Boys]

2023-08-18 Thread Stefano Zacchiroli
On Wed, Aug 16, 2023 at 03:57:03PM +0200, J.C. DE MARTIN wrote:
> Lunga recensione di taglio accademico:
> https://social-epistemology.com/2023/08/16/the-political-sins-of-cybernetics-a-review-of-evgeny-morozovs-the-santiago-boys-felipe-figueroa/

Bellissima recensione, grazie per la segnalazione. (Aggiungo: recensione
con abbastanza pochi "spoilers" sul podcast, quindi potete leggerla
anche senza averlo ascoltato.)

Grazie a questa lettura ho scoperto la tesi di dottorato dell'autore
della recensione, che è probabilmente di interesse per molti Nexiani, e
che quindi vi segnalo:

  Figueroa Zimmermann, Felipe (2020)

  From progress to innovation : neoliberalism and the expansion of intellectual 
property.

  PhD thesis, University of Warwick.

  Abstract:

Intellectual property law [hereon IP] is a particularly dynamic area of 
capitalist development. While the presence of IP in modern societies is 
pervasive, scholarly accounts of its explosive growth remain historically and 
disciplinarily bounded. This dissertation seeks to craft a more thorough 
account of the expansion of IP, by (1) tracing the changes in the concept of 
property in modern legal, economic and political discourse; (2) linking these 
conceptual changes to the process of expansion of IP; and (3) investigating the 
two-way relationship between the process of expansion of IP and the conceptual 
shifts in ownership.

The methodology of this desk-based research involved first surveying the 
literature regarding the expansion across disciplinary boundaries, covering 
mainly economics, political science and legal theory. Next, the dominant 
explanations given in each discipline to account for IP expansion were 
identified and contrasted in their strengths and weaknesses to integrate them 
by using methods adapted from conceptual history (mainly Begriffsgeschichte and 
the Cambridge Historical School). Four results chapters explore a series of 
political controversies linked to conceptual innovation starting in the late 
19th century and covering the 20th century. The approach showcases how the 
network of concepts to which we owe our current understanding of IP developed 
in a context of social, political and economic turmoil. Our perspective 
regarding the political significance of IP is thus illuminated by the 
consideration of the historical context.

A key finding is that the expansion of IP was made possible by a series of 
conceptual changes that resulted from the ideological efforts of neoliberals to 
rethink the conceptual categories of classical liberalism during the first 
decades of the 20th century. Building on this, x the work offers a prognosis of 
where the concept of property might be headed, as well as a normative 
evaluation of these developments.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] R: necessaria alfabetizzazione digitale - già Mozilla: "It’s Official: Cars Are the Worst Product ...

2023-09-21 Thread Stefano Zacchiroli
On Thu, Sep 21, 2023 at 11:44:54AM +0200, M. Fioretti wrote:
> On Thu, Sep 21, 2023 10:05:32 AM +0200, Giuseppe Attardi wrote:
> > Giustappunto, un dialogo tra sordi.  Mi attribuisce stupidaggini che
> > non ho detto solo per convincersi di aver ragione.
> 
> "Oggi però i nuovi servizi, come quelli basati su AI, richiedono
> ingenti investimenti" che implicitamente mette quella come unica via
> rimasta o quasi, non l'ho scritto io:

Potete per favore continuare in mail privata tra voi due?
Grazie anticipatamente.

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] [OT] il modello di business di Wikipedia (Wikimedia)

2023-09-24 Thread Stefano Zacchiroli
On Sun, Sep 24, 2023 at 08:19:56PM +0200, Alberto Cammozzo via nexa wrote:
> A mia conoscenza Wikimedia non profila i propri utenti, non usa
> recommendation systems per condizionarli, non adatta i contenuti a chi ha
> davanti, e non mi risulta nemmeno che venda a terzi i dati dei propri
> utenti, per cui il modello di business descritto dalla Zuboff come
> /surveillance capitalism/ non si applica.

Inoltre, dettaglio importante sul modello di business: Wikimedia, LLC
(l'azienda che opera il prodotto Wikimedia Enterprise) è detenuta al
100% da Wikimedia Foundation, che è una fondazione di tipo 501(c)3, che
potremmo tradurre in Italiano come ONLUS.

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] R: R: R: ‘Biggest act of copyright theft in history’: thousands of Australian books allegedly used to train AI model | Australia news | The Guardian

2023-09-29 Thread Stefano Zacchiroli
On Fri, Sep 29, 2023 at 05:33:04PM +0200, Lorenzo Albertini wrote:
> Non so in usa (fair use, che ha ambito applicativo alquanto vasto?)

La posizione (per ora non verificata in tribunale) di Microsoft/GitHub
per Copilot è esattamente che il training di modelli ML secondo il
copyright americano costituisca fair use. Nel caso dei libri questo non
evacua però (credo, IANAL, etc.) la domanda di Stefano Quintarelli su se
un contratto d'uso di un ebook impedisca comunque il training. (Nel caso
di Microsoft/GitHub la domanda invece non si poneva, perché avevano già
tutto il codice che "gentilmente" milioni di sviluppatori gli hanno
chiesto di ospitare...)

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Twenge, "Yes, it’s the phones (and social media)"

2023-12-13 Thread Stefano Zacchiroli
On Wed, Dec 13, 2023 at 04:54:00PM +0100, J.C. DE MARTIN wrote:
> *Jean M. Twenge
> Oct 18, 2023
> */https://jeanmtwenge.substack.com/p/yes-its-the-phones-and-social-media

Per chi si diverte al gioco "trova le 10 differenze", si può provare a
comparare questo pezzo con quest'altro di qualche mese fa:

  https://www.noahpinion.blog/p/honestly-its-probably-the-phones

(con tutti i limiti dello stile argomentativo di Noah Smith...)

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] piano nazionale francese per la scienza aperta 2021-2024

2021-07-08 Thread Stefano Zacchiroli
Il piano nazionale francese per la scienza aperta è stato aggiornato per
il periodo 2021-2024 e contiene moltissimi spunti e raccomandazioni su
software libero, dati aperti, e ovviamente pubblicazioni scientifiche
aperte.

Una versione corta in inglese è disponibile qui:

  https://www.ouvrirlascience.fr/second-national-plan-for-open-science/

Quella completa in francese è invece qui:

  https://www.ouvrirlascience.fr/deuxieme-plan-national-pour-la-science-ouverte/
  
https://www.ouvrirlascience.fr/wp-content/uploads/2021/06/Deuxieme-Plan-National-Science-Ouverte_2021-2024.pdf

Buona lettura
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Università Bologna, una laurea ad honorem a Eric Schmidt in Direzione Aziendale

2021-09-05 Thread Stefano Zacchiroli
On Sun, Sep 05, 2021 at 04:49:16PM +0200, alvise wrote:
> Unibo ovviamente ha il diritto di dare lauree ad onore a chi vuole, ma

Per quel che vale: questo laurea ad honorem è conferita dalla Bologna
Business School (fondazione che ha UniBo come socio fondatore) e non da
un corso di laurea di UniBo in quanto tale. È solo un distinguo molto
marginale, che non toglie molto alle critiche qui sollevate, ma lo cito
per dovere di chiarezza su chi/fa/cosa.

-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] [selfie] "Digital machines interest me"

2021-09-23 Thread Stefano Zacchiroli
On Thu, Sep 23, 2021 at 09:41:13AM +0200, J.C. DE MARTIN wrote:
> https://demartin.polito.it/digitalmachines

Grazie JC, scritto molto efficace e stimolate.

Un commento/domanda sul finale. Dopo il passaggio su "what digital
machines *could* do", mi aspettavo andassi a parare sul "what digital
machines *should* do", con tutte le considerazioni etiche e politiche
che ciò si porta appresso e che sono parte dell'ottimo lavoro nella
società fatto da Nexa in questi anni. Probabilmente consideri che sia un
punto già coperto dal "what machines do" generico. Se invece c'è un
motivo più specifico per non dirlo esplicitamente sono curiosissimo di
saperlo! :-)

Grazie per il testo e per la sua condivisione,
a presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] des quotas technologiques pour la souveraineté numérique

2021-10-03 Thread Stefano Zacchiroli
Quella delle "quote" è una proposta originale (nonché molto francese,
nel bene e nel male) all'interno del dibattito sulla sovranità digitale
nel cloud europeo, che molto abbiamo discusso su questa lista.

Da leggere qua:

  
https://www.solutions-numeriques.com/tribune-des-quotas-technologiques-pour-la-souverainete-numerique-par-jean-paul-smets-ceo-de-rapid-space/

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Bruno Le Maire et Cédric O saluent un nouveau partenariat majeur pour le cloud de confiance

2021-10-07 Thread Stefano Zacchiroli
On Thu, Oct 07, 2021 at 11:52:57AM +0200, Giuseppe Attardi wrote:
> Il link richiede credenziali di accesso.

Qua una versione aperta dello stesso (credo) pezzo:

  
https://datacenter-magazine.fr/bruno-le-maire-et-cedric-o-saluent-un-nouveau-partenariat-majeur-pour-le-cloud-de-confiance/

-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Bruno Le Maire et Cédric O saluent un nouveau partenariat majeur pour le cloud de confiance

2021-10-07 Thread Stefano Zacchiroli
On Thu, Oct 07, 2021 at 03:43:53PM +0200, Damiano Verzulli wrote:
> =
> Thales [...] will provide the guarantees of sovereignty required in France
> [...]
> 
> French companies and public institutions will thus be able to benefit from a
> set of cloud services:
> 
>  * operated by a new dedicated company incorporated under French law,
>majority owned by Thales;
>  * hosted in France, within an infrastructure separate from that of
>Google Cloud, the network and servers of which will be separated,
>controlled and operated by this company;
>  * with customer support provided by local teams;
>  * with security services provided by the new company, in particular
>identity management, data encryption, administration or even
>supervision;
>  * with updates received continuously but received, evaluated and
>validated within a security lock managed by Thales;
>  * managed on a sustainably designed infrastructure
> ==
> 
> Dunque, Google ci mette "solo" il software? Software, tra l'altro,
> caratterizzato da "technological openness" e "senza lock-in"?

No, ci mette molto di più, lo rivela secondo me il punto sugli update di
sicurezza. Questo sarà *il* cloud di Google, on premises di una nuova
azienda, che è solamente un sottile strato legale costruito per
rispettare la lettera (ma certamente non lo spirito) dei requisiti di
sovranità digitale francesi. Tutti i requisiti non funzionali della
specifica qua sopra saranno solamente promesse contrattuali che Google
farà come fornitore della nuova azienda.

Questo è esattamente il motivo per cui gli operatori di cloud francese
piccoli/medi protestano questa del "cloud de confiance" come una mano di
bianco sui servizi cloud dei soliti GAFAM.  Con Thales ben contenta (e
brava a farlo) di prendersi una fetta della torta.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader & OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] https://attivissimo.blogspot.com/2021/10/perche-questi-codici-qr-sembrano-green.html?m=1

2021-10-27 Thread Stefano Zacchiroli
On Wed, Oct 27, 2021 at 02:45:43PM +0200, Roberto Resoli wrote:
> Ora anche AH-1930 non valida più.

Qualcuno mi/ci spiega dove sono le catene di certificazione e le
eventuali liste di revoca?  Vorrei capire come sono effettuati i
deployment che portano a questi cambi di validità dei green pass
farlocchi.

Serve un aggiornamento della app di verifica (perché è lei che contiene
le informazioni di cui sopra)? Oppure è un aggiornamento lato server,
con la app che periodicamente verifica se deve aggiornare la sua copia
locale della lista di revoca?

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack . . o . . . o . o
Computer Science Professor . CTO Software Heritage . . . . . o . . . o o
Former Debian Project Leader . OSI Board Director  . . . o o o . . . o .
« the first rule of tautology club is the first rule of tautology club »
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Anagrafe on line

2021-11-16 Thread Stefano Zacchiroli
On Tue, Nov 16, 2021 at 12:37:35PM +0100, Antonio Iacono wrote:
> La distinzione tra APR e AIRE, tra l'altro, c'è solo nei totali, e se
> cerchi il tuo comune ti dà il totale degli "abitanti" compreso gli
> AIRE (mi immagino il sindaco del piccolo comune, ma questi mille
> abitanti in più da dove sono spuntati?)

Su questo punto, da iscritto AIRE da quasi 15 anni, mi sento di
rassicurarti: i comuni sono solitamente ben coscienti dei cittadini AIRE
a loro associati, perché siamo presenti sulle liste elettorali.

(Concordo invece sul tuo punto più generale che per la maggior parte
della popolazione residente in Italia questo servizio costituirà il loro
primo incontro con la sigla "AIRE".
Un buon vecchio AIRE non guasterebbe.)

En passant, osservo che per i residenti all'estero questo servizio è una
vera boccata di ossigeno amministrativa, perché ottenere certificati dai
consolati è attualmente molto macchinoso.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] martedì 30/11/2021: evento l'UNESCO per i 5 anni di Software Heritage

2021-11-29 Thread Stefano Zacchiroli
Salve Nexiane e Nexiani,

  domani, martedì 30 Novembre 2021, si terrà dalle 9:30 alle 12:30 un
evento all'UNESCO <https://events.unesco.org/event?id=1423818652&lang=1033>
a Parigi per i 5 anni di Software Heritage
<https://www.softwareheritage.org/2021/06/30/five-years-of-software-heritage/>.

Sarà un'occasione unica per saperne di più sullo stato attuale di
Software Heritage <https://www.softwareheritage.org/>, e scoprire perché
tale infrastrutture è importante per una moltitudine di attori,
dall'università agli archivisti di patrimonio culturale, dall'industria
all'amministrazione pubblica.

Sarà possibile seguire l'evento in diretta streaming. Il programma e le
informazioni di connessione sono disponibili a partire della pagina
dell'evento nell'agenda dell'UNESCO
<https://events.unesco.org/event?id=1423818652&lang=1033>.

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


[nexa] Coalition for Competitive Digital Markets - Open Letter: The EU Needs an Effective Digital Markets Act

2021-12-06 Thread Stefano Zacchiroli
Un ampio gruppo di SME europee (in larga parte con business model
attinenti a FOSS) si esprime su temi ampiamente discussi in lista, quali
la sovranità digitale, il ruolo dei GAFAM nel "cloud sovrano", etc. Più
dettagli ed il testo di una lettera aperta alle EU qui:

  https://competitivedigitalmarkets.eu/

-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Arbitrary code execution in iCloud, Twitter, Steam, CloudFlare, Amazon, Tesla, Baidu, Tencent

2021-12-14 Thread Stefano Zacchiroli
On Tue, Dec 14, 2021 at 12:42:35PM +0100, Roberto Reale wrote:
> L'informatica è fatta di bug almeno quanto di feature.
> 
> Ciò da cui non si può prescindere è una adeguata gestione degli incidenti,
> all'interno di un quadro di risk management.

Già.

Inoltre qua la discussione sulla presunta o reale competenza degli
sviluppatori di log4j mi sembra irrilevante.

Il punto principale è (come lo fu, questo si, nel caso di Heartbleed)
un'intera industria IT composta di giganti for-profit che dipendono da
software libero manutenuto da 3 volontari nel loro tempo libero:

  https://twitter.com/FiloSottile/status/1469441477642178561
  (e seguenti)

Chiamatelo "free riding" o, più prosaicamente, "sfruttamento", ma è
questo il problema da risolvere.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Il Louvre ha messo online gratuitamente la sua intera collezione d'arte – open access

2022-01-09 Thread Stefano Zacchiroli
Da archivista digitale, noto anche che dichiarano un identificativo ARK
(https://en.wikipedia.org/wiki/Archival_Resource_Key) per ogni foto
digitale delle opera, per esempio "ark:/53355/cl010064062" per Le radeau
de la Méduse di Géricault (resolver:
https://arks.org/ark:/53355/cl010064062 ) che è una best pratice nel
settore. È una dettaglio rispetto al lavoro colossale di
digitalizzazione/pubblicazione, ma è apprezzabilissimo. Bravi!

On Sun, Jan 09, 2022 at 12:38:41PM +0100, Margherita Salvadori wrote:
> Il Musée du Louvre ha pubblicato la sua intera collezione di opere da 
> visualizzare online gratuitamente.
> “Per la prima volta chiunque può accedere gratuitamente da computer o 
> smartphone all'intera collezione di opere, siano esse esposte nel museo, in 
> prestito, anche a lungo termine, o in deposito”: così ha dichiarato il 
> presidente-direttore del museo, Jean-Luc Martinez.
> 
> Si stima che siano state digitalizzate 482.000 opere d'arte ed ogni opera è 
> abbinata a dati come dimensioni, materiali e tecniche, storia dell'oggetto e 
> bibliografia.
> 
> Qui il link
> 
> https://collections.louvre.fr/
> 
> Buona domenica,
> 
> Margherita 

> ___
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] fondi istituzionali per FLOSS / infrastructure (was Re: A New Future for GnuPG)

2022-01-09 Thread Stefano Zacchiroli
On Sun, Jan 09, 2022 at 10:52:09PM +0100, Claudio Agosti wrote:
> Mozilla aveva fatto questo con il fondo MOSS (dopo la tragedia di
> heartbleed), ma vedere che sia un'istituzione (equivalente del ministero
> sviluppo economico) + una fondazione (openknowledge foundation)
> organizzarsi per farlo, sembra un gran bel segnale positivo.

Concordo sul fatto che i fondi istituzionali pubblici siano molto
meglio. Tanto più che sia il caso di MOSS, che casi analoghi anche più
recenti (tipo Essential Open Source Software for Science della Chen
Zuckerberg Initiative), anche se sono fondi cospicui *in aggregato*,
diventano poi pochi spiccioli per ogni progetto, che raramente
finanziano più di 1 anno di FTE, e lo fanno solo per 1 anno.  Il caso
tedesco con GnuPG qui è finanziamento strutturale nel lungo termine per
un progetto critico (anche se ormai sulla via del tramonto) per la
crittografia mondiale. Tutta un'altra storia, come lascia intendere
Werner Koch nel suo post.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Sorveglianza europea

2022-01-10 Thread Stefano Zacchiroli
Articolo in italiano (paywalled) su Domani --- che ha collaborato
assieme a The Guardian, Der Spiegel, e Mediapart, a questa bella
inchiesta --- disponibile qua:

  
https://www.editorialedomani.it/politica/europa/europol-sta-diventando-unagenzia-di-sorveglianza-di-massa-wqas30ly

Saluti

On Mon, Jan 10, 2022 at 02:00:32PM +0100, Vincenzo Mario Bruno Giorgino wrote:
> Traggo il brano sotto da
> https://www.theguardian.com/world/2022/jan/10/a-data-black-hole-europol-ordered-to-delete-vast-store-of-personal-data?CMP=Share_AndroidApp_Other
> 
> 
> ...A month after the data supervisor publicly admonished Europol, the
> agency came back with a question: if it wanted to train algorithms on the
> data it had already been admonished for retaining, could it start the data
> protection impact assessment process for this without EDPS oversight?
> The request makes it clear that the algorithms, which included facial
> recognition tools, would not be designed nor used to retrieve sensitive
> data such as health status, ethnic background, sexual or political
> orientation, even though, as Europol admitted, such data would inevitably
> be processed by the tools: “We recognise that the produced results will
> contain sensitive data and its processing will be in line with Europol
> Regulation.”
> 
> 
> Buona lettura.

> ___
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Il Louvre ha messo online gratuitamente la sua intera collezione d'arte – open access

2022-01-12 Thread Stefano Zacchiroli
On Wed, Jan 12, 2022 at 12:44:03PM +, deborah de angelis wrote:
> Nel settore GLAM (Gallerie, Biblioteche, Archivi e Musei), che è quello che
> riguarda la segnalazione del Louvre, anche a seguito dell'art. 14 della
> Dir. 790/2019/EU, nel caso in cui la riproduzione digitale riguardi
> un'opera dell'arte visiva che è caduta in pubbico dominio,  il materiale
> derivante dalla riproduzione (surrogato digitale), se non originale di per
> sè, dovrà essere anch'esso di pubblico dominio.

Su questo punto specifico, mi pare di ricordare (da mie ricerche
personali di un paio di anni fa) che l'asino caschi proprio sulla
condizione "se non originale di per se" (in inglese da
https://eur-lex.europa.eu/eli/dir/2019/790/oj : "unless the material
resulting from that act of reproduction is original in the sense that it
is the author's own intellectual creation").

I fotografi considerano in generale che le foto siano protette dal
diritto d'autore anche solo per la originalità conferita dalle scelte di
esposizione e inquadratura. La risultante tra questa posizione e
l'art. 14 mi pare sia tuttora una zona grigia di diritto d'autore che
varia da paese a paese.  Questo recente articolo divulgativo del IP
Helpdesk della EC (quindi potenzialmente "di parte"...) sembra
confermarlo:
https://intellectual-property-helpdesk.ec.europa.eu/news-events/news/about-artworks-pictures-artworks-and-possibility-copying-them-2021-12-13_en

Se questa dovesse essere tuttora la situazione, purtroppo non possiamo
quindi concludere che in generale le foto digitale di opere di dominio
pubblico siano esse stesse di dominio pubblico.

Se qualcuno è a conoscenza di case law europea recente sull'argomento
sono interessatissimo ad avere i riferimenti.

Grazie anticipatamente,
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] La razzia ai danni dei software liberi. Come arginare la predazione dei colossi digitali?

2022-02-08 Thread Stefano Zacchiroli
Grazie Davide, effettivamente non lo avevo ancora segnalato in lista,
principalmente perché speravo sarebbe stato poi messo in open access,
cosa che è effettivamente avvenuta (grazie Le Monde Diplomatique!), ma
solo pochi giorni fa.

A presto

On Tue, Feb 08, 2022 at 02:26:08PM +0100, D. Davide Lamanna wrote:
> 
> Non l'ho visto passare qui (sbaglio?). E' uscito a gennaio 2022 e dice le cose
> per bene:
> 
> <https://www.monde-diplomatique.fr/2022/01/O_NEIL/64221>.
> 
> 
> 
> (null)
> 
> 
> 
> (null)
> 
> 

> ___
> nexa mailing list
> nexa@server-nexa.polito.it
> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Education for peace, education for people

2022-03-03 Thread Stefano Zacchiroli
Ciao Silvia, bellissima iniziativa la tua!

On Thu, Mar 03, 2022 at 11:18:44AM +0100, Silvia Crafa wrote:
> Altra cosa: avete riferimenti a qualche buona analisi critica di
> Anonymous? È facile trovare cosa fanno, ma trovare buone discussioni
> su pro/contro è più complesso.

il testo migliore (anche nel senso di equilibrato che mi sembra tu
cerchi) penso rimanga ancora oggi quello di Biella Coleman del 2015:

  Hacker, Hoaxer, Whistleblower, Spy
  The Many Faces of Anonymous
  by Gabriella Coleman
  https://www.versobooks.com/books/2027-hacker-hoaxer-whistleblower-spy

Se vuoi farti un'idea sul taglio è facile trovare online svariati talks
di Biella sul lavoro di ricerca che è stato poi riassunto per arrivare a
quel libro.

Hope this helps,
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] FBI Gains Access to Sci-Hub Founder’s Google Account, Data

2022-03-04 Thread Stefano Zacchiroli
On Fri, Mar 04, 2022 at 03:37:34PM +0100, Andrea Trentini wrote:
> esatto, nulla di banale, oggi come oggi per fare ciò ti devi 
> smazzarti/soddisfare:
> 
> - DNS
> - SPF
> - DKIM
> - sysadmin/netadmin serie
> - un (bel) po' di security
> - ... ho sicuramente dimenticato tanta roba

Già, e a occhio (ma non ho verificato i dettagli) la lista Nexa spedisce
mail che da questi punti di vista sono migliorabili. Le classifica
spesso come SPAM anche il mio personalissimo server mail con
spamassassin, cosa che mi capita con poche altre liste.

-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Morozov: "Yanis Varoufakis on Crypto & the Left, and Techno-Feudalism"

2022-04-28 Thread Stefano Zacchiroli
On Sat, Apr 23, 2022 at 04:55:50PM +0200, J.C. DE MARTIN wrote:
> Lungo, interessante dialogo tra Morozov e Varoufakis su molti temi
> spesso discussi in lista:
> 
> https://the-crypto-syllabus.com/yanis-varoufakis-on-techno-feudalism/

Bellissima lettura, grazie per la segnalazione.

> Gli argomenti con cui YV argomenta che un nuovo sistema che lui chiama
> "tecno-feudalismo" starebbe prendendo il posto del capitalismo
> non mi convincono molto, ma mi sembrano degni di ulteriori riflessioni.
> Magari YV ha colto qualcosa che ancora mi sfugge, chissà...

Ne parliamo magari in un thread a parte, ma per quel che vale: esito
anche io tra interpretare i fenomeni che Varoufakis etichetta come
tecno-feudalismo come "solo" un aumento molto significativo nella
capacità del capitalismo delle piattaforme di estrarre (o estorcere?)
valore dal lavoro degli altri, ed interpretarli come il cambio di
paradigma che propone lui. Ad ogni modo, è una provocazione molto
stimolante.

> Il secondo commento è che mi farebbe molto piacere - dico davvero! -
> capire perché YV vede un potenziale positivo nelle tecnologie blockchain,
> anche se solo in una ipotetica società futura libera dei problemi
> strutturali attuali.

Premessa: se dovessi semplificare all'estremo, direi che YV è contrario
al 99% di tutto ciò che ruota attorno a cryptocurrencies/ blockchain/
DLT/ NFT. (Conoscevo già le sue posizioni specifiche sulle
cryptocurrencies come monete, da questa conversazione apprendo le sue
posizioni sul resto, che mi sembrano in linea con questa mia
semplificazione.) Effettivamente è interessante guardare in quel 1% di
positivo che lui sembra vederci.

Mi pare che ci veda due interessi principali:

- Rendere più facilmente accessibile/analizzabile lo stato globale delle
  transazioni registrate su una qualche blockchain, e quindi degli
  assets detenuti in ogni portafoglio. Lui sembra vederci qualcosa di
  positivo, sia nella possibilità di distribuire helicopter money a
  tutti senza intermediari in caso di bisogno, sia nella possibilità di
  tassare i patrimoni.

- Rompere il monopolio delle banche, centrali e non, su chi ha il potere
  di fornire un conto corrente ai cittadini.

Sono entrambi strumenti a doppio taglio (potremmo certamente stilare qui
in lista un elenco lunghissimo di cosa potrebbe andare storto...), ma mi
pare abbiano anche il potenziale positivo che ci vede lui.

Fine della mia esegesi (non autorizzata!) del Varoufakis pensiero :-)
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/   
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Francia e "Cloud sovrano"

2022-09-15 Thread Stefano Zacchiroli
On Thu, Sep 15, 2022 at 11:40:42PM +0200, Damiano Verzulli wrote:
> https://www.key4biz.it/cloud-sovrano-in-francia-il-governo-voltafaccia-ai-gafam-e-sostiene-lecosistema-nazionale-e-litalia/415944/
> A leggerla... viene voglia di migrare in Francia :-)

Mah..., resto scettico, visto come è andato il precedente grande
progetto di "motore di ricerca sovrano" da queste parti (leggi alla voce
Qwant). OVH è una bellissima azienda ma che ero più tranquillo prima di
questo endorsement politico, ecco :-) Il successo a medio/lungo termine
di aziende come OVH dipenderà più dalla capacità della regolamentazione
*europea* di incentivare mercati europei di "cloud independenti"
(termine che preferisco a "cloud sovrani") che non da endorsement
politici locali. Vedremo!

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] Francia e "Cloud sovrano"

2022-09-16 Thread Stefano Zacchiroli
On Fri, Sep 16, 2022 at 09:49:43AM +0200, Damiano Verzulli wrote:
> Personalmente credo che sia necessario "fare 'rumore'" nelle periferie
> Europee (aka: negli Stati) per portare poi Bruxelles a regolamentare
> adeguatamente (almeno... a provarci). La logica dovrebbe essere bottom-up
> (Stati=>Bruxelles), piuttosto che top-down (Bruxelles=>Stati).

Capisco il tuo pensiero, ma qua la discussione si sposta sostanzialmente
sulla tattica (geo)politica --- è più efficace implementare politiche
che favoriscano cloud indipendenti in tutta Europa bottom-up o top-down?
Da questo punto di vista, ritengo che sulla Francia tu ti illuda. Da un
punto di vista geopolitico pensano solitamente molto di più ai propri
interessi nazionali che a quelli europei (legittimamente o meno, non
voglio qui discuterlo). Quindi *se* OVH diventasse un campione nazionale
di cloud indipendenti per le PA francesi, non sarebbero certo loro a
promuovere regolamentazione europea che favorisca la nascita di *altri*
attori simili in altri stati membri; si accontenterebbero di essere
indipendenti in patria.

Quello che potrebbe accadere, e che va nella direzione di quello che mi
sembra essere il tuo pensiero, è che altri stati membri potrebbero a
quel punto indicare il caso francese come miglior pratica da imitare,
eventualmente facilitata da regolamentazione europea.

Comunque sia, per ora siamo nel campo della fantasia. Speriamo che un
attore come OVH possa affermarsi come cloud indipendente e vincere quote
di mercato molto più importanti di quelle di oggi ai GAFAM. Sarebbe già
un grandissimo risultato. Poi vedremo.

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] IGM rilascia il database di sintesi nazionale in opendata

2022-09-22 Thread Stefano Zacchiroli
On Wed, Sep 21, 2022 at 05:12:22PM +0200, Maurizio Napolitano via nexa wrote:
> Questo evidenzia che IGM - Istituto Geografico Militare ha lavorato
> per uniformare diverse banche dati e riconosce in OpenStreetMap una
> fonte autorevole al punto che si trova obbligato a rilasciare i dati
> in ODbL.

Grazie per la segnalazione Napo, molto interessante. Non ho seguito la
vicenda, ma sulla base di ciò che scrivi sembra un esempio
(relativamente raro, purtroppo) di copyleft che ha funzionato bene.

(Per chi in lista non dovesse essere avvezzo a questi dettagli: il
copyleft è una strategia legale che usa il diritto d'autore "contro se
stesso" per aumentare la quantità di contenuti liberi che esistono come
parte dei beni comuni digitale. Non tutte le licenze libere sono
copyleft. Nell'ambito delle licenze non concepite esplicitamente per il
software, ODbL, così come le varie CC BY-SA, sono licenze copyleft.)

Il copyleft non funziona in astratto, in particolare non basta
rilasciare un prodotto (o un database) sotto una licenza copyleft per
liberare altri contenti. È necessario che tale prodotto sia abbastanza
importante da rendere difficile ignorarlo. È il caso di Linux (il
kernel) per software open source copyleft; è il caso qui dei dati
cartografici di OpenStreetMap, che IGM non ha potuto ignorare.

Sebbene ODbL non sia la mia licenza preferita per i dati, questa mi
sembra chiaramente una storia di successo per il copyleft, per la
licenza, e per il progetto OpenStreetMap. Ottima notizia e
congratulazioni!

A presto,
-- 
Stefano Zacchiroli . z...@upsilon.cc . upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CTO Software Heritageo o o o   /\|^|/\
Former Debian Project Leader & OSI Board Director   '" V "'
___
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa


Re: [nexa] "Le gouvernement envisage de généraliser la vidéosurveillance algorithmique expérimentée pendant les JO"

2024-10-02 Thread Stefano Zacchiroli
On Wed, Oct 02, 2024 at 05:42:35PM +0200, J.C. DE MARTIN wrote:
> Fingere stupore...

Ho riso (amaro).

Nella mia piccola parte di mondo francese constato che alla Cité
Universitaire, sempre con la scusa delle olimpiadi, hanno aggiunto un
firewall Fortinet su tutto il traffico *uscente*, con configurazione
draconiana: tutti i domini web o "nuovi", o non ancora verificati da
Fortinet, non sono accessibili (man in the middle sui certificati SSL).

Inoltre, l'accesso a Tor è bloccato(!), ci si accede solo passando per
hidden bridge, la stessa modalità a cui devono ricorrere i dissidenti in
vari stati del mondo. (Ed in questo momento anche il sottoscritto in
Francia, a quanto pare.)

Tutto questo all'interno di un sito universitario, che accoglie decine
di migliaia di studenti e ricercatori ogni anno e che dovrebbe essere,
per contesto, un luogo di libera circolazione del sapere.

Vi lascio indovinare se, con la fine delle olimpiadi, tutto questo è
stato tolto o meno.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Diversi maintainer russi rimossi dal Kernel Linux

2024-11-05 Thread Stefano Zacchiroli
On Tue, Nov 05, 2024 at 09:03:22PM +0100, J.C. DE MARTIN wrote:
> Quindi che Linus sia finlandese, ecc., è del tutto irrilevante.

Completamente irrilevante.

La notizia è di un paio di settimane fa. La motivazione ufficiale è
stata poi "chiarita" da James Bottomley, qui:
https://lwn.net/ml/all/7ee74c1b5b589619a13c6318c9fbd0d6ac7c334a.ca...@hansenpartnership.com/
Cito:

> If your company is on the U.S. OFAC SDN lists, subject to an OFAC
> sanctions program, or owned/controlled by a company on the list, our
> ability to collaborate with you will be subject to restrictions, and
> you cannot be in the MAINTAINERS file.

Sostanzialmente, la Linux Foundation, trade association US-based, ha
ricevuto legal advice (non è chiaro se su input direttamente da
emanazioni del governo USA, od in auto-tutela) sul fatto che sia meglio
non essere "formalmente" associati con dipendenti di specifiche aziende
(Russe, in questo caso), per via delle sanzioni americane in vigore.

Un altro esempio di quando la geopolitica del mondo reale si incontra/
scontra con la presunta immaterialità del "cyberspazio", come dicevamo
molti anni fa
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] The US government wants devs to stop using C and C++ • The Register

2024-11-11 Thread Stefano Zacchiroli
On Sat, Nov 09, 2024 at 07:17:16PM +0100, Enrico Nardelli wrote:
> https://www.theregister.com/2024/11/08/the_us_government_wants_developers/
> 
> ...  the US Cybersecurity and Infrastructure Security Agency (CISA) and the
> Federal Bureau of Investigations (FBI announced they were doubling down on
> their efforts to persuade software manufacturers to abandon "memory-unsafe"
> programming languages such as C and C++  ...

La ricerca in sicurezza (più nella sua accezione "safety", in inglese,
che "security") è ormai inequivocabile sul fatto che niente riduce
quantitativamente le potenziali vulnerabilità in programmi scritti a
livello sistema ("systems programming") quanto l'uso di linguaggi che,
intrinsecamente, impediscono l'uso insicuro della memoria.  Non posso
quindi dare loro torto.

Ma l'aspetto più interessante qui è che un governo abbia un'opinione in
materia. Giusta o sbagliata che sia, il governo italiano ha un'opinione
su come rendere più sicuro il software strategicamente importante per il
paese nei prossimi 10-20 anni? (Mi scuso per la domanda retorica.)

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Diversi maintainer russi rimossi dal Kernel Linux

2024-11-07 Thread Stefano Zacchiroli
Ciao Enrico, 

On Thu, Nov 07, 2024 at 08:04:39PM +0100, Enrico Nardelli wrote:
> Inoltre chiedo per capire: ma la Cina e i programmatori cinesi come si
> situano in questo panorama di controllo degli USA su Linux?

premetto che, se ti riferisci a questo evento specifico, non concordo
con la caratterizzazione "controllo degli USA su Linux", principalmente
perché ci sono molti altri modi rispetto ad essere "MAINTAINER" per
contribuire.  Se invece lo intendevi in senso più lato, è una
discussione più complessa, ma certamente il tasso di contributi al
kernel Linux che vengono da dipendenti di multinazionali con sede negli
USA è molto alto. Vedi ad esempio qua le statistiche di origine di
contributi per azienda ad una versione recente del kernel (sotto la voce
"Most active 6.10 employers"): https://lwn.net/Articles/981559/ .

Le stesse statistiche rispondono anche in parte alla tua domanda sulla
Cina: dipendenti di Huawei contribuiscono copiosamente al kernel Linux
senza particolari problemi.

Sull'evento specifico, invece, se capisco bene le sanzioni evocate sono
legate alla guerra in Ucraina, e quindi abbastanza specifiche. Non ho
idea di quante e quali aziende cinesi ci siano nella "U.S. OFAC SDN
list", ma chiaramente non c'è Huawei.

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Diversi maintainer russi rimossi dal Kernel Linux

2024-11-08 Thread Stefano Zacchiroli
Ciao Enrico,

On Thu, Nov 07, 2024 at 10:11:52PM +0100, Enrico Nardelli wrote:
>  la Linux Foundation è una trade association US-based
[...]
> potrebbe non volerci molto al nuovo POTUS per far arrivare qualche
> "offerta che non si può rifiutare" alla Linux Foundation.
> 
> Ma forse sono paranoico io...

Sanissimo riflesso! :-)

Il mio sentimento generale (non verificato ne forse verificabile in
assenza di incidenti specifici) è che, nonostante la Linux Foundation
(LF) sia effettivamente una trade association US-based, il suo potere di
nuocere sullo sviluppo effettivo del kernel Linux rimanga limitato. Può
certamente influenzare le politiche di gestione del progetto (e lo ha
fatto in passato), ma alla fine della fiera paga lo stipendio di solo 2
sviluppatori (Linus e Greg) su migliaia di altri. Certamente questi 2
sono i "capi" del progetto, ma la stragrande maggioranza degli stipendi
viene da altrove.

Quindi, volendo cercare i punti di attacco dell'influenza USA sul
kernel, continuerei a preoccuparmi più delle big tech (tutte grandi
contributrici a Linux) che della LF.

(Ho un'opinione molto negativa *in generale* della LF per i danni che ha
fatto al mondo free/open source nei suoi decenni di esistenza, ma non
era questo il tema qui.)

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] The Curious Case of David Mayer, the man ChatGPT cannot name

2024-12-03 Thread Stefano Zacchiroli
Ciao Carlo,

On Mon, Dec 02, 2024 at 11:55:50PM +0100, Carlo Blengino wrote:
> La cosa più certa, al di là del caso Mayer, è che, mi pare, il GDPR se
> interpretato restrittivamente non è compatibile con la tecnologia degli
> LLM.

lo dici in considerazione del livello di difficoltà di cancellare da un
LLM dati che ha memorizzato e che, ai sensi del GDPR (interpretato
restrittivamente) devono essere dimenticati? Chiedo perché,
concettualmente, non vedo una profonda differenza tra un LLM che
memorizza qualcosa che non dovrebbe (ai sensi di GDPR) od un motore di
ricerca o ancora un archivio digitale. Ritieni che anche queste altre
tecnologie più datate siano fondamentalmente incompatibili con GDPR?

A me pare che la differenza sia solamente nella difficoltà di
cancellazione da un LLM, che oggi è oggettivamente molto alta (di fatto
l'unico modo sicuro è fare retraining dopo avere pulito il training
dataset, il che è molto costoso). Ma non è detto che questo difficoltà
tecnica resti tale in futuro --- penso ad esempio a potenziali progressi
nell'ambito del machine unlearning (mondo che alcuni Nexiani mi hanno di
recente fatto scoprire, h/t a Antonio e Maurizio).

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Things we learned about LLMs in 2024 [Being critical is a virtue]

2025-01-07 Thread Stefano Zacchiroli
On Tue, Jan 07, 2025 at 10:56:53AM +0100, Alberto Cammozzo via nexa wrote:
> <https://simonwillison.net/2024/Dec/31/llms-in-2024/>

Mi hai battuto sul tempo: ho finito di leggerlo stamattina e stavo per
segnalarlo in lista :-) Vale la lunga lettura, soprattutto per chi non
ha tempo di seguire nel dettaglio le evoluzioni tecniche (nel bene e nel
male), di un mondo tecnologico tuttora in rapido cambiamento. Oltre alla
parte "better criticism", che hai già evidenziato tu, ho trovato molto
interessante anche la parte sul consumo energetico (ancora una volta:
nel bene e nel male).

A presto
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Diversi maintainer russi rimossi dal Kernel Linux

2025-02-03 Thread Stefano Zacchiroli
Aggiornamento su quanto discusso qui sotto. Linux Foundation ha
pubblicato la loro analisi legale (o più probabilmente *parte* della
loro analisi legale, quella che possono scrivere pubblicamente) del più
generale impatto delle sanzioni OFAC sullo sviluppo collaborativo di
software open source, qua:

  
https://www.linuxfoundation.org/blog/navigating-global-regulations-and-open-source-us-ofac-sanctions

Buona lettura

On Tue, Nov 05, 2024 at 09:55:25PM +0100, Stefano Zacchiroli wrote:
> On Tue, Nov 05, 2024 at 09:03:22PM +0100, J.C. DE MARTIN wrote:
> > Quindi che Linus sia finlandese, ecc., è del tutto irrilevante.
> 
> Completamente irrilevante.
> 
> La notizia è di un paio di settimane fa. La motivazione ufficiale è
> stata poi "chiarita" da James Bottomley, qui:
> https://lwn.net/ml/all/7ee74c1b5b589619a13c6318c9fbd0d6ac7c334a.ca...@hansenpartnership.com/
> Cito:
> 
> > If your company is on the U.S. OFAC SDN lists, subject to an OFAC
> > sanctions program, or owned/controlled by a company on the list, our
> > ability to collaborate with you will be subject to restrictions, and
> > you cannot be in the MAINTAINERS file.
> 
> Sostanzialmente, la Linux Foundation, trade association US-based, ha
> ricevuto legal advice (non è chiaro se su input direttamente da
> emanazioni del governo USA, od in auto-tutela) sul fatto che sia meglio
> non essere "formalmente" associati con dipendenti di specifiche aziende
> (Russe, in questo caso), per via delle sanzioni americane in vigore.
> 
> Un altro esempio di quando la geopolitica del mondo reale si incontra/
> scontra con la presunta immaterialità del "cyberspazio", come dicevamo
> molti anni fa

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Stop Worshiping the American Tech Giants, by Lina Khan

2025-02-05 Thread Stefano Zacchiroli
On Wed, Feb 05, 2025 at 11:00:37AM +, Daniela Tafani wrote:
> Stop Worshiping the American Tech Giants, by Lina Khan - Feb. 4, 2025
> [...]
> <https://www.nytimes.com/2025/02/04/opinion/deepseek-ai-big-tech.html>

Tutto vero eh, però mi risulta difficilmente sopportabile come lettura,
in considerazione dei magrissimi risultati ottenuti dall'amministrazione
Biden sul fronte dell'antitrust contro le big tech. La stessa Khan ha
chiacchierato molto, e bene, una volta arrivata alla FTC, ma 4 anni dopo
i GAFAM sono ancora tutti li in ottima salute, senza che uno solo sia
stato spezzettato, alla faccia dell'unbundling di AT&T che lei stessa
cita in questo pezzo. Finirà che li spezzetterà Trump?  Sarebbe
veramente il colmo (ma di certo non me ne lamenterei!).

ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Nuovo Community Article "Licenze Creative Commons e Intelligenza Artificiale Generativa: una sinergia per la condivisione della conoscenza"

2024-12-20 Thread Stefano Zacchiroli
Grazie per la segnalazione.

Sullo stesso tema, segnalo questo report di Open Future (citati per un
altro lavoro nello stesso ambito anche dal Community Article di Nexa) e
Università di Amsterdam, uscito qualche mese fa:

  Kacper Szkalej, Martin Senftleben
  Mapping the Impact of Share Alike/Copyleft Licensing on Machine Learning and 
Generative AI
  
https://openfuture.eu/wp-content/uploads/2024/06/Share-Alike-and-ML-Report-FINAL.pdf

Si concentra sugli aspetti share-alike/copyleft e su come si potrebbero
far funzionare (spoiler: è complicati) nell'ambito di Gen AI.

Ciao

On Thu, Dec 19, 2024 at 09:31:01AM +, Nexa - Media wrote:
> Vi segnaliamo con piacere la pubblicazione di un nuovo articolo della
> sezione del nostro sito web "Community Articles", dal titolo "Licenze
> Creative Commons e Intelligenza Artificiale Generativa: una sinergia
> per la condivisione della conoscenza", a cura dell'Avv. Deborah De
> Angelis, Fellow del Centro Nexa.
> 
> L'articolo è consultabile al seguente link:
> https://nexa.polito.it/licenze-creative-commons-e-intelligenza-artificiale-generativa/


-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Meta: more (free) speech and fewer mistakes (it's time to get back to our roots around free expression).

2025-01-08 Thread Stefano Zacchiroli
On Wed, Jan 08, 2025 at 12:42:04PM +0100, 380° via nexa wrote:
> https://about.fb.com/news/2025/01/meta-more-speech-fewer-mistakes/

Osservo che i quotidiani nazionali italiani (almeno quelli che leggo io)
hanno dato parecchia rilevanza al fatto che John Elkann sia entrato nel
CdA di Meta, ma molta meno a quello che Dana White abbia fatto lo
stesso: https://en.wikipedia.org/wiki/Dana_White#Politics . Unite voi i
puntini numerati per passare da questo cambiamento nel CdA al
cambiamento di policy riportato da 380 (o viceversa).

Ciao
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] In a mirror

2025-01-05 Thread Stefano Zacchiroli
On Sun, Jan 05, 2025 at 07:56:39PM +0100, Alberto Cammozzo via nexa wrote:
> La domanda di Vallor è molto pragmatica: date le note conseguenze negative
> dell'uso massivo degli LLM, è giustificato il loro uso così estensivo?
> Salvano vite? Risolvono problemi veri? O la loro finale ragion d'essere sta
> solo nei profitti che generano?

Giustissimo, ma mi permetto di osservare che questo è un argomento
"jolly" che potremmo, e dovremmo, applicare a tutte le tecnologie
informatiche. Ci facciamo le stesse domande per YouTube (che, a oggi,
consuma ~250x volte l'energia di ChatGpt)? A me pare che il contraltare
dello hype pro-LLM è spesso uno hype *anti*-LLM, che rischia di
influenzare le nostre riflessioni collettive e portare fuori fuoco le
nostre critiche.

Buon anno a tutt*,
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Perché Richard Stallman sbaglia in tema di intelligenza artificiale

2025-02-14 Thread Stefano Zacchiroli
Beppe, immagino tu lo sappia visto che parli sia di DeepSeek che di
modelli piccoli, ma nel caso (e per gli altri): DeepSeek R1 è
disponibile anche in molte altre versioni, tra cui 1.5B, 7B e 8B
parametri, tutte con pesi distribuiti sotto licenza MIT. Le dimensioni
di questi 3 modelli sono tutte sotto i 5 GiB; la prima, 1.1 GiB, gira
anche su una GPU "dei poveri" come quella parecchio vecchia che ho sul
mio laptop. Vedi qua per il dettaglio di parametri vs dimensione dei
vari modelli: https://ollama.com/library/deepseek-r1/tags .

Per quanto riguarda la democratizzazione dell'*uso* *locale* (e quindi
indipendente) di questi modelli, le barriere stanno cadendo, non c'è
dibattito. Sugli altri fronti (addestramento, dataset, etc.) è un'altra
storia, ma il gradiente è comunque quello giusto.

Ciao

On Fri, Feb 14, 2025 at 08:59:31AM +0100, Giuseppe Attardi wrote:
> 
> 
> > On 13 Feb 2025, at 13:01, Fabio Alemagna  wrote:
> > 
> >> [...]
> >> Questo purtroppo in Italia ci è vietato dalla decisione del Garante della 
> >> Privacy che ci ha impedito l’accesso a DeepSeek.
> > 
> > Lo si può comunque scaricare sul proprio computer e farlo girare in locale. 
> > Qui un tutorial: https://www.datacamp.com/tutorial/deepseek-r1-ollama
> 
> Sto sperimentando coi modelli DeepSeek da parecchio tempo, prima che 
> diventassero famosi e non è così semplice.
> Il modello DeepSeek V3 ha 617B parameters, ossia occupa 1.2TB di memoria: 
> solo per caricarlo ci vogliono 8 GPU da 80GB.
> Lo dicono loro stessi, nel technical report, che il modello è pesante to 
> deploy e richiederà ulteriori studi.
> 
> Si possono usare modelli più piccoli, ma le prestazioni calano e comunque non 
> sono velocissimi.
> Il modello DeepSeek-Coder-33-instruct impiega circa 1 minuto a risposta.
> DeepSeek lascia a terze parti di offrire accesso online, perché non ce la 
> fanno.
> 
> Shameless push.
> Non avendo grandi risorse, siamo partiti dal più piccolo dei modelli e 
> abbiamo fatto SFT e RL con Preference Optimization sulla challenge Semeval 
> 2025 Tabular Question Answering. Ci siamo classificati secondi nella 
> categoria modelli piccoli.
> 
> > 
> > Fabio 

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Turing Award

2025-03-07 Thread Stefano Zacchiroli
On Fri, Mar 07, 2025 at 12:00:15PM +0100, maurizio lana wrote:
> reinforcement learning è quella cosa per cui decine di migliaia di persone
> in India, Filippine, Colombia, e da un po' anche in Europa, e in chissà
> quanti altri paesi, lavorano sottopagate e stressate per 'insegnare' a
> intelligentissimi sistemi artificiali cose che qualsiasi umano sa senza
> bisogno di apprendimento formale?

In realtà quello è il Reinforcement Learning from Human Feedback
(RLHF). Il reinforcement learning (RL) in se non ha alcun bisogno di
feedback *umano*. Il feedback in RL storicamente viene da funzioni
obiettivo misurabili. Un esempio classico è quello dell'allenamento di
un IA per partecipare ad un qualche gioco: non c'è bisogno di un umano
che dica se l'apprendimento sta andando nella direzione giusta o meno,
basta una implementazione delle regole del gioco.

Non ho verificato chi storicamente abbia inventato RLHF, ma il suo uso
più notorio è abbastanza recente: nel training di ChatGPT da parte di
Open AI, che non ha nulla a che vedere con i lavori di Barto e Sutton.

Possiamo eventualmente deplorare il fatto che RLHF sia *citato* nella
motivazione del premio come lavoro basato su RL, vedi qua
https://amturing.acm.org/ , ma il premio non è per quello.

Saluti
-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'


Re: [nexa] Osservatorio Nessuno

2025-05-14 Thread Stefano Zacchiroli
On Wed, May 14, 2025 at 06:51:52PM +0200, Osservatorio Nessuno via nexa wrote:
> Ciao! Siamo in mezzo a voi...

Ciao, brave e bravi! Sono stato qui in Francia tra i fondatori
dell'associazione Nos Oignons nel 2012 https://nos-oignons.net/ , che mi
pare abbia come scopo sociale lo stesso vostro. Non vi conoscevo prima
d'ora, ma sono lieto di scoprirvi grazie a questa segnalazione sulla
lista. Buon lavoro e a presto!

-- 
Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science  o o   o \/|V|\/
Télécom Paris, Polytechnic Institute of Paris o o o   <\>
Co-founder & CSO Software Heritageo o o o   /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro'" V "'