Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giacomo Tesio
Salve Fabio, On Mon, 9 Sep 2024 12:45:09 +0200 Fabio Alemagna wrote: > Quando un essere umano studia da un libro [...] > > La domanda conseguente dunque è: un essere umano viola il copyright > apprendendo dai testi da cui studia? Anzitutto, un essere umano è soggetto di diritti, un software no.

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giacomo Tesio
> La domanda era proprio cosa significa programmare con tecniche > statistiche. Significa utilizzare tecniche statistiche (raccolta dati, regressioni lineari, medie, analisi delle frequenze, analisi dei cluster, riduzioni della dimensionalità, etc...) per produrre un software eseguibile da una s

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Guido Vetere
> > uno studente che si > fa fare la tesi dai SALAMI viola il diritto d'autore (oltre che le > norme, dai regolamenti di ateneo in su, che gli richiederebbero di > produrre farina del suo sacco) se il testo che ha fatto proprio contiene > frammenti letterali non correttamente attribuiti? E se viene

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giuseppe Attardi
Dissento. > On 9 Sep 2024, at 11:10, nexa-requ...@server-nexa.polito.it wrote: > > From: Giacomo Tesio > ..l > >> On Mon, 9 Sep 2024 09:50:41 +0200 Giuseppe Attardi wrote: >> >> Che significa “software programmato statisticamente”? > > Un software (ovvero una sequenza di byte eseguibili da un

Re: [nexa] dum Romae consulitur Saguntum expugnatur?

2024-09-09 Thread Enrico Nardelli
A questo proposito segnalo quanto sotto. Ciao, Enrico https://hechingerreport.org/kids-chatgpt-worse-on-tests/ Researchers at the University of Pennsylvania found that Turkish high school students who had access to ChatGPT while doing practice math problems did worse on a math test compared

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giacomo Tesio
Caro Stefano, On Mon, 9 Sep 2024 11:33:44 +0200 Stefano Maffulli wrote: > A me personalmente piacerebbe capire *perché*, prima di pensare a > *se*, un LLM dovrebbe essere un'opera derivata dal dataset di > addestramento. La realtà può non piacerci, ma rimane pur sempre reale. Un LLM è un'opera

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Fabio Alemagna
Quando un essere umano studia da un libro, più libri, apprende non solo il senso dei contenuti, e non solo è in grado di fare connessioni tra ciò che ha appreso dai singoli libri, ma il più delle volte può anche recitare interi passaggi di quei libri, sia essendone consapevole - quando voglia effet

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giacomo Tesio
Salve Stefano, On Mon, 9 Sep 2024 10:56:06 +0200 Stefano Zacchiroli wrote: > La recitation è assolutamente *possibile* [...] > La frequenza dipende da proprietà statistiche del training dataset > [...] > Quello che invece regolarmente fanno attori come GitHub con Copilot è > di aggiungere a valle

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Stefano Maffulli
On Mon, Sep 9, 2024 at 11:15 AM Stefano Zacchiroli wrote: > Tutto questo non ci aiuta nel dibattito sul decidere se un LLM sia o > meno un opera derivata dei suoi training input. A me personalmente piacerebbe capire *perché*, prima di pensare a *se*, un LLM dovrebbe essere un'opera derivata dal

[nexa] MEMENTO | 175° Mercoledì di Nexa | 11 settembre 2024, ore 17.00

2024-09-09 Thread Nexa - Media
Gentilissime, gentilissimi, Vi ricordiamo che mercoledì 11 settembre, alle ore 17.00, si terrà il 175° Mercoledì di Nexa con un incontro dal titolo "Le emissioni segrete. L'impatto ambientale dell'universo digitale". Ospite dell'incontro: Giovanna Sissa (Università di Genova). L'incontro si t

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Stefano Zacchiroli
On Sun, Sep 08, 2024 at 04:24:00PM +0200, Guido Vetere wrote: > La memorizzazione, insomma, è un caso degenere. Infatti, si applicano > usualmente tecniche di filtering per deduplicare i passaggi che occorrono > molte volte nei dataset di training, magari proprio perché gli umani li > hanno plagiar

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giacomo Tesio
Salve Giuseppe, On Mon, 9 Sep 2024 09:50:41 +0200 Giuseppe Attardi wrote: > Che significa “software programmato statisticamente”? Un software (ovvero una sequenza di byte eseguibili da una macchina con una architettura nota in fase di compilazione) programmato attraverso tecniche statistiche, o

Re: [nexa] AI Training is Copyright Infringement

2024-09-09 Thread Giuseppe Attardi
> Il 8 Settembre 2024 14:24:00 UTC, Guido Vetereha scritto: >> >> Research has also shown that memorization occurs if >> an LLM sees a text repeatedly during training (Carlini et al., 2022b; >> Biderman et al., 2023). >> Because of this, *memorization can be seen as an extreme case of training >