Re: [nexa] Microsoft, Mistral AI e l'AI Act

Giacomo Tesio Thu, 29 Feb 2024 01:16:02 -0800

Ciao Giuseppe,

Il giorno Thu, 29 Feb 2024 00:05:59 Giuseppe Attardi ha scritto:


> Potresti argomentare nel merito, per favore, piuttosto che
> argomentare ad hominem?

Scusa, ieri sera ero stanco e sono stato eccessivamente sintetico.

Partiamo dal rileggere la normativa in questione:

http://web.archive.org/web/20240210065634/https://www.law.cornell.edu/uscode/text/17/107

Come puoi leggere, quell'articolo garantisce un diritto di utilizzo
sottratto ai diritti esclusivi sanciti dal copyright, per finalità
necessarie al funzionamento della democrazia, ad esempio

- critica
- commento
- diffusione delle notizie
- insegnamento
- apprendimento (scholarship)
- ricerca

Già questo dovrebbe essere sufficiente, per chiunque comprenda come
funzionano questi software programmati statisticamente ad escluderne
qualsiasi forma di distribuzione commerciale (incluso la
realizzazione di SaaS) dal fair use: ben lungi dall'essere necessari
al funzionamento della democrazia, gli LLM la minano alla base, non
foss'altro che per il potere di influenzarne l'output che le pochissime
aziende in grado di realizzarli e mantenerli in funzione si riserva.


Spero poi sia inutile sottolineare qui come la scholarship che la norma
cita come esempio non abbia nulla a che vedere con la programmazione
statistica impropriamente chiamata "deep learning" o "machine learning".

Purtroppo, come certo saprai, la soverchiante maggioranza delle persone
che parlano di informatica non ha la più pallida idea di come questa
funzioni.

Il risultato di questa ignoranza diffusa è che avvocati autorevoli (nel
proprio campo) come quelli di creative commons, non hanno alcuna
percezione di quanto si rendono RIDICOLI sostenendo che le "AI
generative" di Stability AI e Midjourney 

> learn what images represent and create new images based
> on what they learn about the associations of text and images. 


Le "AI generative" non sono altro che software programmati
statisticamente eseguiti da macchine costruite allo scopo. 

Niente di più e niente di meno.


Quel software deriva dai testi utilizzati per programmarli in modo del
tutto equivalente a come un binario x86 deriva dal codice C da cui è
stato compilato: anche in quel caso c'è una perdita di informazione
(tutte le macro, i nomi delle variabili, le funzioni inlined etc...)
ma nessuno sostiene che il binario non sia più soggetto al diritto
d'autore di chi ha scritto il sorgente C.

Per i non programmatori potremmo dire che quel software deriva dai
testi utilizzati per programmarli in modo del tutto equivalente a come
un video MP4 rippato da un film Disney deriva dal DVD venduto dalla
Disney: il fatto che ci sia una perdita di definizione, non rende (che
io sappia) la distribuzione di copie di quel MP4 legale.


Per questo scrivevo "sono avvocati, mica informatici": potremmo essere
indulgenti perché non sanno di cosa parlano. Indulgenza che potrebbero
non meritare, visto che si rendono ridicoli sostenendo pubblicamente
una tesi che (guarda caso) supporta proprio gli interessi dei propri
supporters: https://creativecommons.org/support-cc/supporters/

Spero che sia chiaro come questa sia un'argomentazione di merito!



Si potrebbe poi obiettare che l'uso delle opere sotto copyright sia
stato fatto per finalità di ricerca, e come tale, sia ragionevolmente
sottoposto al "fair use".

Benissimo!

Sennonché

- se si considera il software programmato statisticamente 
  (impropriamente detto "modello AI") come output di quella
  ricerca, bisogna spiegare perché sia diventato segreto
  industriale di una manciata di ricchissime aziende USA

- più ragionevolmente si potrebbe sostenere che la ricerca si focalizzi
  sulla scoperta di nuove tecniche di programmazione statistica e
  nessuno vuole impedire tale ricerca! 

  Tuttavia, il fair use finisce alla pubblicazione del paper!

  Commercializzare SaaS basati sul software programmato
  statisticamente durante la ricerca, non può costituire "fair use":
  se lo fosse, basterebbe scrivere un paper su come decompilare un
  sorgente Windows per distribuire il sorgente decompilato liberamente.



Proseguendo nella lettura della normativa in questione, vediamo
elencati quattro fattori da considerare nel giudizio sul "fair use":

(1) the purpose and character of the use, including whether such use is
    of a commercial nature or is for nonprofit educational purposes; 
(2) the nature of the copyrighted work; 
(3) the amount and substantiality of the portion used in relation to
    the copyrighted work as a whole; and 
(4) the effect of the use upon the
    potential market for or value of the copyrighted work.

Le "AI generative" di cui parliamo sono software commerciali (punto 1)
Per programmarle sono stati utilizzate opere coperte da copyright nella
loro totalità (punto 2).
La natura dei lavori sotto copyright non è controversa: testi, immagini
etc... (punto 3)
La loro commercializzazione come SaaS riduce il mercato degli autori
(punto 4)


Guarda caso, gli avvocati di Creative Commons non hanno nemmeno provato
ad analizzare i casi in questione alla luce del testo della norma (di
cui pure citano i fattori da includere nella valutazione).

Invece si arrampicano ardite interpretazione di precedenti
cherry-picked per sostenere la tesi dei propri supporters,
la cui applicazione avrebbe conseguenze surreali.


Ad esempio, se scrivo un compilatore C per una mia VM e compilo il
decompilato di Microsoft Office, l'output è altamente trasformativo!

Il binario ottenuto in output sarà irriconoscibile.

Sarà pure meno efficente di quello di Microsoft, ma sarò felice di
rivendere la "suite di Giacomo" per un decimo del prezzo di Microsoft.

Se la trasformativeness è rilevante nel "fair use", allora è la fine
del copyright software. Il che va benissimo, purché valga per tutti.



Giacomo
_______________________________________________
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Re: [nexa] Microsoft, Mistral AI e l'AI Act

Reply via email to