Ciao Giuseppe, Il giorno Thu, 29 Feb 2024 00:05:59 Giuseppe Attardi ha scritto:
> Potresti argomentare nel merito, per favore, piuttosto che > argomentare ad hominem? Scusa, ieri sera ero stanco e sono stato eccessivamente sintetico. Partiamo dal rileggere la normativa in questione: http://web.archive.org/web/20240210065634/https://www.law.cornell.edu/uscode/text/17/107 Come puoi leggere, quell'articolo garantisce un diritto di utilizzo sottratto ai diritti esclusivi sanciti dal copyright, per finalità necessarie al funzionamento della democrazia, ad esempio - critica - commento - diffusione delle notizie - insegnamento - apprendimento (scholarship) - ricerca Già questo dovrebbe essere sufficiente, per chiunque comprenda come funzionano questi software programmati statisticamente ad escluderne qualsiasi forma di distribuzione commerciale (incluso la realizzazione di SaaS) dal fair use: ben lungi dall'essere necessari al funzionamento della democrazia, gli LLM la minano alla base, non foss'altro che per il potere di influenzarne l'output che le pochissime aziende in grado di realizzarli e mantenerli in funzione si riserva. Spero poi sia inutile sottolineare qui come la scholarship che la norma cita come esempio non abbia nulla a che vedere con la programmazione statistica impropriamente chiamata "deep learning" o "machine learning". Purtroppo, come certo saprai, la soverchiante maggioranza delle persone che parlano di informatica non ha la più pallida idea di come questa funzioni. Il risultato di questa ignoranza diffusa è che avvocati autorevoli (nel proprio campo) come quelli di creative commons, non hanno alcuna percezione di quanto si rendono RIDICOLI sostenendo che le "AI generative" di Stability AI e Midjourney > learn what images represent and create new images based > on what they learn about the associations of text and images. Le "AI generative" non sono altro che software programmati statisticamente eseguiti da macchine costruite allo scopo. Niente di più e niente di meno. Quel software deriva dai testi utilizzati per programmarli in modo del tutto equivalente a come un binario x86 deriva dal codice C da cui è stato compilato: anche in quel caso c'è una perdita di informazione (tutte le macro, i nomi delle variabili, le funzioni inlined etc...) ma nessuno sostiene che il binario non sia più soggetto al diritto d'autore di chi ha scritto il sorgente C. Per i non programmatori potremmo dire che quel software deriva dai testi utilizzati per programmarli in modo del tutto equivalente a come un video MP4 rippato da un film Disney deriva dal DVD venduto dalla Disney: il fatto che ci sia una perdita di definizione, non rende (che io sappia) la distribuzione di copie di quel MP4 legale. Per questo scrivevo "sono avvocati, mica informatici": potremmo essere indulgenti perché non sanno di cosa parlano. Indulgenza che potrebbero non meritare, visto che si rendono ridicoli sostenendo pubblicamente una tesi che (guarda caso) supporta proprio gli interessi dei propri supporters: https://creativecommons.org/support-cc/supporters/ Spero che sia chiaro come questa sia un'argomentazione di merito! Si potrebbe poi obiettare che l'uso delle opere sotto copyright sia stato fatto per finalità di ricerca, e come tale, sia ragionevolmente sottoposto al "fair use". Benissimo! Sennonché - se si considera il software programmato statisticamente (impropriamente detto "modello AI") come output di quella ricerca, bisogna spiegare perché sia diventato segreto industriale di una manciata di ricchissime aziende USA - più ragionevolmente si potrebbe sostenere che la ricerca si focalizzi sulla scoperta di nuove tecniche di programmazione statistica e nessuno vuole impedire tale ricerca! Tuttavia, il fair use finisce alla pubblicazione del paper! Commercializzare SaaS basati sul software programmato statisticamente durante la ricerca, non può costituire "fair use": se lo fosse, basterebbe scrivere un paper su come decompilare un sorgente Windows per distribuire il sorgente decompilato liberamente. Proseguendo nella lettura della normativa in questione, vediamo elencati quattro fattori da considerare nel giudizio sul "fair use": (1) the purpose and character of the use, including whether such use is of a commercial nature or is for nonprofit educational purposes; (2) the nature of the copyrighted work; (3) the amount and substantiality of the portion used in relation to the copyrighted work as a whole; and (4) the effect of the use upon the potential market for or value of the copyrighted work. Le "AI generative" di cui parliamo sono software commerciali (punto 1) Per programmarle sono stati utilizzate opere coperte da copyright nella loro totalità (punto 2). La natura dei lavori sotto copyright non è controversa: testi, immagini etc... (punto 3) La loro commercializzazione come SaaS riduce il mercato degli autori (punto 4) Guarda caso, gli avvocati di Creative Commons non hanno nemmeno provato ad analizzare i casi in questione alla luce del testo della norma (di cui pure citano i fattori da includere nella valutazione). Invece si arrampicano ardite interpretazione di precedenti cherry-picked per sostenere la tesi dei propri supporters, la cui applicazione avrebbe conseguenze surreali. Ad esempio, se scrivo un compilatore C per una mia VM e compilo il decompilato di Microsoft Office, l'output è altamente trasformativo! Il binario ottenuto in output sarà irriconoscibile. Sarà pure meno efficente di quello di Microsoft, ma sarò felice di rivendere la "suite di Giacomo" per un decimo del prezzo di Microsoft. Se la trasformativeness è rilevante nel "fair use", allora è la fine del copyright software. Il che va benissimo, purché valga per tutti. Giacomo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa