Buongiorno Giuseppe, (non so esattamente da cosa dipenda - usi la modalità digest? - ma il tuo client email continua a spezzare i thread e questo rende le discussioni in lista estremamente più difficoltose)
Giuseppe Attardi <atta...@di.unipi.it> writes: > Secondo Creative Commons, l’utilizzo di pagine web per l’addestramento > di modelli, costituisce “fair use”: > https://creativecommons.org/2023/02/17/fair-use-training-generative-ai/ Attenzione che Stefano si riferisce alla _redistribuzione_ del dataset di training, non del solo LLM >> From: Stefano Zacchiroli <z...@upsilon.cc> >>> On Tue, Feb 27, 2024 at 09:17:10AM +0100, Giuseppe Attardi wrote: >>> Facciamolo con fondi pubblici un modello davvero completamente Open, >>> dai dati di apprendimento, al codice, ai pesi del modello, ai test di >>> valutazione. >> >> Concordo con l'obiettivo e sul fatto che una AI che possa dirsi "open" >> (o meglio: "libera") dovrebbe esserlo in tutto: dataset di training, >> codice di training, codice di inferenza, pesi del modello. >> >> Ma attenzione al fatto che, a leggi vigenti, tale obiettivo non è >> raggiungibile per modelli a-la ChatGPT. Il motivo è che includono nei >> loro dataset di training grandi parti del Web (solitamente ottenute via >> crawling fatto in casa), che nessuna parte terza può legittimamente >> redistribuire, dato che solo una piccolissima parte del Web è >> disponibile sotto licenze libere. Quindi: siccome nei dataset di training c'è "roba" non libera, quella "roba" deve essere esclusa da un ipotetico dataset da redistribuire con una licenza libera. >> Una AI "libera", secondo i criteri accennati sopra, ha quindi oggi uno >> svantaggio competitivo enorme rispetto a quelle chiuse --- il che è >> molto deprimente. A meno che, invece che distribuire la "roba" proprietaria, non si forniscano le "ricette" necessarie affinché il codice di training sia in grado di andare a "leggerselo da solo" il materiale sul web: quello sarebbe "fair use", che è la stessa identica cosa che fanno quelli che sviluppano LLM proprietari Se non c'è la "roba" proprietaria ma solo "la ricetta" non c'è redistribuzione. [...] Saluti, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
signature.asc
Description: PGP signature
_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa