Ciao 380, Il 30 Settembre 2023 14:03:23 UTC, "380°" <g...@biscuolo.net> ha scritto: > > in direi che tra colleghi di questa lista ogni tanto possiamo anche > perdonarci qualche imprecisione terminologica
Naturalmente! Ma di fronte a termini ambigui ed evocativi che impediscono ai più di comprendere la natura di ciò di cui stiamo parlando, credo che sia doveroso fare chiarezza. > > Dunque il modello CONTIENE, seppur in forma difficile da estrarre e > > non necessariamente corrispondente all'intento comunicativo dei > > rispettivi autori, ampie parti dei testi originali. > > ecco: qui proprio non capisco quello che vuoi dire > > stai dicendo che quelle parti di testo, che sono espresse in /forma/ > difficilmente estraibile, sarebbero plagio (ampie parti dei testi > originali)? Se siano plagio o semplicemente opere derivata create e distribuite senza il permesso dell'autore è una valutazione giuridica che non so fare. Sto semplicemente dicendo che quei testi sono in gran parte presenti nel LLM seppure codificati con perdita di informazione. Una similitudine tecnicamente più attinente di uno zip sarebbe un jpeg o un mp3, ma non volevo confondere ulteriormente il mio interlocutore. > > Un esempio particolarmente lampante di questo meccanismo fu > > evidenziato con Microsoft Copilot (aka CopyALot) che distribuì codice > > sotto GPL in violazione della stessa, copiando alla lettera il > > sorgente ma (guarda caso) attribuendogli una licenza permissiva ed un > > autore inesistente. > > già, ma come ha fatto CopyALot, **se** è un LLM, a riprodurre alla > lettera il sorgente? I ricercatori di Microsoft scrissero che lo faceva per "rompere il ghiaccio" in presenza di poche informazioni sulle esigenze dell'utente. Comunque non si tratta di barare in questo caso: si tratta solo di probabilità. Qualche volta CopyALot restituirà lo stesso codice, altre volte rimpiazzerà alcuni identificativi con l'equivalente di uno string replace. Ripeto, a me può anche stare bene purché io possa nello stesso modo disassemblare Microsoft Windows o Microsoft Office e distribuirne il codice sotto GPL, magari attribuendolo a Mickey Mouse. Non sono contrario alla abolizione delle varie forme di "proprietà intellettuale", voglio solo sia esplicita e valga per tutti. Ma finché non posso usare come mi piace il codice di Microsoft, Microsoft non deve usare come le pare il mio. > > Violazioni particolarmente gravi perché il codice GPL viene poi > > incluso in prodotti proprietari. > > se permetti, sono stracavolacci di quelli che copia-incollano l'output > da CopyALot, non ho verificato ma scommetto un fiorino che è pure > scritto chiaramente nelle condizioni di utilizzo del servizio No 380: se io voglio riservare alla collettività un mio pezzo di codice utilizzando una licenza copyleft (metti la AGPL) e Microsoft lo distribuisce senza attribuzione e con licenza sbagliata, buttandolo in mezzo ad un software proprietario di un proprio cliente pagante, se permetti "sono stracavolacci" miei. Subisco un danno morale ed economico. E quel che è peggio, non ho alcun modo di individuare precisamente quanto grave sia questo danno morale, ovvero in quanti software proprietari che aborro il mio lavoro sia stato inserito. La responsabilità del programmatore che riceve il mio codice da CopyALot viene dopo: prima Microsoft ha realizzato un opera derivata dal mio codice (il "modello" di Copilot) che distribuisce il mio codice senza permesso quando deve "rompere il ghiaccio". > quale sarebbe la violazione del diritto d'autore, se non c'è plagio *e* > chi usa quei testi per usarli in una elaborazione ha *pagato* "i libri"? Anche ne avesse comprate un milione di copie, non avrebbe alcun diritto di creare opere derivate. Quanti testi CC-BY ND sono stati usati da OpenAI per programmare statisticamente ChatGPT? Quanti CC-BY SA? IMHO ha violato e sta violando entrambe le licenze. E quel che è peggio è che sta violando i diritti morali degli autori. Giacomo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa