Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Maria Chiara Pievatolo
On 05/09/24 23:02, Daniela Tafani wrote: Axel Voss, MEP and host of today's event in the European Parliament, expressly thanks the scientists Dornis and Stober and is pleased that “the study not only proves that the training of Generative AI models is not covered by text and data mining, but

Re: [nexa] Confessions of a chatbot helper

2024-09-08 Thread Roberto Resoli
Il 7 settembre 2024 18:51:37 CEST, Antonio ha scritto: >"Working for an AI company as a writer was therefore a little like being told >you were going to be paid a visit by Dracula, and instead of running for the >hills, you stayed in and laid the table. But our destroyer is generous, the >pay s

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Antonio
> Domanda da inesperto: perchè non rafforzare Framasoft? Sì certo, si può rafforzare Framasoft o, meglio, i software utilizzati da Framasoft. Ad esempio Framapad, un editor di testo collaborativo ( https://framapad.org/abc/it/ ), si basa su un software libero, Etherpad ( https://github.com/ethe

[nexa] "Yuval Noah Harari’s Apocalyptic Vision"

2024-09-08 Thread J.C. DE MARTIN
“Although flesh and blood, Harari is Silicon Valley’s ideal of what a chatbot should be. He raids libraries, detects the patterns, and boils all of history down to bullet points.”* *Buona lettura! * *jc* Yuval Noah Harari’s Apocalyptic Vision * /His warning of AI’s dangers is alarming, but do

Re: [nexa] Confessions of a chatbot helper

2024-09-08 Thread Antonio
> Sembra che tutti questi sistemi "autonomi" in realtà non possano stare in > piedi senza un'enorme mole di lavoro umano, che però deve rimanere nascosto. Sì, ma qui il livello si alza. Non è più (o non solo) il lavoro umano degli "schiavi digitali" del Sud del mondo. Questi qua (OpenAI & C.) h

Re: [nexa] "Yuval Noah Harari’s Apocalyptic Vision"

2024-09-08 Thread Stefano Quintarelli via nexa
Un amico direttore editoriale, persona di cultura sterminata (legge tutti i libri che vengono sottomessi all'editore) dice che Harari è uno scrittore brillante ed elegantissimo. solo che dovrebbe andare nella narrativa, non nella saggistica come dargli torto ? On 08/09/24 11:02, J.C. DE MARTIN

Re: [nexa] "Yuval Noah Harari’s Apocalyptic Vision"

2024-09-08 Thread Franco Marra
Maybe Harari himself could be an AI produced by some GAFAM. Who knows? Il giorno dom 8 set 2024 alle ore 11:02 J.C. DE MARTIN < juancarlos.demar...@polito.it> ha scritto: > “Although flesh and blood, Harari is Silicon Valley’s ideal of what a > chatbot should be. He raids libraries, detects the p

Re: [nexa] Confessions of a chatbot helper

2024-09-08 Thread Andrea Bolioli
grazie per la segnalazione, è utile che ogni tanto qualcuno ritiri fuori il tema degli annotatori umani e del training dei sistemi. Hanno/abbiamo sempre fatto parte dello sviluppo dei sistemi NLP, e ne facciamo parte anche per l'AI generativa. Non male l'immagine di Dracula... AB Il giorno dom 8

Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Guido Vetere
Tutto questo parlare di SALAMI mi ha fatto venire in mente un motto di spirito che si ascolta talvolta ai tavoli di progettazione: "fare il maiale dalla salsiccia", cioè ricostruire il modello originale dai dati di cui si dispone. Si tratta ovviamente di un paradosso, perché certi processi di trasf

Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Maria Chiara Pievatolo
On 08/09/24 12:31, Guido Vetere wrote: Quando un LLM 'rigurgita' un frammento (ma questo è un evento eccezionale) lo fa comunque in un processo generativo non deterministico in cui quel frammento diviene temporaneamente "attrattore" in forza delle "tracce mnestiche" che ha prodotto nei parametri

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread GC F
La τέχνη specifica è irrilevante. Il principio generale di cui si discute (dicotomia idea/espressione) fa riferimento all'estrazione di conoscenza non proteggibile, in qualsiasi forma, da espressioni proteggibili in base ai requisiti di proteggibilità del diritto d'autore. Che sia propriamente text

Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Giacomo Tesio
Salve Guido, On Sun, 8 Sep 2024 12:31:14 +0200 Guido Vetere wrote: > L'analogia tra i LLM e i dati (immagini, testi) compressi con o senza > perdita è totalmente fuorviante, perché nei miliardi di parametri di > una rete neurale non si può ricavare all'inverso il dataset di > training, né se ne p

[nexa] dum Romae consulitur Saguntum expugnatur?

2024-09-08 Thread maurizio lana
"Valditara: sperimentazione AI a scuola. Sperimentazione partirà in 15 classi" https://www.rainews.it/articoli/ultimora/valditara-sperimentazione-ai-a-scuola-68f6ca8a-5855-4f57-8413-0d6df5d06b40.html "Siamo uno dei primi Paesi ad avere avviato quest'anno scolastico una sperimentazione nell'utili

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
Ciao Maria Chiara, riporto il subject al valore iniziale perché non ho molto da aggiungere sugli interessi rappresentati da Axel Voss: le norme su copyright, brevetti e segreti industriali sono intrinsecamente oscurantiste, e rallentano il progresso culturale e tecnologico dell'umanità vietando al

Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Guido Vetere
> > potremmo accusarlo a ragione di aver violato il copyright (diritto morale dell'autore compreso) oppure potrebbe discolparsi dicendo che le riproduzioni sono (un raro) esito di un processo generativo non deterministico? in ogni caso lo studente non avrebbe presentato un elaborato originale:

Re: [nexa] AI Training is Copyright Infringement - Axel Voss

2024-09-08 Thread Guido Vetere
> > Suvvia, non servono supercazzole su Nexa: ci sono migliaia di esempi di > LLM che restituiscono frammenti più o meno vasti di opere riconoscibili > attribuendole a persone inesistenti e magari con licenze inesistenti Tesio, se vuole risposte di merito da me, provi a formulare le sue osservazi

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
Caro Giancarlo, On Sun, 8 Sep 2024 13:46:50 +0100 GC F wrote: > La τέχνη specifica è irrilevante. Non parliamo infatti di tecniche ma di finalità. Il data mining è definito dalla finalità di estrarre informazioni intellegibili da grandi volumi di dati, NON dal generare in output testi o imma

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Guido Vetere
> > Microsoft stessa non nega la natura di opera derivata dei LLM (pur > tentando disperatamente di giustificarla). Ad esempio in "Elephant > never forget..." [2] i suoi ricercatori scrivono: "This investigation > reveals that LLMs have memorized many popular tabular datasets verbatim". per comp

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
Vedi Guido, Il 8 Settembre 2024 14:24:00 UTC, Guido Vetereha scritto: > > Research has also shown that memorization occurs if > an LLM sees a text repeatedly during training (Carlini et al., 2022b; > Biderman et al., 2023). > Because of this, *memorization can be seen as an extreme case of traini

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Guido Vetere
Caro Tesio, apprezzo il tono e dunque rispondo. Sembra un caso degenere perché immagini un'intelligenza artificiale che > impara. Fin dai tempi del povero Rosenblatt (morì giovane in un incidente) e dal suo percettrone, l'umanità intera ha immaginato una 'intelligenza artificiale che impara' (ma

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread GC F
Quel che conta è che si utilizzino espressioni proteggibili per creare/addestrare uno strumento che genera espressioni diverse e trasformative rispetto a quelle proteggibili utilizzate come input per l’addestramento. Anche se il processo di training AI si basa su riproduzioni meccaniche di opere ne

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Franco Marra
Scusate la domanda *molto* ingenua: non si potrebbe discutere di quanto associato all'output di un LLM partendo dal concetto di '"opera derivata" nel senso dei Creative Commons? https://it.wikipedia.org/wiki/Opera_derivata Il giorno dom 8 set 2024 alle ore 17:34 GC F ha scritto: > Quel che conta

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Antonio
> Confesso che trovo la tua idea che un LLM sia un 'compilato' dei dataset di > training molto interessante, però non mi convince per due motivi: A me invece convince :) Prendo a prestito llama.cpp (già citato in passato). Per "produrre" una chat, una delle linee di comando possibile è questa: ./l

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
In realtà Giancarlo ho ben chiaro il dibattito in corso, gli interessi in gioco, le "strane alleanze" e i fiumi di soldi che stanno inquinando questo dibattito. E sono rassegnato al divorzio dalla realtà che tutto ciò comporta. Tuttavia, da informatico più interessato allo stato di diritto che

Re: [nexa] dum Romae consulitur Saguntum expugnatur?

2024-09-08 Thread Stefano Borroni Barale
Buonasera a tutte/i, se devo dire la cosa che mi colpisce di più è la schizofrenia del ministro, che salta come un puntina di un mangiadischi portatile dalla tecnofobia delle sue regole auree per il digitale a scuola a questa 'sperimentazione' tecnoentusiasta improvvisata in 15 scuole. Va bene c

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread GC F
Si, ma l'uso del materiale per creare il software che poi genera a sua volta è a fini trasformativi! Il materiale non è usato per il suo valore espressivo, quindi la creazione del software/modello non ha effetti sul valore di mercato dell'opera originale utilizzata - non la sostituisce. Si potrebbe

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Maria Chiara Pievatolo
On 08/09/24 15:48, Giacomo Tesio wrote: L'eseguibile che i fautori delle "AI generative" chiamano impropriamente "modello" subisce una compressione concettualmente analoga attraverso il processo di compilazione dei dataset sorgenti. Ti segnalo uno studio sulla possibilità di mantenere la pubb

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
Caro Giancarlo, Mi spiace averti stancato, per cui non ti tedierò con le ovvie differenze fra un LLM (che è una compressione lossy eseguibile dei testi sorgente) e Google Books (che è una semplice interfaccia web su _estratti_ di quei testi). Tuttavia credo sia importante chiarire un aspetto c

Re: [nexa] AI Training is Copyright Infringement

2024-09-08 Thread Giacomo Tesio
On Sun, 8 Sep 2024 17:12:23 +0200 Guido Vetere wrote: > Su cosa cosa significhi 'imparare' per gli umani e per le macchine si > sono versati fiumi di inchiostro, non credo sia il caso di dilungarsi > qui. Direi piuttosto che fiumi di inchiostro sono stati versati per giustificare la ridefinizion