Salve Fabio,
On Mon, 9 Sep 2024 12:45:09 +0200 Fabio Alemagna wrote:
> Quando un essere umano studia da un libro [...]
>
> La domanda conseguente dunque è: un essere umano viola il copyright
> apprendendo dai testi da cui studia?
Anzitutto, un essere umano è soggetto di diritti, un software no.
> La domanda era proprio cosa significa programmare con tecniche
> statistiche.
Significa utilizzare tecniche statistiche (raccolta dati,
regressioni lineari, medie, analisi delle frequenze, analisi dei
cluster, riduzioni della dimensionalità, etc...) per produrre
un software eseguibile da una s
>
> uno studente che si
> fa fare la tesi dai SALAMI viola il diritto d'autore (oltre che le
> norme, dai regolamenti di ateneo in su, che gli richiederebbero di
> produrre farina del suo sacco) se il testo che ha fatto proprio contiene
> frammenti letterali non correttamente attribuiti? E se viene
Dissento.
> On 9 Sep 2024, at 11:10, nexa-requ...@server-nexa.polito.it wrote:
>
> From: Giacomo Tesio
> ..l
>
>> On Mon, 9 Sep 2024 09:50:41 +0200 Giuseppe Attardi wrote:
>>
>> Che significa “software programmato statisticamente”?
>
> Un software (ovvero una sequenza di byte eseguibili da un
A questo proposito segnalo quanto sotto.
Ciao, Enrico
https://hechingerreport.org/kids-chatgpt-worse-on-tests/
Researchers at the University of Pennsylvania found that Turkish high
school students who had access to ChatGPT while doing practice math
problems did worse on a math test compared
Caro Stefano,
On Mon, 9 Sep 2024 11:33:44 +0200 Stefano Maffulli wrote:
> A me personalmente piacerebbe capire *perché*, prima di pensare a
> *se*, un LLM dovrebbe essere un'opera derivata dal dataset di
> addestramento.
La realtà può non piacerci, ma rimane pur sempre reale.
Un LLM è un'opera
Quando un essere umano studia da un libro, più libri, apprende non solo il
senso dei contenuti, e non solo è in grado di fare connessioni tra ciò che
ha appreso dai singoli libri, ma il più delle volte può anche recitare
interi passaggi di quei libri, sia essendone consapevole - quando voglia
effet
Salve Stefano,
On Mon, 9 Sep 2024 10:56:06 +0200 Stefano Zacchiroli wrote:
> La recitation è assolutamente *possibile* [...]
> La frequenza dipende da proprietà statistiche del training dataset
> [...]
> Quello che invece regolarmente fanno attori come GitHub con Copilot è
> di aggiungere a valle
On Mon, Sep 9, 2024 at 11:15 AM Stefano Zacchiroli wrote:
> Tutto questo non ci aiuta nel dibattito sul decidere se un LLM sia o
> meno un opera derivata dei suoi training input.
A me personalmente piacerebbe capire *perché*, prima di pensare a *se*, un
LLM dovrebbe essere un'opera derivata dal
Gentilissime, gentilissimi,
Vi ricordiamo che mercoledì 11 settembre, alle ore 17.00, si terrà il 175°
Mercoledì di Nexa
con un incontro dal titolo "Le emissioni segrete. L'impatto ambientale
dell'universo digitale".
Ospite dell'incontro: Giovanna Sissa (Università di Genova).
L'incontro si t
On Sun, Sep 08, 2024 at 04:24:00PM +0200, Guido Vetere wrote:
> La memorizzazione, insomma, è un caso degenere. Infatti, si applicano
> usualmente tecniche di filtering per deduplicare i passaggi che occorrono
> molte volte nei dataset di training, magari proprio perché gli umani li
> hanno plagiar
Salve Giuseppe,
On Mon, 9 Sep 2024 09:50:41 +0200 Giuseppe Attardi wrote:
> Che significa “software programmato statisticamente”?
Un software (ovvero una sequenza di byte eseguibili da una macchina con
una architettura nota in fase di compilazione) programmato attraverso
tecniche statistiche, o
> Il 8 Settembre 2024 14:24:00 UTC, Guido Vetereha scritto:
>>
>> Research has also shown that memorization occurs if
>> an LLM sees a text repeatedly during training (Carlini et al., 2022b;
>> Biderman et al., 2023).
>> Because of this, *memorization can be seen as an extreme case of training
>
13 matches
Mail list logo