Il 28 Giugno 2024 21:45:36 UTC, Guido Vetere ha
scritto:
> 'aperti' nel senso di huggingface, cioè li puoi scaricare e l'architettura
> della rete è pubblica, ma certo che non ti danno i dataset di addestramento
Perché "certo"?
Da quando un binario opaco è "aperto" per il solo fatto di essere s
Buongiorno,
Guido Vetere writes:
[...]
> Google ha rilasciato gemma2, un modello 'aperto' da soli 9B (gira pressoché
> ovunque) che sembra (a prima vista) sorprendentemente buono
a prima vista ogni "sparatore a caso di stronzate" sembra
"sorprendentemente buono", anche quelli umani
[...]
> Y
On sab, 2024-06-29 at 07:00 +, Giacomo Tesio wrote:
> Il 28 Giugno 2024 21:45:36 UTC, Guido Vetere ha
> scritto:
> > 'aperti' nel senso di huggingface, cioè li puoi scaricare e l'architettura
> > della rete è pubblica, ma certo che non ti danno i dataset di addestramento
>
> Perché "certo"?
>
Giacomo Tesio writes:
> Il 28 Giugno 2024 21:45:36 UTC, Guido Vetere ha
> scritto:
>> 'aperti' nel senso di huggingface, cioè li puoi scaricare e l'architettura
>> della rete è pubblica, ma certo che non ti danno i dataset di addestramento
>
> Perché "certo"?
>
> Da quando un binario opaco è "a
Segnalo questo articolo di Guido Scorza di cui non riesco a cogliere
pienamente, per mia ignoranza, tutte le implicazioni, ma che mi sembra
rilevante anche per il ruolo attuale dell’autore.
Scorza: "AI, è ora di difendere i nostri dati dalla raccolta massiva: ecco
come" - Agenda Digitale
https:/
quello che 'scarichi' sono i parametri della rete, ed è ovviamente un
'blob' molto molto oscuro
poi c'è l'architettura della rete, generalmente OS: se volete divertirvi a
dare un'occhiata fate pure, ad es: https://github.com/ggerganov/llama.cpp
quanto ai dataset: alcuni modelli li prendono da quell
Salve Marco Anselmo Giovanni,
Il 29 Giugno 2024 07:06:57 UTC, ha scritto:
> On sab, 2024-06-29 at 07:00 +, Giacomo Tesio wrote:
> > Il 28 Giugno 2024 21:45:36 UTC, Guido Vetere ha
> > scritto:
> > > 'aperti' nel senso di huggingface, cioè li puoi scaricare e l'architettura
> > > della rete è
> Segnalo questo articolo di Guido Scorza di cui non riesco a cogliere
> pienamente, per mia ignoranza, tutte le implicazioni, ma che mi sembra
> rilevante anche per il ruolo attuale dell’autore.
Aggiungo che Guido Scorza ha parlato recentemente di AI e Diritto in questo
webinar di un'ora.
https:
Salve Guido,
Il 29 Giugno 2024 07:38:09 UTC, Guido Vetere ha
scritto:
>
> soggetti come Meta e Google ovviamente usano quello che hanno in casa, non
> lo esportano, è vero
Quindi è "aperto" nel senso che... è chiuso.
Splendido esempio di bipensiero! :-D
> ma è anche vero che glielo diamo noi
Il 29/06/24 09:22, de petra giulio ha scritto:
Segnalo questo articolo di Guido Scorza di cui non riesco a cogliere
pienamente, per mia ignoranza, tutte le implicazioni, ma che mi sembra
rilevante anche per il ruolo attuale dell’autore.
Scorza: "AI, è ora di difendere i nostri dati dalla raccolt
> Su huggingface trovi il dataset sorgente?
> Mi passi il link diretto?
Anche se ci fosse, che ci faresti?
I dataset che usano ormai si sanno quali sono (e i link, con un po' di fatica,
si trovano), quella che non si conosce è, ad esempio, la Pre-Processing
Pipeline.
Prendiamo IBM Granite [1]:
g
Ciao Antonio,
Il 29 Giugno 2024 18:51:12 UTC, Antonio ha scritto:
> > Su huggingface trovi il dataset sorgente?
> > Mi passi il link diretto?
>
> Anche se ci fosse, che ci faresti?
Un sacco di cose!
Ad esempio, una volta verificato che sono effettivamente i dataset sorgente,
ne indagherei i "b
> Un sacco di cose!
> Ad esempio, una volta verificato che sono effettivamente i dataset sorgente,
> ne indagherei i "bias di selezione" ovvero le opinioni che Google intende
> imporre
> agli utenti senza risponderne.
Stiamo dicendo la stessa cosa.
Nel documento che ho citato leggo:
"IBM had cur
13 matches
Mail list logo