che in cose come Common Crawl ci sia mondezza lo sanno tutti, il problema è
verificare se e come viene filtrata, e torniamo al tema della GPU.
ma poi: che garanzie pensi di ottenere così? a meno che non setti la
temperatura a zero, la generazione basata su LLM è aleatoria: lo stesso
prompt può darti cose un po' diverse a seconda di come gli gira il random
generator.
continuo a non capire lo scopo di questo discorso
G.

On Wed, 3 Jul 2024 at 11:05, Stefano Zacchiroli <z...@upsilon.cc> wrote:

> On Wed, Jul 03, 2024 at 10:29:39AM +0200, Guido Vetere wrote:
> > C'è poi un piccolo particolare che rende la nozione di 'Open Source'
> > difficilmente applicabile ai LLM: se pure uno avesse tutti i dataset
> > eccetera, gli mancherebbe ancora quel mesetto di GPU che serve per fare
> > training anche di pochi miliardi di parametri. Cioè: servirebbe ancora
> > Leonardo, o in alternativa un grosso conto in banca.
>
> Questo è un argomento ricorrente e comprensibile, ma che personalmente
> non condivido. Propongo alcuni (contro)argomenti:
>
> - un dataset aperto permette (a costi molto inferiori a quelli di
>   addestramento) di verificare cosa c'è dentro, per esempio, per
>   verificare la presenza di eventuali bias di selezione
>
> - in ambito software: che il codice sorgente del kernel Linux sia
>   disponibile è un bene per tutta i suoi utilizzatori, compresi quelli
>   che non hanno ne le competenze ne il tempo di capire come funziona o
>   metterci mano
>
> - in ambito hardware: l'esistenza di open hardware (che prevede che gli
>   schemi di design siano liberamente disponibili) è un bene per tutti,
>   anche se in pochi dispongono delle fabbriche per costruire microchip o
>   (ancora più difficile) dei laboratori per verificare che il chip che
>   hanno in mano corrisponde a quei design
>
> Saluti
> --
> Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
> Full professor of Computer Science              o     o   o     \/|V|\/
> Télécom Paris, Polytechnic Institute of Paris     o     o o    </>   <\>
> Co-founder & CTO Software Heritage            o o o     o       /\|^|/\
> https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
>

Reply via email to