se cerchi di fare backprop con un flip flop hai dei problemi...

On 12/05/26 08:32, Giuseppe Attardi via nexa wrote:
Non esattamente: ti sfugge che il calciatore (la rete neurale) ha una sua capacità di apprendere legata alla struttura del suo modello: la backpropagation stimola l’apprendimento ma non basta se il modello è inadeguato. Sostituisci al calciatore una rete fatta di un singolo perceptron e il meccanismo non funziona.

Proprio sul ruolo cruciale dell’architettura dei modelli sta la differenza con l’interpretazione di macchina-statistica. I successi del Deep Learning sono dovuti proprio ai progressi nelle architetture dei modelli.

— Beppe

On 11 May 2026, at 13:09, [email protected] wrote:

From: antonio <[email protected] <mailto:[email protected]>>
Subject: [nexa]  Re: Una visione realistica dell’Intelligenza
Artificiale - Lettera aperta alla società
To:[email protected] <mailto:[email protected]>
Message-ID: <[email protected] <mailto:[email protected]>>
Content-Type: text/plain; charset=ISO-8859-1

I LLM hanno risolto il problema in modo radicalmente diverso: invece di codificare
regole, apprendono pattern statistici da enormi quantità di testo.

Se venisse da me un ragazzino a chiedermi il funzionamento base di una rete neurale gli farei questo esempio.

Vuoi tirare il rigore perfetto all'incrocio dei pali? Vieni con me.
Ti porto nei pressi del dischetto e ti bendo.
"Tira il pallone in una direzione a caso, poi io ti dirò come aggiustare il tiro". Un po' più a destra, un po' più alto, ancora più in alto, no, troppo, ora abbassa, e così per tutto il giorno.
Io prenderò nota solo dei movimenti corretti.
Dopo 10.000 rigori, non avrai più bisogno che io ti guidi. Avrai memorizzato esattamente la tensione muscolare e la potenza necessaria per colpire l'incrocio. A quel punto, toglieremo la benda e farai gol al primo colpo.

Quindi abbiamo:

1) Il calciatore (la rete neurale): È lui che agisce, ma all'inizio non sa nulla. 2) Il tiro a caso (forward propagation): La rete neurale fa una previsione basandosi su pesi casuali. 3) Tu che correggi ("più a destra/alto") (Funzione di perdita/loss function): misuri l'errore tra dove è andata la palla e l'incrocio dei pali. 4) Aggiustare il tiro (backpropagation): Il calciatore capisce l'errore e modifica la posizione del corpo per il prossimo tiro. 5) Tirare tutto il giorno (addestramento/training): La rete impara iterando migliaia di volte finché non azzecca il tiro 6) Prendere nota (aggiornamento dei parametri della rete): I "pesi" sinaptici" vengono consolidati quando portano ad un risultato migliore.

Bene, ora sostituisci quel "migliaia di volte" con questo numero:
38.000.000.000.000.000.000.000.000
e "tutto il giorno" con 54 giorni.

(Il training di Llama 3.1 405B ha richiesto circa 3,8 * 10^25 FLOP utilizzando 16.384 GPU H100 per 54 giorni)

p.s. forse è meglio citare De Gregori:

Ma Nino non aver paura
Di sbagliare un calcio di rigore
Non è mica da questi particolari
Che si giudica un giocatore
Un giocatore lo vedi dal coraggio
Dall'altruismo e dalla fantasia

A.


--
You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)

Reply via email to