Ciao Fabio

Il 13/02/2025 13:00, Fabio Alemagna ha scritto:

Qualche giorno fa ho postato nella lista l'abstract e link a uno studio che mostra come gli LLM "capiscono" la matematica: usando la trigonometria, che comunque nessuno gli ha insegnato.
https://server-nexa.polito.it/pipermail/nexa/2025-February/054015.html

Qui c'è un articolo dei ricercatori di intelligenza artificiale della Apple che fanno vedere che gli LLM non riesono a generalizzare fuori dalla distribuzione dei problemi matematici su cui sono stati allenati
https://arxiv.org/pdf/2410.05229

Visto che DeepSeek si può scaricare e far girare in locale non dovrebbe essere troppo lungo o complicato rifare con DeepSeek gli stessi esperimenti citati in quest'articolo...

Che sia ben chiaro che il senso della mia osservazione non è "giocare a chi ce l'ha più lungo" (ovviamente intendo il CV scientifico ... 😂 ) ma solo per ricordare a noi tutti che stiamo parlando di ricerca scientifica che sta avvenendo sotto i nostri occhi e sulla quale dovremmo, da ricercatori, essere molto più critici e dubbiosi rispetto ai markettari che devono vendere i loro prodotti.

Se gli LLM funzionano davvero il mercato crescerà significativamente nei prossimi anni. Per adesso mi pare che stia ancora arrancando o, per lo meno, non ha mantenuto le promesse iperboliche fatte tra fine 2022 e inizio 2023.

Sicuramente gli LLM avranno un loro spazio in determinati domìni, sostanzialmente quelli caratterizzati da un "mondo chiuso" sui quali possono essere generati sinteticamente dati affidabili da usare per incrementare la scala di addestramento, ma ritengo che *finché gli LLM vengono usati da soli non saranno in grado di darci nessuna AGI (Artificial General Intelligence)*.

Ricercatori internazionali molto più quotati di me sostengono questa posizione che ritengo del tutto corretta (ad esempio Francoise Chollet). Il motivo scientifico è che l'approccio usato dagli  LLM non costruisce rappresentazioni simboliche sulle quali è in grado di ragionare. AlphaGo e AlphaFold hanno integrato approccio statistico e approccio simbolico. Se volete leggere le argomentazioni di Chollet le trovate sinteticamente esposte in questo tweet https://x.com/fchollet/status/1800577565717148143 e quelli che seguono.

È assolutamente necessario investire in ricerca, ma - appunto - una cosa sono ricerca e sviluppo, una cosa ben diversa l'uso in produzione.

Ciao, Enrico

--

-- EN

https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html
        ======================================================
Prof. Enrico Nardelli
Past President di "Informatics Europe"
Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI
Dipartimento di Matematica - Università di Roma "Tor Vergata"
Via della Ricerca Scientifica snc - 00133 Roma
home page: https://www.mat.uniroma2.it/~nardelli
blog: https://link-and-think.blogspot.it/
tel: +39 06 7259.4204 fax: +39 06 7259.4699
mobile: +39 335 590.2331 e-mail: narde...@mat.uniroma2.it
online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont
======================================================


--

Reply via email to