Ciao Fabio
Il 13/02/2025 13:00, Fabio Alemagna ha scritto:
Qualche giorno fa ho postato nella lista l'abstract e link a uno
studio che mostra come gli LLM "capiscono" la matematica: usando la
trigonometria, che comunque nessuno gli ha insegnato.
https://server-nexa.polito.it/pipermail/nexa/2025-February/054015.html
Qui c'è un articolo dei ricercatori di intelligenza artificiale della
Apple che fanno vedere che gli LLM non riesono a generalizzare fuori
dalla distribuzione dei problemi matematici su cui sono stati allenati
https://arxiv.org/pdf/2410.05229
Visto che DeepSeek si può scaricare e far girare in locale non dovrebbe
essere troppo lungo o complicato rifare con DeepSeek gli stessi
esperimenti citati in quest'articolo...
Che sia ben chiaro che il senso della mia osservazione non è "giocare a
chi ce l'ha più lungo" (ovviamente intendo il CV scientifico ... 😂 ) ma
solo per ricordare a noi tutti che stiamo parlando di ricerca
scientifica che sta avvenendo sotto i nostri occhi e sulla quale
dovremmo, da ricercatori, essere molto più critici e dubbiosi rispetto
ai markettari che devono vendere i loro prodotti.
Se gli LLM funzionano davvero il mercato crescerà significativamente nei
prossimi anni. Per adesso mi pare che stia ancora arrancando o, per lo
meno, non ha mantenuto le promesse iperboliche fatte tra fine 2022 e
inizio 2023.
Sicuramente gli LLM avranno un loro spazio in determinati domìni,
sostanzialmente quelli caratterizzati da un "mondo chiuso" sui quali
possono essere generati sinteticamente dati affidabili da usare per
incrementare la scala di addestramento, ma ritengo che *finché gli LLM
vengono usati da soli non saranno in grado di darci nessuna AGI
(Artificial General Intelligence)*.
Ricercatori internazionali molto più quotati di me sostengono questa
posizione che ritengo del tutto corretta (ad esempio Francoise Chollet).
Il motivo scientifico è che l'approccio usato dagli LLM non costruisce
rappresentazioni simboliche sulle quali è in grado di ragionare. AlphaGo
e AlphaFold hanno integrato approccio statistico e approccio simbolico.
Se volete leggere le argomentazioni di Chollet le trovate sinteticamente
esposte in questo tweet
https://x.com/fchollet/status/1800577565717148143 e quelli che seguono.
È assolutamente necessario investire in ricerca, ma - appunto - una cosa
sono ricerca e sviluppo, una cosa ben diversa l'uso in produzione.
Ciao, Enrico
--
-- EN
https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html
======================================================
Prof. Enrico Nardelli
Past President di "Informatics Europe"
Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI
Dipartimento di Matematica - Università di Roma "Tor Vergata"
Via della Ricerca Scientifica snc - 00133 Roma
home page: https://www.mat.uniroma2.it/~nardelli
blog: https://link-and-think.blogspot.it/
tel: +39 06 7259.4204 fax: +39 06 7259.4699
mobile: +39 335 590.2331 e-mail: narde...@mat.uniroma2.it
online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont
======================================================
--