La bipartizione sintassi-semantica (che data indietro almeno al '600) fu già rifiutata dalla Lexicon-Grammar di Maurice Gross (*Méthodes en syntaxe*, 1975), portata anche in Italia da Annibale Elia. Gli LLM confermano oggi che i 'pattern' sintattico-semantici, benché esibiscano 'somiglianze di famiglia', vanno presi uno a uno, e di fatto solo la forza bruta computazionale può compiere l'impresa. Credo (l'ho scritto anche qui <https://lucasossellaeditore.it/libro/intelligenze-aliene/>) che la lessicografia dovrà trovare il modo di estrarre conoscenze dalle miniere degli LLM, e che queste conoscenze dovranno basarsi su modelli teorici adeguati, che forse ancora non abbiamo. Ma cento miliardi di numeri in virgola mobile non sono una teoria linguistica, perché una teoria è un modello causale. Il fatto che per fare certe operazioni non ce ne sia bisogno non significa nulla: si riusciva a navigare anche senza l'idraulica, per dire ...
G. On Tue, 25 Feb 2025 at 05:52, Giuseppe Attardi <atta...@di.unipi.it> wrote: > Per anni ho pensato che per capire il linguaggio si dovesse passare > attraverso l’analisi sintattica e poi per quella semantica, perché così > dicevano i testi di linguistica. > Ho sviluppato un parser a dipendenze multiligua basato su word embedding e > rete neurale che funzionava molto bene. > L’ultima incarnazione si chiama DiaParser e si trova su GitHub: > https://github.com/Unipisa/diaparser > > Tuttavia John Hewitt ha scoperto, usando un probe sintattico, che le > matrici di attention dei transformer contengono una rappresentazione > dell’albero sintattico della frase. > Altri layer delle metrici corrispondono ad altri fenomeni, come l’anafora. > I word embedding, che sono al primo livello del transformer, danno una > rappresentazione molto articolata del significato delle parole, inclusi > sinonimi e relazioni semantiche tra parole. > > A questo punto l’ipotesi che si debba insegnare esplicitamente la > grammatica e la semantica a un modello ha vacillato. > Del resto i bambini imparano a capire e parlare una lingua ben prima di > andare a scuola e che gli vengano insegnati i concetti linguistici astratti. > Probabilmente l’esposizione a 30 milioni di frasi nei primi tre anni di > vita è sufficiente (c’è chi dice siano di più, tenendo conto anche dei > feedback visivi). > > Quindi, mai dare per scontate certe ipotesi che ci sembrano ovvie. > > Ho provato quindi a chiedere questo a ChatGPT. > > > Analizza questa frase: lei suona il violino e lui la tromba. Cosa fa lui > esattamente? > > > ChatGPT: La frase è ambigua perché la costruzione grammaticale lascia > spazio a due interpretazioni: > > 1. Interpretazione comune e probabile: “Lei suona il violino e lui [suona] > la tromba.” Qui si sottintende il verbo “suonare” anche per il secondo > soggetto, quindi si capisce che entrambi stanno suonando strumenti musicali. > > 2. Interpretazione ambigua e comica: “Lei suona il violino e lui la > tromba” potrebbe essere letto in modo diverso, dove “la tromba” non è lo > strumento musicale ma un’azione riferita a “lei”. In italiano colloquiale, > “trombare” può avere un significato volgare (sinonimo di “fare sesso”). Se > si legge in questo modo, la frase assume un doppio senso ironico. > > > Il contesto in cui viene detta o scritta la frase aiuta a chiarire quale > delle due interpretazioni sia corretta. > > > Potrebbe darsi che ChatGPT abbia letto da qualche parte la spiegazione di > ARM. > > Ma anche concludere che il modello non sa fare certe cose potrebbe essere > azzardato. > > On 14 Feb 2025, at 16:59, Angelo Raffaele Meo <angelo....@polito.it> > wrote: > > > Difendo Richard Stallman ed anche l'Intelligenza Artificiale. > Nel 1960, quando quasi tutti i partecipanti a questo dibattito non erano > ancora nati oppure frequentavano l'asilo, io realizzai uno dei primi > prototipi di quel capitolo dell'Intelligenza Artificiale che chiamiamo > "riconoscimento della voce". Riconosceva sotto dettatura una ventina di > parole distinte, isolate, basandosi sull'analisi acustico-lessicale del > segnale vocale. Ad esempio, i brevissimi istanti di silenzio caratteristici > della lettera esplosiva "t" suggerivano la parola "sette" oppure la parola > "otto", mentre le vocali hanno spettri di frequenza diversi. > In quella prima fase della ricerca comprendemmo, ad esempio, che la > dettatura automatica o la traduzione da una lingua ad un'altra richiedono > l'integrazione dell'analisi lessicale con l'analisi sintattica, ma è ancora > più importante l'analisi semantica. > Fui io ad introdurre un esempio significativo che è stato citato più > volte. Consideriamo la frase "lei suona il piano e lui la tromba". Due > diversi alberi sintattici possono sottendere quella frase. Nel primo albero > sintattico la parola "tromba" è un'unità nominale; nel secondo albero > sintattico la stessa parola è unità verbale. > Per l'ascoltatore che non sa nulla della vita sentimentale di lei e lui, > "tromba" è un'unità nominale; invece, per l'ascoltatore che sa che lei e > lui sono amanti, in un particolare contesto della conversazione, in virtù > di quel capitolo della semantica che è chiamato "pragmatica", "tromba" > diventa un'unità verbale, con implicazioni importanti sul processo di > traduzione. > In questo momento, introdurre la semantica o la pragmatica > nell'elaborazione del linguaggio naturale è ancora difficilissimo. Quindi, > Intelligenza Artificiale interpretata alla lettera non esiste ancora. Sono > sicuro che questo fosse il significato della provocatoria affermazione di > Stallman e quindi che Stallman abbia ragione. > Comunque, senza usare semantica o pragmatica, in virtù di una raffinata > elaborazione statistica e della capacità tecnologica di trattare immensi > volumi di dati, quel nuovo insieme di discipline scientifiche che chiamiamo > Intelligenza Artificiale sta producendo risultati meravigliosi. La > dettatura automatica e la traduzione da una lingua all'altra sono due > esempi significativi. Commettono ancora qualche errorino ma sono di > grandissima utilità. > Viva l'Intelligenza Artificiale, chiara dimostrazione dell'intelligenza > naturale di homo sapiens. > ------------------------------ > *From:* nexa <nexa-boun...@server-nexa.polito.it> on behalf of Giuseppe > Attardi <atta...@di.unipi.it> > *Sent:* Friday, February 14, 2025 12:20 PM > *To:* nexa@server-nexa.polito.it <nexa@server-nexa.polito.it> > *Subject:* Re: [nexa] Perché Richard Stallman sbaglia in tema di > intelligenza artificiale > > È anche peggio di così, come ammettono nei manuali per medici: > > I medici spesso utilizzano termini vaghi come "altamente probabile", > "improbabile" o "non è da escludere" per descrivere la possibilità di una > malattia. > > <default_share_msd.jpg> > Strategie per il processo decisionale clinico - Argomenti speciali - > Manuali MSD Edizione Professionisti > <https://www.msdmanuals.com/it/professionale/argomenti-speciali/processo-decisionale-clinico/strategie-per-il-processo-decisionale-clinico> > msdmanuals.com > <https://www.msdmanuals.com/it/professionale/argomenti-speciali/processo-decisionale-clinico/strategie-per-il-processo-decisionale-clinico> > > <https://www.msdmanuals.com/it/professionale/argomenti-speciali/processo-decisionale-clinico/strategie-per-il-processo-decisionale-clinico> > > > On 14 Feb 2025, at 12:00, nexa-requ...@server-nexa.polito.it wrote: > > From: Giacomo Tesio <giac...@tesio.it> > To: nexa@server-nexa.polito.it > Subject: Re: [nexa] Perché Richard Stallman sbaglia in tema di > intelligenza artificiale > Message-ID: <5fabc401-5b15-4a28-9850-5bc9ed4e2...@tesio.it> > Content-Type: text/plain; charset=UTF-8 > > Giuseppe, mi permetto un buon consiglio non richiesto: > > Il 14 Febbraio 2025 10:36:55 UTC, Giuseppe Attardi ha scritto: > > Quante probabilità ho che sia questo o quello? > > > Quant’è la probabilità di guarigione? > > > Quanto stima possa durare la riabilitazione? > > > Quant’è il rischio di ricadute? > > > > È tutto un ragionare a spanne su probabilità stimate a naso. > > > se il tuo medico risponde a domande come queste con stime numeriche > delle probabilità (a naso o meno), cambia medico. > >