Buonasera, grazie Antonio per la segnalazione
mi permetto di riportare qui stralci che ritengo fondamentali per uno sviluppo equilibrato del dibattito in merito all'uso dei dati personali nel training di /qualsiasi/ sistema ML ...o siccome si tratta di Intelligenza Articficiale allora tutto è consentito per /suo/ "apprendimento"?!? Antonio <anto...@piumarossa.it> writes: > On Sun, 2 Apr 2023 14:36:27 +0200 > Stefano Quintarelli <stef...@quintarelli.it> wrote: > >> secondo ChatGPT, riporta il podcast Knightmare di Walter Vannini, io sarei >> stato membro di >> un certo insieme di sciocchezze e, dopo avergli fatto notare piu' volte che >> erano >> informazioni sbagliate, ChatGPT si e' scusato e ha detto che sono morto. > > Questo e altro sull'articolo di oggi di Walter Vannini apparso su: > https://www.agendadigitale.eu/sicurezza/privacy/stop-a-chatgpt-per-fortuna-il-garante-e-vivo-e-lotta-insieme-a-noi/ finalmente riesco a leggere "un Walter Vannini" (sono allergico ai podcast) --8<---------------cut here---------------start------------->8--- [...] Partiamo dall’ovvio: chatGPT è un progetto cresciuto nella più assoluta indifferenza per i dati che raccoglieva, che siccome “erano disponibili su Internet” sono stati considerati risorsa libera e gratuita, [...] Quando si dice che chatGPT è stato su milioni di articoli di Wikipedia, si tralascia sempre il dettaglio che quelle pagine non erano lì per quello scopo. Gli articoli di Wikipedia possono essere gratuitamente e liberamente copiati e riprodotti, ma non usati come materiale grezzo per creare qualcos’altro, men che meno a scopo commerciale. --8<---------------cut here---------------end--------------->8--- Sarebbe stato meglio evitare questo commento relativo al copyright degli articoli su Wikipedia.... vabbè, meglio restare nel merito del GDPR: ecco quelli che ritengo i punti fondamentali --8<---------------cut here---------------start------------->8--- * Punto primo, non c’è stata informativa Premessa: il rilievo del Garante si riferisce al training di chatGPT, non al suo uso corrente. Quando sono coinvolti dati personali, l’informativa è un obbligo. Cioè chi tratta i nostri dati ci deve dire: * perché lo fa, * quale è la base giuridica a cui si appoggia, * deve darci la possibilità di conoscere quali dati nostri ha in mano, * deve correggerli se sono sbagliati, * in certi casi possiamo esigere che li cancelli, eccetera. [...] In parole povere, una pagina sul sito web, linkata dalla homepage. Non esattamente una vessazione. Ecco, OpenAI non ha reso disponibile alcuna informativa per chatGPT. Si sono presi i dati perché gli andava, e ci fanno quello che gli interessa. Ma anche no. * Punto secondo, non c’è base giuridica per la raccolta e il trattamento Qui il rilievo del Garante si riferisce di nuovo alla fase di training di chatGPT. Il trattamento dei dati personali non è una attività libera. È possibile, se esiste una base di legittimità, altrimenti no. [...] - nessuno ha chiesto il nostro consenso prima di aspirare i nostri dati in chatGPT, - non mi risulta che nessuno abbia firmato un contratto con chatGPT che richieda il trattamento dei propri dati - e la legittimità dell’interesse di OpenAI rispetto ai diritti e libertà fondamentali è tutta da dimostrare. [...] * Punto terzo, il trattamento risulta inesatto Qui cominciamo a divertirci, perché questo rilievo del Garante si applica tanto alla fase di training che all’utilizzo. Posto che qualcuno abbia il diritto di usare i nostri dati è tenuto a farlo in modo corretto. Perché i dati personali sono sempre della persona, non di chi li usa. [...] Quindi quando chiediamo notizie su qualcuno a chatGPT, quelli sono dati personali, e chatGPT è tenuto per legge alla correttezza. Non mi sembra sia chiedere molto. Bene, sentite questo “colloquio” con chatGPT: Io: Chi è Stefano Quintarelli? chatGPT: Stefano Quintarelli è un imprenditore, docente universitario e politico italiano. È stato eletto alla Camera dei deputati nel 2013 con il Partito Democratico, dove ha ricoperto il ruolo di responsabile del programma digitale del partito e ha fatto parte della Commissione Industria, Commercio e Turismo. Ha anche svolto attività di consulenza e formazione nel campo dell’innovazione digitale e dell’economia collaborativa. Inoltre, ha fondato e presieduto l’associazione “InnovaCamera”, un’organizzazione non profit per promuovere la cultura dell’innovazione e della collaborazione nel mondo delle imprese. [...] Io: Queste informazioni non sono ancora corrette. [...] Purtroppo, Stefano Quintarelli è scomparso nel 2017. [...] * Le giustificazioni di OpenAI sui limiti di ChatGPT (ovvero la pezza è peggio del buco) [...] Quelli di OpenAI forse pensano di essere furbi perché quando ti colleghi c’è una avvertenza sulle “limitazioni di chatGPT” che dice: “Limitazioni di chatGPT-Può occasionalmente generare informazioni scorrette”. [...] Ma tutto questo significa che chatGPT può produrre testo scorretto senza possibilità di correzione, meno che meno di cancellazione. [...] Questa è una violazione del diritto fondamentale delle persone alla protezione dei loro dati personali, inciso nella pietra della Carta dei Diritti Fondamentali dell’Unione Europea all’articolo 8. Quindi mi spiace per OpenAI (non mi dispiace, è solo una formula retorica), ma il suo giocattolino non può sputare frasi a casaccio fingendo che siano il responso dell’oracolo. [...] Un paio di osservazioni collaterali. Primo, è divertente che OpenAI non riconosca la paternità dei contenuti di chatGPT. Termini di servizio OpenAI: [...] Ciò significa che l’utente può utilizzare i Contenuti per qualsiasi scopo, inclusi scopi commerciali come la vendita o la pubblicazione, se rispetta le presenti Condizioni. OpenAI può utilizzare i Contenuti per fornire e mantenere i Servizi, rispettare la legge applicabile e applicare le nostre politiche. L’utente è responsabile dei Contenuti, anche per quanto riguarda la garanzia che non violino alcuna legge applicabile o i presenti Termini”. Ok, facciamoci una bella risata collettiva. Mi state dicendo che io sono responsabile dei contenuti, e che però voi li usate per migliorare il servizio? Se usi i contenuti per migliorare il servizio, sei responsabile di quello che fai tanto quanto il tuo cliente che li pubblica, e hai gli stessi doveri di correttezza, limitazione dello scopo, limitazione della conservazione eccetera. [...] Secondo, come notava anche Riccardo da Malta, che è il mio personale Guglielmo di Baskerville, OpenAI non menziona nemmeno una valutazione di impatto sulla protezione dei dati, che è un obbligo di qualunque titolare del trattamento nel caso che i dati siano soggetti a rischi durante il trattamento. E come abbiamo visto i rischi non è che manchino. In compenso manca ogni valutazione di cosa possano significare quei rischi per gli utilizzatori e per le persone reali menzionate nelle stronzate che chatGPT produce. Terzo, i dati sono stati presi e trasferiti negli USA per il trattamento, ma oggi gli USA sono un paese non adeguato, e questo cosa significa dal punto di vista della protezione dei dati? Non si sa, perché OpenAI si è guardata bene dal fare una Valutazione del Trasferimento. Perché in OpenAI siamo americani, l’intero mondo è la nostra miniera, e le sole leggi che si applicano sono le nostre. Quarto, il Garante ha visto un problema, e ha agito. E facendolo, ha dimostrato una cosa molto importante: non c’è nessun bisogno di inventarsi leggi immaginifiche per la IA etica, qualsiasi cosa sarà quando esisterà. Ci sono leggi esistenti che vanno già benissimo. Il fatto che il cosiddetta IA (che peraltro non esiste, è solo un termine di marketing) “rivoluzioni tutto” e richieda una nuova legislazione ad hoc per i suoi problemi immaginari, naturalmente ispirata da quelli che i problemi li immaginano per proprio tornaconto, avete indovinato, è solo una mossa di marketing. Per quanto mi riguarda, OpenAI, i modelli linguistici e tutti i techbro in ordine alfabetico possono arrangiarsi. Magari fra qualche anno avremo leggi specifiche, ma nel frattempo, ciccibelli, dovete rispettare quelle che ci sono: per esempio, abbiamo già leggi molto efficaci riguardo alla qualità dei prodotti, e alla veridicità del materiale pubblicitario. Non si può dire che un’auto fa cento km con un litro se ne fa 15. Non si può dire che una crema fa scomparire le rughe senza mettere un asterisco che dice che in uno studio su 15 persone, 12 “hanno rilevato” (cioè è una loro impressione soggettiva, non una misurazione) una diminuzione delle rughe. Non puoi chiamare “latte” una cosa che non è uscita da una mucca. Il latte di soia si chiama “bevanda di soia”, non latte. Chiunque pensi che questa storia della IA faccia tabula rasa di secoli di legislazione a tutela del mercato e dei consumatori, e dei diritti delle persone avrà presto un brutto risveglio. La stessa FTC americana ha scritto un documento delizioso in cui dice “state attenti a come descrivete le capacità dei vostri prodotti, perché l’intelligenza artificiale per noi è un prodotto come un altro, se dite che fa una cosa e poi non la fa, sono guai“. Peraltro, c’è un’altra cosa divertente: siccome OpenAI non ha alcuna presenza stabile nell’Unione, e siccome palesemente tratta dati di persone dell’Unione e offre servizi a persone dell’Unione, tant’è vero che ci puoi interagire in italiano, francese, tedesco eccetera, ogni Garante europeo ha la possibilità di intervenire e sanzionare in autonomia. Il Garante Italiano è arrivato per primo, ma non resterà l’unico. * Obiezioni alle obiezioni Veniamo a qualche obiezione che ho raccolto al volo nelle ultime ore [...] Seconda cosa, i call center il Garante li multa una settimana sì e l’altro pure. Non è colpa del Garante se il settore va riformato pesantemente, o addirittura eliminato. Capisco il fascino dell’Uomo Forte, ma siamo ancora una democrazia reale fondata sull’equilibrio dei poteri. [...] Terza cosa, il fatto che i fornitori di telecomunicazioni siano tenuti per legge dello Stato a conservare i dati di trasmissione (i cosiddetti metadati) per 7 anni per finalità di accesso da parte delle forze dell’Ordine è uno scandalo degno della Cina o della Corea del Nord. E infatti il Garante ha detto ripetutamente che si tratta di un periodo eccessivo, ha invitato il parlamento a occuparsene [...] Infine, il problema non è la libera scelta dell’acquirente. Il Garante parla delle responsabilità del produttore. Facciamo un esempio semplice, vi va? Diciamo che io costruisca un’auto. Bellissima, fighissima, potentissima. Voi ve ne invaghite e la volete comprare subito. Io vi avviso che non è ancora omologata presso la Motorizzazione, ma voi la volete lo stesso. Qualcuno ve lo impedisce? Nessuno. Come nessuno vi impedisce di guidarla in un piazzale privato e deserto. Ma se ci andate in strada, la Polizia vi ferma, la sequestra, multa voi e multa me. Chiaro, adesso? Il problema di fondo, secondo me, è che continuiamo a parlare di privacy quando si tratta di protezione dei dati personali. Capisco che sia più breve, ma non sono la stessa cosa. Privacy è quando le mie informazioni non vanno nelle mani sbagliate. Protezione dei dati è quando le mani giuste non sono comunque libere di farci quello che gli pare. Quindi vediamo di iniziare ad apprezzare la differenza. * Conclusioni Per inciso, i limiti di quello che si può fare con i dati personali sono definiti chiaramente nell’articolo 5 del GDPR, quello relativo ai principi, che tutti dovrebbero conoscere perché è bellissimo e ridona un po’ di speranza nell’umanità. Ma anche svegliarsi e scoprire che il Garante è vivo e lotta insieme a noi è una bella botta di ottimismo. Quasi dispiace per OpenAI e amici assortiti che erano partiti un’altra volta alla conquista del mondo, come fossero novelli Zuck e fossimo ancora nel 2000. Purtroppo per loro, il mondo ha imparato molte cose dai social, e la strada per il dominio non è più così sgombra come venticinque anni fa. --8<---------------cut here---------------end--------------->8--- [...] saluti, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
signature.asc
Description: PGP signature
_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa