On Tue, Feb 27, 2024 at 12:10:42PM +0100, Guido Vetere wrote: > infatti i dataset non sono distribuiti, neanche quelli dei modelli c.d. > aperti, però molti di questi sono comunque reperibili 'a prescindere'
Purtroppo nella maggior parte dei casi è come dici tu, e più in generale c'è molta confusione sotto il "sole" delle IA cosiddette aperte. Ma ci sono anche esempi virtuosi, come Starcoder o Eleuther (LLM per il codice), i cui training dataset (assieme a tutto il resto) sono interamente disponibili e libri. -- Stefano Zacchiroli . z...@upsilon.cc . https://upsilon.cc/zack _. ^ ._ Full professor of Computer Science o o o \/|V|\/ Télécom Paris, Polytechnic Institute of Paris o o o </> <\> Co-founder & CTO Software Heritage o o o o /\|^|/\ https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro '" V "' _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa