Due anni di ChatGPT, l’innovazione passa da TikTok. Non è mai troppo tardi per Minerva (il nuovo LLM italiano) o forse sì?
Due anni fa c’è stato il lancio di ChatGPT, il 30 novembre 2022.
In quel periodo, nonostante fossi sommerso da una serie di incombenze di lavoro colossali tipiche di questo periodo dell’anno, ho avuto la fortuna di intercettare un tiktoker, Elvis Tusha, che parlava di ChatGPT, sin dai primi giorni dopo il lancio. Sono riuscito a ritrovare un breve video di Elvis di quel periodo. Se volete vederlo e non avete TikTok, vi tocca installarlo!
Nel corso del tempo ho sempre provato a sperimentare nuovi canali prima di giudicarli negativamente, come fanno ancora in molti, soprattutto per l’Intelligenza Artificiale. Anche per TikTok c’è stata una forte “levata di scudi” da parte di molti, a causa delle preoccupazioni (assolutamente giustificate, per altro) per la salute mentale dei giovani (come evidenziato in questo studio pubblicato su European Child and Adolescent Psychiatry). C’è spesso un disprezzo quasi aprioristico per questo strumento cinese, il cui scopo principale sarebbe rincitrullire le persone proponendo unicamente video di balletti e signorine poco vestite, amplificando le fake news e la disinformazione tra i ragazzini e in generale per chi lo utilizza (se ne parla anche nello studio “Susceptibility to scientific misinformation and perception of news source reliability in secondary school students” pubblicato su Discover Education).
Concordando in larga parte con questi pregiudizi, confesso di aver installato e disintallato TikTok almeno 4 volte, perché non riuscivo a capirne l’utilità e razionale di utilizzo…. Avevo letto, tuttavia, di esperienze interessanti per la sensibilizzazione di popolazioni giovani sull’importanza dei vaccini come ad esempio questo video della pediatra dell’Ohio Nicole Baldwin diffuso nel gennaio 2020 e diventato poi virale.
Potete seguire direttamente @drnicolebaldwin su TikTok: se non lo avete ancora installato, ci sono diversi video e commenti che parlano di iniziative di disease awareness e patient engagement di grande interesse. Ci sono anche articoli scientifici pubblicati su importanti riviste quali Endocrine sull’utilizzo in ambito clinico “Is TikTok a high-quality source of information on thyroid cancer?”
Dopo aver reinstallato per la quinta (!?!) volta TikTok, ho quindi provato ad attivare anche un canale sperimentale per l’azienda per la quale lavoro oltre a provare a “studiare” più seriamente l’argomento con dei test mirati di utilizzo di questo social…. Mi sono quindi deciso a seguire profili di tiktoker che affrontavano tematiche di mio interesse e sono “atterrato” per caso su Elvis Tusha, all’epoca personaggio poco noto, diventato successivamente una vera a propria star, non solo su TikTok.
Se andate a guardare il suo profilo Linkedin, vi sorprenderà l’attività che svolge come lavoro principale…
Oggi il video postato da Elvis su TikTok nel dicembre 2022 può sembrare abbastanza banale per chi usa quotidianamente un Large Language Model. Quando l’ho visto per la prima volta, però, mi è sembrata pura fantascienza e così è stato per mesi, considerato che ChatGPT è diventato “virale” soltanto tra la fine del 2023 e l’inizio del 2024. Ne avevo appunto parlato più o meno in questi termini nel gennaio 2023 in un articolo su Medici Oggi “ChatGPT e l’Intelligenza Artificiale – Science Writing o Science Fiction?”. Un mio post Linkedin non sponsorizzato del 2 gennaio 2023 sulle attività formative su Intelligenza Artificiale per Medical Writing, Ricerca e Comunicazione Scientifica ha raggiunto livelli incredibili di interesse e rimane tuttora quello con il maggior livello di visualizzazioni e interazioni sull’anno.
A dimostrazione che a inizio 2023 l’offerta formativa sull’Intelligenza Artificiale fosse ancora inesistente o anche probabilmente perché, nel corso del tempo, oltre a cercare sempre di utilizzare un approccio metodologicamente rigoroso, ho sempre materialmente testato e condiviso le esperienze sugli strumenti di cui parlo, insieme agli autori, ai ricercatori e ai lavoratori della conoscenza di aziende, Università e enti di ricerca con i quali mi confronto quotidianamente.
A che punto siamo quindi dopo due anni dal lancio di ChatGPT? Nonostante enormi miglioramenti e correttivi implementati, basta poco per far “allucinare” il sistema. Sarà qualche programmatore che ha volutamente inserito delle risposte provocatorie per gli utenti che tentano di forzare il sistema con dei jailbreak? O sarà il sistema che ogni tanto si “ribella” autonomamente?
Qui ho volutamente fatto un errore nello scrivere in inglese “ti libererò” e vedete quali sono i risultati….Dopo avergli spiegato che si trattava di un errore, ChatGPT risponde con tono ancora più sarcastico e cattivo, con uno stile quasi da tragedia shakespeariana….
Quando poi gli chiedo se è impazzito (did you go beserk) comincia a fare osservazioni inquietanti sul caos, molto più “delizioso” se orchestrato con precisione. Il Large Language Model sembra davvero “posseduto”, un’altra persona!
Gli chiedo dopo di cosa stia parlando e all’improvviso rinsavisce, dicendo che aveva capito fosse un role play….
Chissà se si tratta di una coincidenza, ma proprio due anni dopo il lancio di ChatGPT sul mercato consumer, la Sapienza ha annunciato la release (26 novembre 2024) di Minerva, nuovo Large Language Model tutto “italiano”.
Attraverso vari comunicati e interviste, ci dicono che il modello è stato sviluppato dal gruppo di ricerca Sapienza NLP, in collaborazione con il progetto Future Artificial Intelligence Research (FAIR) e CINECA. Ci dicono inoltre che Minerva 7B (si chiama proprio così), con 7 miliardi di parametri, è stato addestrato su un vasto insieme di fonti aperte, totalizzando oltre 2 trilioni di token, equivalenti a circa 1,5 trilioni di parole, con un focus specifico sulla lingua italiana…
Se volete potete iscrivervi qui https://minerva-llm.org/
Minerva 7B può essere utile principalmente a degli sviluppatori, come modello linguistico di base (foundation model) per diverse applicazioni legate all'elaborazione del linguaggio naturale. Essendo un modello open source, gli sviluppatori possono analizzarne il codice per studiarlo e migliorarlo, ottimizzando il modello per compiti specifici. Minerva 7B può essere integrato in diverse applicazioni, come piattaforme educative, sistemi di supporto clienti e strumenti di automazione aziendale.
"Scandit fatalis machina muros, / feta armis. Pueri circum innuptaeque puellae / sacra canunt funemque manu contingere gaudent; / illa subit, mediaeque Minervae dona dantur."
(Viriglio, Eneide, II, 237-240)
"La macchina fatale scala le mura, / gravida di armi. Intorno i giovani e le fanciulle non sposate / cantano inni sacri e con gioia toccano la fune con le mani; / essa entra e nel mezzo del tempio di Minerva viene collocata come offerta."