open menu close menu
blog_post_featured_image

Le fazioni nell’IA

Quando ero piccolo e mi affacciavo per la prima volta al mondo del digitale iniziavano già a esserci gli schieramenti.

Il mio primo PC, un vetusto ACER che mi ha accompagnato per ANNI, mi permise di iniziare a “smanettare” con i vari programmi di Microsoft.

Team Windows da sempre e per sempre.

Oggetto del mio disprezzo tutto ciò che era riconducibile ad Apple.

Nella mia testa da giovane rivoluzionario Windows rappresentava il proletariato, mentre Apple rappresentava la ricchezza da combattere.

Stessa cosa per i cellulari. Fedele fan di Samsung, disprezzo per l’iPhone.

Questo rimembrare di ricordi passati, semplicemente per dire che crescendo, entrando in un’ottica più lavorativa e iniziando effettivamente a capirci qualcosa, ho realizzato che questi schieramenti erano superficiali e che le prese di posizione a priori erano inutili.

Il mondo è molto più complesso di quanto possiamo immaginare a quindici anni.

E oggi sono io ad avere un iPhone e un Mac (sempre senza soldi).

La guerra dell'intelligenza artificiale

In quel periodo, qualsiasi discussione, da quella più tecnica a quella più generale, era segnata da un'adesione acritica a una fazione o all'altra, talvolta immotivata.

E più o meno oggi sta accadendo la stessa cosa con la "guerra" dell'intelligenza artificiale. Quando navigo su Linkedin o su YouTube mi capita spesso di leggere commenti del tipo:

“Se usi DALL-E non capisci niente, Midjourney molto meglio”
“Ma chi usa Bard? ChatGPT è irraggiungibile"

E chi più ne ha più ne metta.

Tali commenti sembrano comprensibili quando provengono da giovani liceali o  anche universitari, ma trovarli tra professionisti esperti mi fa un po’ strano.

Dov’è la visione a lungo termine dell’occhio esperto? Limitarsi a giudicare un'innovazione basandosi sull’ultimo aggiornamento o a simpatia è un approccio limitante.

Stiamo parlando di un settore in rapida evoluzione, in cui ogni settimana ci sono annunci e rilasci rivoluzionari, in cui tutto può cambiare da un momento all'altro. Sempre.

I modelli text-to-image

Entriamo nel pratico. Prendiamo in esame le principali “guerre” nell’IA e partiamo da Midjourney vs. DALL-E. Iniziamo a sfatare qualche mito.

“Ah che schifo DALL-E, la qualità delle immagini è inferiore a Midjourney”

No.

Midjourney è noto per le sue capacità avanzate nel trasferimento di stili, nella modifica di immagini, nell'uso di modelli innovativi, nell'applicazione di filtri basati sull'intelligenza artificiale e nella collaborazione fluida.

DALL-E, invece, è rinomato per la sua abilità nella creazione avanzata di immagini, nell'adattabilità della produzione di immagini, nella percezione del contesto, nella flessibilità stilistica e nella produzione di immagini di qualità superiore.

Se si parla di resa visiva, il punto di forza di Midjourney risiede nella sua capacità di creare immagini altamente accurate e realistiche, fedeli al prompt. DALL-E genera immagini immaginative e complesse, talvolta più libere dal prompt, favorendo la creatività alla produzione analitica.

Quindi è semplicemente sbagliato dire che una è superiore all’altra. Funzionano in maniera diversa, sono progettate per eseguire comandi diversi.

Bard o ChatGPT?

Spostiamoci sui modelli di linguaggio e arriviamo al grande confronto tra Google Bard e ChatGPT.

Perché mai si dovrebbe paragonare un modello come Google Bard, ancora in fase di sperimentazione, ideato essenzialmente come super assistente di Google, con un modello strutturato, pensato e addestrato per una funzione completamente diversa, specializzato nel generare risposte simili a quelle umane all'interno di un discorso, e con 6 mesi di vantaggio sul competitor?

Paragonereste mai un Junior Software Developer con un Marketing Manager?

Funzioni diverse, compiti diversi, esperienza diversa.

Le recenti integrazioni di Bard con tutti i servizi Google e il lancio di Google Gemini AI ribadisce ulteriormente che il confronto non è pienamente sensato in quanto si tratta di due servizi paralleli.

L'IA sta evolvendo ad una velocità straordinaria e non possiamo permetterci di rimanere ancorati a vecchi pregiudizi o divisioni superficiali. Dobbiamo essere pronti a esplorare, a sperimentare e a immaginare le incredibili potenzialità che questa tecnologia ci offre.

Non farlo significa semplicemente non capire la funzionalità dei servizi che maneggiamo, di conseguenza non saperli usare al meglio, di conseguenza non evolvere.