Hangzou (Cina) – Alibaba ha lanciato venerdì un nuovo modello di intelligenza artificiale che, a detta dell’azienda, è in grado di comprendere le immagini e di effettuare conversazioni più complesse rispetto ai prodotti precedenti.

Il gigante tecnologico cinese ha dichiarato che i suoi due nuovi modelli, Qwen-VL e Qwen-VL-Chat, saranno open source, il che significa che ricercatori, accademici e aziende di tutto il mondo potranno utilizzarli per creare le proprie applicazioni di intelligenza artificiale senza dover addestrare i propri sistemi, risparmiando così tempo e denaro.

Alibaba ha dichiarato che Qwen-VL può rispondere a domande aperte relative a diverse immagini e generare didascalie. Qwen-VL-Chat, invece, si rivolge a “interazioni più complesse”, secondo Alibaba, come il confronto di più immagini e la risposta a diverse serie di domande. Secondo Alibaba, Qwen-VL-Chat è in grado di scrivere storie e creare immagini sulla base delle foto inserite dall’utente, nonché di risolvere equazioni matematiche visualizzate in un’immagine.

Un esempio fornito da Alibaba è quello di un input con un’insegna di un ospedale in lingua cinese. L’IA può rispondere a domande sull’ubicazione di alcuni reparti dell’ospedale interpretando l’immagine dell’insegna. Finora, gran parte dell’IA generativa – in cui la tecnologia genera risposte basate su input umani – si è concentrata sulla risposta al testo. L’ultima versione di ChatGPT di OpenAI ha anche la capacità di comprendere le immagini e rispondere con il testo, proprio come Qwen-VL-Chat.

I due ultimi modelli di Alibaba si basano sul modello linguistico di grandi dimensioni Tongyi Qianwen, rilasciato all’inizio di quest’anno. Un LLM è un modello di intelligenza artificiale addestrato su enormi quantità di dati ed è alla base delle applicazioni di chatbot. Questo mese l’azienda di Hangzhou ha reso disponibili altri due modelli di intelligenza artificiale. Pur non facendo guadagnare ad Alibaba alcun diritto di licenza, la distribuzione open-source aiuterà l’azienda a ottenere un maggior numero di utenti per il suo modello di intelligenza artificiale, in un momento in cui la divisione cloud dell’azienda sta cercando di riaccendere la crescita, mentre si prepara a diventare pubblica.