ChatGPT è alimentato da una moltitudine di sistemi sottostanti, il più recente dei quali è GPT-4V, o GPT-4 Vision, che gli conferisce le capacità multimodali. Dopo la pubblicazione del modello, a fine settembre, i ricercatori di Microsoft, il principale investitore e partner di OpenAI, hanno eseguito una serie di test per valutarne le capacità. Hanno scoperto che mostra “capacità notevoli, alcune delle quali non sono state studiate o dimostrate negli approcci esistenti”, secondo il documento “The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)“.
AI GENERATIVA
GPT-4V, ecco come è fatto il modello di AI che sta dietro la multimodalità di ChatGPT
“Potente” e con una “capacità senza precedenti di elaborare input multimodali interlacciati in modo arbitrario”. Può contare oggetti, analizzare tabelle e testi, eseguire l’apprendimento nel contesto ed è condizionato dal codice su input visivi. Da ottobre è accessibile tramite ChatGPT sul desktop o sulla versione dell’app per iOS per gli abbonati Plus o Enterprise
giornalista

Continua a leggere questo articolo
Argomenti
Canali