In Cina modello multimodale Intelligenza Artificiale

I ricercatori puntano ad aumentare il pre-addestramento

(ANSA-XINHUA) - PECHINO, 12 LUG - I ricercatori cinesi hanno costruito un nuovo modello di pre-addestramento dell'Intelligenza artificiale a tre modalità per realizzare la generazione reciproca tra discorso e immagine.
    Il macchinario, denominato OPT-Omni-Perception pre-Trainer, può imparare insieme il contenuto multimodale di testo, discorso, immagine e video.
    Gli attuali modelli di pre-addestramento spesso coprono le modalità di immagine, video e testo, mentre ignorano le informazioni sul parlato nell'ambiente. Al fine di superare tali limitazioni, il nuovo progetto è in grado di svolgere azioni di generazione cross-modale come la creazione di immagini dal testo, di testo dall'immagine e di immagini dal parlato.
    Stando a quanto reso noto dallo sviluppatore, l'Institute of Automation della Chinese Academy of Sciences, la costruzione del nuovo modello promuoverà lo sviluppo dell'Intelligenza artificiale (AI) e migliorerà significativamente le prestazioni dei compiti base di testo, discorso, immagine e video.
    Questo nuovo modello possiede un grande valore potenziale nel riconoscimento e nella sintesi vocale, nonché nelle applicazioni commerciali, come l'interazione uomo-computer e la guida senza pilota. (ANSA-XINHUA).
   

RIPRODUZIONE RISERVATA © Copyright ANSA