Google presenta i modelli generativi Veo e Imagen 3

15 Maggio 2024Nessun commento

Il Google I/O di ieri non è stato soltanto l'occasione per presentare le ultime novità di Gemini, ma anche per svelare Veo, il modello di generazione di video più avanzato di Big G, e Imagen 3, un modello di altissima qualità per la generazione di immagini.

Veo può generare video di alta qualità con una risoluzione di 1080p con durata superiore al minuto adottando stili visivi e cinematografici diversi.
Grazie alla comprensione avanzata del linguaggio naturale e della semantica visiva, Veo può generare video che rappresentino con precisione la visione creativa dell’utente, cogliendo il tono dei prompt e interpretandone i dettagli in modo accurato, indipendentemente dalla lunghezza. Veo offre inoltre un elevato grado di controllo creativo, permettendo di includere elementi come timelapse, riprese aeree di paesaggi e movimenti realistici di persone, animali e oggetti.

Tra le sue caratteristiche principali troviamo:

  • Generazione di video da testo: Veo può generare video realistici e dettagliati a partire da semplici descrizioni testuali.
  • Controllo creativo avanzato: Include funzionalità come timelapse, riprese aeree e movimenti realistici per offrire un livello di controllo creativo senza precedenti.
  • Coerenza e realismo: Garantisce movimenti realistici di persone, animali e oggetti all’interno delle inquadrature.

Veo è il risultato di anni di ricerca e sviluppo da parte di Google AI nel campo dei modelli di generazione di video. Si basa su una combinazione di tecnologie innovative, tra cui Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere.
Veo è attualmente disponibile in anteprima privata con VideoFX. Alcune delle sue funzionalità saranno rese disponibili in futuro anche su YouTube Shorts e altri prodotti.

A Veo si accompagna Imagen 3, il modello text-to-image di altissima qualità di Google in grado di generare immagini realistiche e naturali, in cui artefatti visivi sono molto meno numerosi rispetto ai modelli precedenti.
Imagen 3 comprende meglio il linguaggio naturale e l’intenzione alla base dei prompt ed è il modello migliore mai realizzato per il rendering del testo.

Da oggi Imagen 3 è disponibile per alcuni creatori selezionati come anteprima privata all’interno di ImageFX, ed è possibile iscrivervi alla lista d’attesa perché sarà presto disponibile su Vertex AI.

Loading...
Social Media Auto Publish Powered By : XYZScripts.com