Da questo mese Google lancia Gemini Drops, un appuntamento mensile che raccoglie tutte le nuove funzionalità introdotte in Gemini, il sistema di intelligenza artificiale sempre più centrale nell’ecosistema Android.
La novità forse più interessante di questo primo Gemini Drop riguarda Veo 3, il modello Google per la trasformazione di immagini in brevi video. Ora questa funzione è integrata direttamente nell’app Gemini: basta scegliere una foto e il sistema la trasformerà in una clip da otto secondi con audio.
Gemini sbarca sugli smartwatch Wear OS
Chi indossa uno smartwatch con Wear OS 4 o superiore può finalmente sfruttare le potenzialità di Gemini anche al polso. L’assistente AI è ora disponibile su tutti i dispositivi compatibili, permettendo di:
-
Ricevere risposte rapide direttamente dall’orologio
-
Impostare promemoria vocali o testuali
-
Eseguire azioni senza dover prendere il telefono
Azioni pianificate: Gemini diventa proattivo
Un’altra funzione molto interessante è quella delle Scheduled Actions, o azioni programmate. In pratica, si possono impostare task ricorrenti che Gemini svolgerà in automatico, come ad esempio:
-
Un riassunto della giornata ogni mattina
-
Un recap delle email non lette
-
Un promemoria per bere acqua ogni due ore
Inoltre, su Gemini Live, arrivano i sottotitoli in tempo reale. Ora è possibile leggere quello che Gemini dice durante le conversazioni vocali, fornendo un aiuto in più se ci si trova in luoghi rumorosi o se si preferisce un’interazione più discreta.
Productivity Planner
Il Productivity Planner Gem è una nuova funzione che raccoglie e organizza tutte le informazioni utili in un unico punto e vuole rappresentare un vero hub di produttività, direttamente nell’assistente AI.
-
Email in arrivo
-
Eventi in calendario
-
Note e promemoria
upgrade al modello Gemini 2.5 Pro
Google ha aggiornato anche il cuore dell’assistente: il nuovo Gemini 2.5 Pro è ancora più capace nelle attività che richiedono ragionamento, codifica e comprensione scientifica, mentre lato tecnico migliora anche la gestione degli input multimodali (testo, voce, immagine), con risposte più rapide e precise.