
Google prepara el lanzamiento de Gemini 3.0, una nueva versión de su inteligencia artificial, con mejoras esperadas en rapidez, integración de imágenes y video, y capacidades más avanzadas para entender muchos tipos de datos. (rumores señalan una presentación cercana)
Mejor mezcla de texto, imágenes y videos: se espera que Gemini 3.0 entienda y combine mejor distintos tipos de contenido multimedia (texto, fotos, video).
“Video Overviews” más dinámicos: ya existe la función de generar resúmenes en video, y 3.0 podría hacerlos más inteligentes e interactivos.
Modelo especializado para controlar interfaces: Google recientemente lanzó el modelo Gemini 2.5 Computer Use, que puede interactuar con interfaces web y móviles (por ejemplo, pulsar botones, seleccionar elementos). Esto podría evolucionar en 3.0.
Edición de imágenes “Nano Banana” mejorada: la versión actual ya permite editar, combinar y transformar imágenes con facilidad. Esa capacidad podría integrarse aún más íntimamente en 3.0.
Más contexto para entender conversaciones largas: se especula que podrá manejar conversaciones extensas o documentos enormes sin perder el hilo.
No esperes que Gemini 3.0 reemplace lo actual de un día para otro: muchas funciones modernas ya están disponibles ahora.
Gemini Live (con cámara y compartir pantalla) ya es gratis en iOS y Android.
Nano Banana permite transformar y editar imágenes de forma creativa.
Puedes convertir fotos en videos cortos de 8 segundos con sonido mediante “photo-to-video”.
También, Gmail ha añadido una función “Help me schedule” que sugiere horarios para reuniones basándose en tus correos y calendario.
Gemini 3.0 promete llevar la IA de Google a otro nivel: una versión más “multimodal” que une texto, imágenes y video de forma natural, con modelos que pueden “ver” y “actuar” en interfaces. Mientras tanto, las versiones actuales ya ofrecen funciones bastante avanzadas, así que 3.0 podría ser más una evolución que una revolución radical.