Google incorporó de forma nativa Computer Use a Gemini 3.5 Flash, su modelo más reciente para tareas generales en la app de Gemini. Con este cambio, la compañía habilita la creación de agentes capaces de observar una interfaz, razonar sobre lo que ven y ejecutar acciones por su cuenta en un navegador, en una computadora o en un móvil.

Una herramienta pensada para desarrolladores

La novedad supone un giro frente al esquema anterior, en el que Google ofrecía una versión separada para esa tarea, Gemini 2.5 Computer Use. A partir de ahora, quienes desarrollen aplicaciones o servicios con este tipo de automatización pueden trabajar directamente sobre Gemini 3.5 Flash, sin depender de un modelo independiente para aprovechar funciones de interacción con pantallas y aplicaciones.

La empresa sostiene que la integración facilita la creación de herramientas que analicen lo que muestra una aplicación en el teléfono y produzcan un desglose de sus características. También plantea usos vinculados con la automatización de procesos, el trabajo sobre interfaces gráficas y la construcción de agentes que interactúan con entornos de escritorio y dispositivos móviles de manera más directa.

Google integra Computer Use en Gemini 3.5 Flash para crear agentes autónomos

Usos en pruebas, documentación y conocimiento

Google afirma que Computer Use resulta especialmente útil en las pruebas continuas de software, un terreno donde los sistemas automatizados pueden revisar flujos, detectar cambios y ejecutar acciones repetitivas. Además, la compañía lo ubica como una ayuda para generar documentación a partir del análisis de plataformas y de la interacción detallada con ellas, así como para tareas relacionadas con áreas del conocimiento.

El lanzamiento también llega con medidas de protección adicionales. La empresa advierte que este tipo de agentes puede ser un objetivo para actores maliciosos, debido a ataques como las inyecciones de prompts o de portapapeles. Por eso, Computer Use en Gemini 3.5 Flash incorpora salvaguardias opcionales que pueden pedir confirmación explícita antes de una acción sensible o irreversible, y detener una tarea si detectan una posible inyección indirecta.

Más peso para Gemini 3.5 Flash

Gemini 3.5 Flash fue presentado en mayo durante la conferencia I/O de Google y destacó desde entonces por su rendimiento en programación y creación de agentes de inteligencia artificial. Con la llegada de Computer Use, el modelo suma una capacidad adicional en ese campo y refuerza su papel como referencia para las tareas generales dentro de la aplicación de Gemini, junto con 3.1 Flash-Lite y 3.1 Pro.