Compartir

Google ha presentado Gemini 2.5 Computer Use, un nuevo modelo de inteligencia artificial (IA) diseñado para navegar e interactuar con páginas web y aplicaciones tal como lo haría un humano.

Por: El Diario NY

Esta herramienta marca una evolución dentro del ecosistema de Gemini, al permitir que los agentes realicen tareas complejas directamente sobre interfaces visuales, haciendo clic, escribiendo o desplazándose en pantalla.

Hasta ahora, la mayoría de los modelos de IA limitaban su interacción a sistemas predefinidos. Con esta versión, Google busca que la IA pueda desenvolverse en entornos reales, donde es necesario interpretar y manipular gráficos, formularios o botones, igual que un usuario.

Cómo funciona Gemini 2.5 Computer Use

El modelo se basa en las capacidades de razonamiento visual de Gemini 2.5 Pro, lo que le permite entender el contexto visual de una interfaz y actuar en consecuencia. Puede visitar páginas web, desplazarse por ellas, rellenar formularios, hacer clic en enlaces, arrastrar y soltar elementos o incluso seleccionar opciones en menús desplegables.

Puedes leer la nota completa en El Diario NY

A petición de nuestra audiencia todos los anuncios publicitarios fueron removidos

Por abc noticias

www.abcnoticias.net es periodismo independiente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *