Browser Tool
Automatiza interacciones web, prueba interfaces y captura pantallas usando sesiones de navegador
El Browser Tool habilita interacciones de navegador impulsadas por IA. Inicia sesiones de navegador, selecciona elementos, escribe texto, desplaza páginas y captura pantallas mediante comandos en lenguaje natural.
Lo que aprenderás
- Ciclo de vida de la sesión: iniciar → interactuar → cerrar
- Acciones del navegador: seleccionar, escribir, desplazar
- Casos de uso: pruebas de interfaz, capturas de pantalla, navegación
Ciclo de vida de la sesión
Cada flujo de trabajo de automatización del navegador sigue una secuencia estricta:
- Iniciar - Comienza una sesión de navegador en una URL de destino
- Interactuar - Realiza acciones (seleccionar, escribir, desplazar)
- Cerrar - Finaliza la sesión para liberar recursos
El estado del navegador persiste entre acciones dentro de una sesión. Debes cerrar el navegador antes de usar otras herramientas de Verdent.
Cada acción devuelve una captura de pantalla que muestra el estado actual del navegador. Revisa las capturas entre acciones para verificar el éxito antes de continuar.
Acciones del navegador
Iniciar una nueva sesión de navegador
- Requerido: URL de destino
- Abre el navegador con resolución de 1920x1080
- Siempre la primera acción en cualquier flujo de trabajo
Launch browser at https://example.comSeleccionar en coordenadas específicas
- Requerido: coordenadas x,y
- Las coordenadas son relativas a la ventana de visualización
- Apunta al centro de los elementos para mayor fiabilidad
Click coordinates 450,300Escribir texto con el teclado
- Requerido: texto a escribir
- Escribe en el elemento que tiene el foco actualmente
- A menudo va después de seleccionar un campo de entrada
Type "user@example.com"Desplazar la página
scroll_down- Desplaza una altura de página hacia abajoscroll_up- Desplaza una altura de página hacia arriba- Revela contenido fuera de la pantalla
Scroll down to load more contentFinalizar la sesión del navegador
- Siempre la última acción en cualquier flujo de trabajo
- Requerida antes de usar otras herramientas
- Libera los recursos del navegador
Close browserLas coordenadas son relativas a la ventana de visualización de 1920x1080. El centro es aproximadamente (960, 540). Usa capturas de pantalla para estimar las posiciones de los elementos.
Casos de uso comunes
Probar envíos de formularios y flujos de navegación
Inicia en una página de inicio de sesión, selecciona campos de entrada, escribe credenciales, envía formularios y verifica los resultados mediante capturas de pantalla.
Launch browser at https://app.example.com/login
Click coordinates 450,280
Type "testuser@example.com"
Click coordinates 450,340
Type "password123"
Click coordinates 500,420
Close browserCapturar páginas para documentación
Las capturas de pantalla se toman automáticamente después de cada acción. Navega a las páginas y secciones de destino para crear documentación visual.
Launch browser at https://docs.example.com
Scroll down to API section
Close browserLimitaciones
- Exclusividad de herramienta - Solo browser_action puede usarse durante sesiones activas
- Basado en coordenadas - Requiere coordenadas x,y, no selectores CSS
- Resolución fija - La ventana de visualización del navegador está fijada en 1920x1080
- Solo Chrome - Puppeteer admite navegadores Chrome/Chromium
- Sin persistencia - Las sesiones no sobreviven a los reinicios de Verdent
- Sin soporte para WSL - Browser Tool no funciona en entornos WSL
- Sin estado guardado - Cada sesión comienza desde cero sin cookies ni autenticación
- Sesión única - Solo una sesión de navegador puede estar activa a la vez
Cierra siempre la sesión del navegador antes de usar operaciones de archivos, herramientas de búsqueda o comandos bash. El navegador bloquea otras herramientas durante las sesiones activas.