Gestión del contexto

Una gestión eficaz del contexto garantiza que Verdent tenga la información correcta en el momento adecuado, evitando la degradación del rendimiento por sobrecarga de contexto.

Lo que aprenderás

Comprender las ventanas de contexto y sus límites
Seleccionar archivos de forma estratégica para un contexto óptimo
Reconocer la sobrecarga de contexto y responder a ella
Cuándo restablecer el contexto para mejorar el rendimiento
Cómo afecta al contexto la organización del espacio de trabajo

Comprender las ventanas de contexto

El tamaño de la ventana de contexto de Verdent for VS Code depende del modelo que se utilice.

La mayoría de los modelos usan ventanas de contexto estándar de 200K:

Claude 4.5 Sonnet: equilibrado para tareas complejas
Claude 4.5 Haiku: rápido y eficiente
GPT-5: excelente para el razonamiento (Beta)
GPT-5-Codex: optimizado para programación (Beta)

Capacidad:

~200,000 tokens de capacidad total de memoria
Suficiente para la mayoría de las tareas de desarrollo y proyectos de tamaño medio

Lo que se incluye:

Todos los mensajes de la conversación
El contenido de los archivos cargados en el contexto
Las salidas y respuestas de las herramientas
Los prompts del sistema y las instrucciones
Las definiciones del servidor MCP

Rendimiento:

Se degrada notablemente al acercarse a los límites
Presta atención a las señales de sobrecarga de contexto (respuestas más lentas, salidas menos precisas)
Restablece el contexto con más frecuencia para un rendimiento óptimo

Claude Sonnet 4.5 ofrece contexto extendido (1M tokens) cuando se selecciona de forma explícita o cuando la entrada supera los 200K tokens.

Capacidad:

1,000,000 tokens de memoria total
5 veces más grande que los modelos estándar

Ventajas:

Ideal para cargar bases de código grandes completas sin dividirlas en fragmentos
Elimina la mayoría de las preocupaciones sobre gestión de contexto en proyectos grandes
Trabaja durante más tiempo antes de alcanzar los límites de contexto
Se necesitan menos restablecimientos de sesión

Cuándo usarlo:

Bases de código grandes con 1000+ archivos
Refactorización compleja de varios archivos en proyectos completos
Sesiones de desarrollo largas que abarcan varias tareas relacionadas
Cuando quieras minimizar la carga de gestión del contexto

Selección estratégica de archivos

Sé estratégico al seleccionar archivos para optimizar el uso del contexto y evitar alcanzar los límites.

Comienza con pocos archivos y agrega más solo cuando sea necesario; Verdent siempre puede leer archivos adicionales durante la conversación.

Usa @-menciones para una inclusión explícita

@filename.js

Verdent carga automáticamente los archivos relacionados, pero @-mentions garantiza un contexto exacto. Sé selectivo: incluye solo los archivos directamente relevantes para la tarea actual.

Supervisa el uso del contexto

Presta atención a la degradación del rendimiento a medida que las sesiones se alargan
Ten en cuenta la longitud de la conversación y la cantidad de archivos
Elimina del contexto los archivos innecesarios siempre que sea posible

Evita la sobrecarga de contexto

Divide las tareas grandes en partes más pequeñas con menos archivos por tarea
Concéntrate solo en los archivos relacionados: no cargues toda la base de código de una vez
Usa la gestión del servidor MCP para desactivar las integraciones que no uses

Buenas prácticas

Incluye solo los archivos que necesiten modificarse o consultarse
Haz referencia a patrones existentes en lugar de cargar archivos de ejemplo
Para bases de código grandes, trabaja en un módulo a la vez
Usa la documentación del proyecto (AGENTS.md) en lugar de cargar muchos archivos
Evita el último quinto de la ventana de contexto para tareas que consumen mucha memoria

Para contexto extendido (1M tokens)

La selección de archivos se vuelve mucho menos crítica: a menudo puedes cargar repositorios de proyectos completos sin alcanzar los límites.

Reconocer la sobrecarga de contexto

Señales:

Respuestas menos precisas o incompletas
Omisión de detalles importantes de momentos anteriores de la conversación
Dificultad para mantener la coherencia en sesiones largas
Confusión sobre los cambios recientes o el contexto

Ejemplos concretos:

Sugiere soluciones que ya rechazaste antes en la sesión
Ignora las convenciones de programación que estableciste hace 20 mensajes
Genera código que entra en conflicto con cambios realizados antes en la conversación
Propone implementaciones que no coinciden con la arquitectura del proyecto que discutiste previamente

Señal principal: las respuestas de Verdent se vuelven menos precisas o incoherentes

Señales:

Tiempos de respuesta notablemente más lentos
Retrasos de procesamiento más largos antes de que comiencen las respuestas
Mayor latencia entre mensajes

Ejemplos concretos:

Respuestas que normalmente tardan 5-10 segundos ahora tardan 30+ segundos
Retraso visible antes de que aparezca el indicador de escritura después de enviar un mensaje
Las respuestas en streaming comienzan mucho más despacio de lo habitual
La ejecución de herramientas (lecturas de archivos, búsquedas) tarda notablemente más

Señal principal: las respuestas tardan mucho más de lo habitual

Señales:

Solicita aclaraciones sobre información ya proporcionada
Olvida patrones o convenciones establecidos anteriormente
Incapacidad para hacer referencia a archivos o código discutidos previamente
Preguntas redundantes sobre la estructura del proyecto

Ejemplos concretos:

Pregunta "¿Qué framework estás usando?" cuando especificaste React hace 30 mensajes
Solicita rutas de archivos que ya @-mentioned varias veces
No recuerda la convención de nombres que estableciste al inicio de la sesión
Vuelve a explicar conceptos o enfoques que ya rechazaste con argumentos

Señal principal: Verdent pregunta sobre cosas que ya se discutieron

Señales:

Acercarse al último quinto del límite de 200K tokens (~160K+ tokens usados)
Conversaciones largas con muchas lecturas de archivos y salidas de herramientas
Varios servidores MCP activados con definiciones de herramientas pesadas
Archivos grandes cargados repetidamente en el contexto

Ejemplos concretos:

La sesión ha estado activa durante 2+ horas con 100+ mensajes
Has cargado 20+ archivos con @-mentions a lo largo de la conversación
Hay varios archivos grandes (>1000 líneas cada uno) en el contexto
Tienes 5+ servidores MCP activados con definiciones de herramientas extensas
La conversación incluye muchos resultados de grep/búsqueda y lecturas de archivos

Señal principal: sesiones muy largas con un uso intensivo de archivos y herramientas

Cuándo actuar: la degradación del rendimiento es tu señal principal. Si las respuestas de Verdent se vuelven menos precisas, más lentas o incoherentes, inicia una sesión nueva o usa estrategias de gestión del contexto.

Si las respuestas de Verdent se vuelven vagas o repetitivas, puede estar produciéndose una sobrecarga de contexto. Restablece la conversación para recuperar el rendimiento completo.

Nota: con el contexto de 1M tokens (Claude Sonnet 4.5), estos problemas son mucho menos frecuentes.

Cuándo restablecer el contexto

Tiempos de respuesta notablemente más lentos
Respuestas menos precisas o incoherentes
Verdent olvida el contexto o los patrones anteriores
Acercarse a los límites de la ventana de contexto (presta atención a las señales de degradación)

Acción: inicia una sesión nueva cuando la calidad se degrade

Cambiar entre funciones o módulos no relacionados
Completar un pendiente y pasar al siguiente
Después de tareas que consumen mucha memoria (refactorizaciones grandes, trabajo de arquitectura)
Pasar de la fase de investigación a la de implementación

Acción: una sesión nueva para cada tarea principal nueva

Después de confirmar funciones completadas en el control de versiones
Entre puntos de control lógicos del flujo de trabajo de desarrollo
Tras los ciclos de prueba-verificación-commit

Acción: commit → prueba → sesión nueva

Antes de comenzar funciones nuevas importantes
Cuando el historial de la conversación se vuelve muy largo
Después de completar cambios en varios archivos
Entre distintos tipos de trabajo (depuración → desarrollo de funciones)

Acción: inicia una sesión nueva de forma proactiva antes de que el contexto se degrade

Flujo de trabajo recomendado: completa una unidad de trabajo atómica → prueba → commit → limpia el contexto → comienza de nuevo para la siguiente tarea.

Nota: inicia una sesión nueva para restablecer el contexto. Para los contextos de 1M tokens, limpiar es necesario con mucha menos frecuencia.

Impacto de la organización del espacio de trabajo

La organización del espacio de trabajo afecta directamente la eficiencia con la que se usa el contexto y la facilidad con la que Verdent puede navegar por tu base de código.

Archivos más pequeños y enfocados:

Muchos archivos pequeños consumen el contexto de forma más eficiente que pocos archivos grandes
Es más fácil cargar solo los módulos relevantes
Mejor control granular sobre lo que está en el contexto
Reduce la necesidad de cargar archivos grandes completos

Estructura de directorios clara:

Una organización lógica ayuda a Verdent a localizar archivos relacionados
La organización por función o por módulo mejora la precisión del contexto
Reduce la necesidad de cargar código no relacionado

Documentation in AGENTS.md:

La documentación del proyecto reemplaza la necesidad de cargar muchos archivos de ejemplo
Los patrones de arquitectura se describen una vez y se consultan repetidamente
Los estándares de programación se documentan de forma centralizada
Reduce la carga de contexto provocada por lecturas exploratorias de archivos

Ventajas:

Trabaja en módulos aislados sin cargar toda la base de código
Los límites claros permiten sesiones enfocadas
Dividir el trabajo se vuelve natural a lo largo de los límites de los módulos

Problemas:

Los archivos monolíticos obligan a cargar contextos grandes completos
Una estructura poco clara requiere cargar muchos archivos para comprender la arquitectura
Mezclar responsabilidades en los mismos archivos desperdicia contexto en código irrelevante

Impacto:

Problemas frecuentes con los límites de contexto
Tokens desperdiciados en código irrelevante
Dificultad para aislar el trabajo en módulos específicos
Necesidad más frecuente de restablecer las sesiones

Antipatrones comunes:

Archivos únicos de 5000+ líneas con múltiples responsabilidades
Estructura de directorios plana con 100+ archivos en la raíz
Sin una separación clara entre funciones/módulos
Falta de documentación centralizada

Enfoques de refactorización:

Divide los archivos grandes en módulos más pequeños y enfocados
Organiza por función o dominio (no por tipo de archivo)
Crea una jerarquía de directorios clara
Extrae el código compartido a módulos separados

Documentación:

Crea AGENTS.md con patrones de arquitectura
Documenta los estándares de programación de forma centralizada
Mantén archivos README por módulo
Mantén documentadas las decisiones de diseño

Impacto en el contexto: para los contextos estándar de 200K tokens, los espacios de trabajo organizados marcan la diferencia entre alcanzar los límites con frecuencia o rara vez. Para los contextos de 1M tokens, la organización importa menos, pero aun así mejora la eficiencia.

Estrategias de optimización del contexto

Una optimización eficaz del contexto combina la supervisión, la planificación estratégica y la configuración técnica.

Presta atención a las señales de rendimiento:

Supervisa la calidad y la velocidad de las respuestas a lo largo de las sesiones
Nota cuándo las respuestas se vuelven más lentas o menos precisas
Lleva un seguimiento manual de la longitud de la conversación y la cantidad de archivos
Sé proactivo al iniciar sesiones nuevas

Qué supervisar:

La precisión y la coherencia de las respuestas
El tiempo hasta la primera respuesta (retraso del indicador de escritura)
El tiempo total de finalización de la respuesta
El recuerdo de detalles anteriores de la conversación

Gestión de subagentes:

Desactiva los subagentes personalizados que no uses cuando no los necesites
Cada subagente activado agrega definiciones a la carga del sistema
Mantén activados solo los subagentes que uses activamente
Vuelve a activarlos según sea necesario para tareas específicas

Umbral de acción: cuando notes 2-3 señales de degradación, es momento de iniciar una sesión nueva.

Supervisa la calidad de las respuestas como un indicador anticipado de la salud del contexto: las respuestas degradadas indican que es momento de restablecer.

Enfoque de fragmentación:

Divide las tareas grandes en partes más pequeñas
Completa el trabajo relacionado en sesiones enfocadas
Evita mezclar distintos tipos de tareas en conversaciones largas
Evita el último quinto de la ventana de contexto para el trabajo que consume mucha memoria

Gestión de sesiones:

Inicia sesiones nuevas entre tareas principales
Limpia el contexto después de los commits: prueba → verifica → commit → sesión nueva
Usa pendientes para la planificación de varios pasos
Trabaja en los pendientes en sesiones enfocadas separadas

Patrón de buenas prácticas:

Planifica la tarea en Plan Mode
Ejecuta una implementación enfocada en una sesión nueva
Prueba y verifica los cambios
Confirma en el control de versiones
Inicia una sesión nueva para la siguiente tarea

Aislamiento de tareas: mantén la depuración separada del desarrollo de funciones, y la investigación separada de la implementación.

Inclusión estratégica:

Usa @-mentions para la inclusión explícita de archivos solo cuando sea necesario
Aprovecha la documentación AGENTS.md en lugar de cargar muchos archivos
Trabaja en un módulo a la vez en proyectos grandes
Divide los archivos grandes en componentes más pequeños y enfocados

Principios de selección de archivos:

Incluye solo los archivos que necesiten modificarse o consultarse directamente
Prefiere la documentación antes que la carga de archivos de ejemplo
Elimina los archivos del contexto cuando ya no se necesiten
Carga los archivos justo a tiempo, no de forma anticipada

Manejo de archivos grandes:

Considera dividir los archivos de más de 500 líneas
Extrae las utilidades y los auxiliares a archivos separados
Usa límites de módulos claros
Documenta las relaciones entre archivos en AGENTS.md

Flujo de trabajo de optimización:

Supervisa el rendimiento → identifica la sobrecarga de la sesión → desactiva los subagentes que no uses → inicia sesiones nuevas de forma proactiva → concéntrate en la calidad de la tarea

Práctica diaria:

Comienza cada función importante con contexto nuevo
Confirma con frecuencia y restablece entre commits
Mantén las sesiones enfocadas en objetivos únicos
Revisa el uso del contexto en los puntos de corte naturales

For Extended Context (1M tokens): Con la ventana de contexto más grande de Claude Sonnet 4.5, la optimización se vuelve menos crítica: concéntrate en la calidad de la tarea en lugar de en una gestión agresiva del contexto. No obstante, las buenas prácticas siguen mejorando la eficiencia y la organización.

Preguntas frecuentes

¿Cuál es la diferencia entre las ventanas de contexto de 200K y 1M?

Los modelos estándar (Claude 4.5 Sonnet, Haiku, GPT-5, GPT-5-Codex, MiniMax-M2) tienen ventanas de contexto de 200K tokens, suficientes para la mayoría de las tareas. Claude Sonnet 4.5 ofrece un contexto extendido de 1M tokens (5 veces más grande) para bases de código grandes con 1000+ archivos, refactorización compleja de varios archivos o sesiones de desarrollo largas. El contexto de 1M se activa automáticamente cuando la entrada supera los 200K tokens o se puede seleccionar de forma explícita.

¿Debo restablecer el contexto manualmente o lo hará Verdent automáticamente?

Debes iniciar manualmente una sesión nueva para restablecer el contexto; Verdent no limpia el contexto automáticamente. Buena práctica: restablece después de completar una unidad de trabajo atómica, probar y confirmar en el control de versiones. Para los contextos de 1M tokens, los restablecimientos se necesitan con mucha menos frecuencia.

¿Cuántos archivos puedo cargar de forma segura en el contexto?

No hay un límite fijo de archivos: depende del tamaño de los archivos y del recuento total de tokens. Para los contextos de 200K, evita cargar 20+ archivos grandes (>1000 líneas cada uno). Concéntrate en los archivos directamente relevantes para tu tarea actual. Usa @-mentions de forma selectiva y aprovecha la documentación AGENTS.md en lugar de cargar muchos archivos de ejemplo. Con el contexto de 1M, la selección de archivos se vuelve mucho menos crítica.

¿Qué cuenta para mi ventana de contexto?

Todo lo que hay en tu sesión: todos los mensajes de la conversación, el contenido de los archivos cargados en el contexto, las salidas de las herramientas (resultados de grep/búsqueda, lecturas de archivos), los prompts del sistema y las instrucciones, y las definiciones del servidor MCP. Cada uno de estos elementos consume tokens de tu capacidad total de contexto.

¿Restablecer el contexto perderá mi trabajo?

No: restablecer el contexto solo borra el historial de la conversación y los archivos cargados de la memoria. Tus cambios de código reales, los commits y las modificaciones de archivos se conservan. Confirma siempre tu trabajo en el control de versiones antes de restablecer el contexto por seguridad. Restablece → inicia una sesión nueva → continúa trabajando en la siguiente tarea.

Gestión del contexto

Lo que aprenderás

Comprender las ventanas de contexto

Selección estratégica de archivos

Usa @-menciones para una inclusión explícita

Supervisa el uso del contexto

Evita la sobrecarga de contexto

Buenas prácticas

Para contexto extendido (1M tokens)

Reconocer la sobrecarga de contexto

Cuándo restablecer el contexto

Impacto de la organización del espacio de trabajo

Estrategias de optimización del contexto

Preguntas frecuentes

Véase también

Ingeniería de prompts

Modos de ejecución

Gestión de recursos

On this page