Gestión del contexto
Gestionar el contexto de forma eficaz para obtener mejores resultados
Una gestión eficaz del contexto garantiza que Verdent tenga la información correcta en el momento adecuado, evitando la degradación del rendimiento por sobrecarga de contexto.
Lo que aprenderás
- Comprender las ventanas de contexto y sus límites
- Seleccionar archivos de forma estratégica para un contexto óptimo
- Reconocer la sobrecarga de contexto y responder a ella
- Cuándo restablecer el contexto para mejorar el rendimiento
- Cómo afecta al contexto la organización del espacio de trabajo
Comprender las ventanas de contexto
El tamaño de la ventana de contexto de Verdent for VS Code depende del modelo que se utilice.
La mayoría de los modelos usan ventanas de contexto estándar de 200K:
- Claude 4.5 Sonnet: equilibrado para tareas complejas
- Claude 4.5 Haiku: rápido y eficiente
- GPT-5: excelente para el razonamiento (Beta)
- GPT-5-Codex: optimizado para programación (Beta)
Capacidad:
- ~
200,000tokens de capacidad total de memoria - Suficiente para la mayoría de las tareas de desarrollo y proyectos de tamaño medio
Lo que se incluye:
- Todos los mensajes de la conversación
- El contenido de los archivos cargados en el contexto
- Las salidas y respuestas de las herramientas
- Los prompts del sistema y las instrucciones
- Las definiciones del servidor MCP
Rendimiento:
- Se degrada notablemente al acercarse a los límites
- Presta atención a las señales de sobrecarga de contexto (respuestas más lentas, salidas menos precisas)
- Restablece el contexto con más frecuencia para un rendimiento óptimo
Claude Sonnet 4.5 ofrece contexto extendido (1M tokens) cuando se selecciona de forma explícita o cuando la entrada supera los 200K tokens.
Capacidad:
1,000,000tokens de memoria total- 5 veces más grande que los modelos estándar
Ventajas:
- Ideal para cargar bases de código grandes completas sin dividirlas en fragmentos
- Elimina la mayoría de las preocupaciones sobre gestión de contexto en proyectos grandes
- Trabaja durante más tiempo antes de alcanzar los límites de contexto
- Se necesitan menos restablecimientos de sesión
Cuándo usarlo:
- Bases de código grandes con
1000+archivos - Refactorización compleja de varios archivos en proyectos completos
- Sesiones de desarrollo largas que abarcan varias tareas relacionadas
- Cuando quieras minimizar la carga de gestión del contexto
Selección estratégica de archivos
Sé estratégico al seleccionar archivos para optimizar el uso del contexto y evitar alcanzar los límites.
Comienza con pocos archivos y agrega más solo cuando sea necesario; Verdent siempre puede leer archivos adicionales durante la conversación.
Usa @-menciones para una inclusión explícita
@filename.jsVerdent carga automáticamente los archivos relacionados, pero @-mentions garantiza un contexto exacto. Sé selectivo: incluye solo los archivos directamente relevantes para la tarea actual.
Supervisa el uso del contexto
- Presta atención a la degradación del rendimiento a medida que las sesiones se alargan
- Ten en cuenta la longitud de la conversación y la cantidad de archivos
- Elimina del contexto los archivos innecesarios siempre que sea posible
Evita la sobrecarga de contexto
- Divide las tareas grandes en partes más pequeñas con menos archivos por tarea
- Concéntrate solo en los archivos relacionados: no cargues toda la base de código de una vez
- Usa la gestión del servidor MCP para desactivar las integraciones que no uses
Buenas prácticas
- Incluye solo los archivos que necesiten modificarse o consultarse
- Haz referencia a patrones existentes en lugar de cargar archivos de ejemplo
- Para bases de código grandes, trabaja en un módulo a la vez
- Usa la documentación del proyecto (
AGENTS.md) en lugar de cargar muchos archivos - Evita el último quinto de la ventana de contexto para tareas que consumen mucha memoria
Para contexto extendido (1M tokens)
La selección de archivos se vuelve mucho menos crítica: a menudo puedes cargar repositorios de proyectos completos sin alcanzar los límites.
Reconocer la sobrecarga de contexto
Señales:
- Respuestas menos precisas o incompletas
- Omisión de detalles importantes de momentos anteriores de la conversación
- Dificultad para mantener la coherencia en sesiones largas
- Confusión sobre los cambios recientes o el contexto
Ejemplos concretos:
- Sugiere soluciones que ya rechazaste antes en la sesión
- Ignora las convenciones de programación que estableciste hace
20mensajes - Genera código que entra en conflicto con cambios realizados antes en la conversación
- Propone implementaciones que no coinciden con la arquitectura del proyecto que discutiste previamente
Señal principal: las respuestas de Verdent se vuelven menos precisas o incoherentes
Señales:
- Tiempos de respuesta notablemente más lentos
- Retrasos de procesamiento más largos antes de que comiencen las respuestas
- Mayor latencia entre mensajes
Ejemplos concretos:
- Respuestas que normalmente tardan
5-10segundos ahora tardan30+segundos - Retraso visible antes de que aparezca el indicador de escritura después de enviar un mensaje
- Las respuestas en streaming comienzan mucho más despacio de lo habitual
- La ejecución de herramientas (lecturas de archivos, búsquedas) tarda notablemente más
Señal principal: las respuestas tardan mucho más de lo habitual
Señales:
- Solicita aclaraciones sobre información ya proporcionada
- Olvida patrones o convenciones establecidos anteriormente
- Incapacidad para hacer referencia a archivos o código discutidos previamente
- Preguntas redundantes sobre la estructura del proyecto
Ejemplos concretos:
- Pregunta "¿Qué framework estás usando?" cuando especificaste React hace
30mensajes - Solicita rutas de archivos que ya
@-mentionedvarias veces - No recuerda la convención de nombres que estableciste al inicio de la sesión
- Vuelve a explicar conceptos o enfoques que ya rechazaste con argumentos
Señal principal: Verdent pregunta sobre cosas que ya se discutieron
Señales:
- Acercarse al último quinto del límite de
200Ktokens (~160K+tokens usados) - Conversaciones largas con muchas lecturas de archivos y salidas de herramientas
- Varios servidores MCP activados con definiciones de herramientas pesadas
- Archivos grandes cargados repetidamente en el contexto
Ejemplos concretos:
- La sesión ha estado activa durante
2+horas con100+mensajes - Has cargado
20+archivos con@-mentionsa lo largo de la conversación - Hay varios archivos grandes (
>1000líneas cada uno) en el contexto - Tienes
5+servidores MCP activados con definiciones de herramientas extensas - La conversación incluye muchos resultados de grep/búsqueda y lecturas de archivos
Señal principal: sesiones muy largas con un uso intensivo de archivos y herramientas
Cuándo actuar: la degradación del rendimiento es tu señal principal. Si las respuestas de Verdent se vuelven menos precisas, más lentas o incoherentes, inicia una sesión nueva o usa estrategias de gestión del contexto.
Si las respuestas de Verdent se vuelven vagas o repetitivas, puede estar produciéndose una sobrecarga de contexto. Restablece la conversación para recuperar el rendimiento completo.
Nota: con el contexto de 1M tokens (Claude Sonnet 4.5), estos problemas son mucho menos frecuentes.
Cuándo restablecer el contexto
- Tiempos de respuesta notablemente más lentos
- Respuestas menos precisas o incoherentes
- Verdent olvida el contexto o los patrones anteriores
- Acercarse a los límites de la ventana de contexto (presta atención a las señales de degradación)
Acción: inicia una sesión nueva cuando la calidad se degrade
- Cambiar entre funciones o módulos no relacionados
- Completar un pendiente y pasar al siguiente
- Después de tareas que consumen mucha memoria (refactorizaciones grandes, trabajo de arquitectura)
- Pasar de la fase de investigación a la de implementación
Acción: una sesión nueva para cada tarea principal nueva
- Después de confirmar funciones completadas en el control de versiones
- Entre puntos de control lógicos del flujo de trabajo de desarrollo
- Tras los ciclos de prueba-verificación-commit
Acción: commit → prueba → sesión nueva
- Antes de comenzar funciones nuevas importantes
- Cuando el historial de la conversación se vuelve muy largo
- Después de completar cambios en varios archivos
- Entre distintos tipos de trabajo (depuración → desarrollo de funciones)
Acción: inicia una sesión nueva de forma proactiva antes de que el contexto se degrade
Flujo de trabajo recomendado: completa una unidad de trabajo atómica → prueba → commit → limpia el contexto → comienza de nuevo para la siguiente tarea.
Nota: inicia una sesión nueva para restablecer el contexto. Para los contextos de 1M tokens, limpiar es necesario con mucha menos frecuencia.
Impacto de la organización del espacio de trabajo
La organización del espacio de trabajo afecta directamente la eficiencia con la que se usa el contexto y la facilidad con la que Verdent puede navegar por tu base de código.
Archivos más pequeños y enfocados:
- Muchos archivos pequeños consumen el contexto de forma más eficiente que pocos archivos grandes
- Es más fácil cargar solo los módulos relevantes
- Mejor control granular sobre lo que está en el contexto
- Reduce la necesidad de cargar archivos grandes completos
Estructura de directorios clara:
- Una organización lógica ayuda a Verdent a localizar archivos relacionados
- La organización por función o por módulo mejora la precisión del contexto
- Reduce la necesidad de cargar código no relacionado
Documentation in AGENTS.md:
- La documentación del proyecto reemplaza la necesidad de cargar muchos archivos de ejemplo
- Los patrones de arquitectura se describen una vez y se consultan repetidamente
- Los estándares de programación se documentan de forma centralizada
- Reduce la carga de contexto provocada por lecturas exploratorias de archivos
Ventajas:
- Trabaja en módulos aislados sin cargar toda la base de código
- Los límites claros permiten sesiones enfocadas
- Dividir el trabajo se vuelve natural a lo largo de los límites de los módulos
Problemas:
- Los archivos monolíticos obligan a cargar contextos grandes completos
- Una estructura poco clara requiere cargar muchos archivos para comprender la arquitectura
- Mezclar responsabilidades en los mismos archivos desperdicia contexto en código irrelevante
Impacto:
- Problemas frecuentes con los límites de contexto
- Tokens desperdiciados en código irrelevante
- Dificultad para aislar el trabajo en módulos específicos
- Necesidad más frecuente de restablecer las sesiones
Antipatrones comunes:
- Archivos únicos de
5000+líneas con múltiples responsabilidades - Estructura de directorios plana con
100+archivos en la raíz - Sin una separación clara entre funciones/módulos
- Falta de documentación centralizada
Enfoques de refactorización:
- Divide los archivos grandes en módulos más pequeños y enfocados
- Organiza por función o dominio (no por tipo de archivo)
- Crea una jerarquía de directorios clara
- Extrae el código compartido a módulos separados
Documentación:
- Crea
AGENTS.mdcon patrones de arquitectura - Documenta los estándares de programación de forma centralizada
- Mantén archivos
READMEpor módulo - Mantén documentadas las decisiones de diseño
Impacto en el contexto: para los contextos estándar de 200K tokens, los espacios de trabajo organizados marcan la diferencia entre alcanzar los límites con frecuencia o rara vez. Para los contextos de 1M tokens, la organización importa menos, pero aun así mejora la eficiencia.
Estrategias de optimización del contexto
Una optimización eficaz del contexto combina la supervisión, la planificación estratégica y la configuración técnica.
Presta atención a las señales de rendimiento:
- Supervisa la calidad y la velocidad de las respuestas a lo largo de las sesiones
- Nota cuándo las respuestas se vuelven más lentas o menos precisas
- Lleva un seguimiento manual de la longitud de la conversación y la cantidad de archivos
- Sé proactivo al iniciar sesiones nuevas
Qué supervisar:
- La precisión y la coherencia de las respuestas
- El tiempo hasta la primera respuesta (retraso del indicador de escritura)
- El tiempo total de finalización de la respuesta
- El recuerdo de detalles anteriores de la conversación
Gestión de subagentes:
- Desactiva los subagentes personalizados que no uses cuando no los necesites
- Cada subagente activado agrega definiciones a la carga del sistema
- Mantén activados solo los subagentes que uses activamente
- Vuelve a activarlos según sea necesario para tareas específicas
Umbral de acción: cuando notes 2-3 señales de degradación, es momento de iniciar una sesión nueva.
Supervisa la calidad de las respuestas como un indicador anticipado de la salud del contexto: las respuestas degradadas indican que es momento de restablecer.
Enfoque de fragmentación:
- Divide las tareas grandes en partes más pequeñas
- Completa el trabajo relacionado en sesiones enfocadas
- Evita mezclar distintos tipos de tareas en conversaciones largas
- Evita el último quinto de la ventana de contexto para el trabajo que consume mucha memoria
Gestión de sesiones:
- Inicia sesiones nuevas entre tareas principales
- Limpia el contexto después de los commits: prueba → verifica → commit → sesión nueva
- Usa pendientes para la planificación de varios pasos
- Trabaja en los pendientes en sesiones enfocadas separadas
Patrón de buenas prácticas:
- Planifica la tarea en Plan Mode
- Ejecuta una implementación enfocada en una sesión nueva
- Prueba y verifica los cambios
- Confirma en el control de versiones
- Inicia una sesión nueva para la siguiente tarea
Aislamiento de tareas: mantén la depuración separada del desarrollo de funciones, y la investigación separada de la implementación.
Inclusión estratégica:
- Usa
@-mentionspara la inclusión explícita de archivos solo cuando sea necesario - Aprovecha la documentación
AGENTS.mden lugar de cargar muchos archivos - Trabaja en un módulo a la vez en proyectos grandes
- Divide los archivos grandes en componentes más pequeños y enfocados
Principios de selección de archivos:
- Incluye solo los archivos que necesiten modificarse o consultarse directamente
- Prefiere la documentación antes que la carga de archivos de ejemplo
- Elimina los archivos del contexto cuando ya no se necesiten
- Carga los archivos justo a tiempo, no de forma anticipada
Manejo de archivos grandes:
- Considera dividir los archivos de más de
500líneas - Extrae las utilidades y los auxiliares a archivos separados
- Usa límites de módulos claros
- Documenta las relaciones entre archivos en
AGENTS.md
Flujo de trabajo de optimización:
Supervisa el rendimiento → identifica la sobrecarga de la sesión → desactiva los subagentes que no uses → inicia sesiones nuevas de forma proactiva → concéntrate en la calidad de la tarea
Práctica diaria:
- Comienza cada función importante con contexto nuevo
- Confirma con frecuencia y restablece entre commits
- Mantén las sesiones enfocadas en objetivos únicos
- Revisa el uso del contexto en los puntos de corte naturales
For Extended Context (1M tokens): Con la ventana de contexto más grande de Claude Sonnet 4.5, la optimización se vuelve menos crítica: concéntrate en la calidad de la tarea en lugar de en una gestión agresiva del contexto. No obstante, las buenas prácticas siguen mejorando la eficiencia y la organización.
Preguntas frecuentes
¿Cuál es la diferencia entre las ventanas de contexto de 200K y 1M?
Los modelos estándar (Claude 4.5 Sonnet, Haiku, GPT-5, GPT-5-Codex, MiniMax-M2) tienen ventanas de contexto de 200K tokens, suficientes para la mayoría de las tareas. Claude Sonnet 4.5 ofrece un contexto extendido de 1M tokens (5 veces más grande) para bases de código grandes con 1000+ archivos, refactorización compleja de varios archivos o sesiones de desarrollo largas. El contexto de 1M se activa automáticamente cuando la entrada supera los 200K tokens o se puede seleccionar de forma explícita.
¿Debo restablecer el contexto manualmente o lo hará Verdent automáticamente?
Debes iniciar manualmente una sesión nueva para restablecer el contexto; Verdent no limpia el contexto automáticamente. Buena práctica: restablece después de completar una unidad de trabajo atómica, probar y confirmar en el control de versiones. Para los contextos de 1M tokens, los restablecimientos se necesitan con mucha menos frecuencia.
¿Cuántos archivos puedo cargar de forma segura en el contexto?
No hay un límite fijo de archivos: depende del tamaño de los archivos y del recuento total de tokens. Para los contextos de 200K, evita cargar 20+ archivos grandes (>1000 líneas cada uno). Concéntrate en los archivos directamente relevantes para tu tarea actual. Usa @-mentions de forma selectiva y aprovecha la documentación AGENTS.md en lugar de cargar muchos archivos de ejemplo. Con el contexto de 1M, la selección de archivos se vuelve mucho menos crítica.
¿Qué cuenta para mi ventana de contexto?
Todo lo que hay en tu sesión: todos los mensajes de la conversación, el contenido de los archivos cargados en el contexto, las salidas de las herramientas (resultados de grep/búsqueda, lecturas de archivos), los prompts del sistema y las instrucciones, y las definiciones del servidor MCP. Cada uno de estos elementos consume tokens de tu capacidad total de contexto.
¿Restablecer el contexto perderá mi trabajo?
No: restablecer el contexto solo borra el historial de la conversación y los archivos cargados de la memoria. Tus cambios de código reales, los commits y las modificaciones de archivos se conservan. Confirma siempre tu trabajo en el control de versiones antes de restablecer el contexto por seguridad. Restablece → inicia una sesión nueva → continúa trabajando en la siguiente tarea.