Skip to content
SP StackPractices
intermediate Por StackPractices

Plantilla de Plan de Ejecucion de Pruebas de Carga

Una plantilla para planificar, ejecutar y documentar pruebas de carga que miden el comportamiento del sistema bajo trafico realista o pico.

Nota para desarrolladores hispanohablantes: Esta guía incluye ejemplos y convenciones de nomenclatura adaptadas a equipos que trabajan en español. Cuando existen diferencias significativas en terminología técnica entre el inglés y el español, se indican explícitamente para facilitar la comunicación en equipos multiculturales.

Descripcion General

Las pruebas de carga evaluan como se comporta un sistema bajo trafico realista o de pico. Esta plantilla ayuda a los equipos a definir objetivos de prueba, seleccionar escenarios, preparar entornos, ejecutar pruebas y documentar resultados. Asegura que el trabajo de rendimiento sea repetible y vinculado a criterios de exito claros.

Cuando Usar

  • Antes de un lanzamiento de producto importante o campana de marketing.
  • Despues de cambios significativos de arquitectura o infraestructura.
  • Cuando cambian los objetivos de escalado o las proyecciones de crecimiento de usuarios.
  • Cuando aparecen problemas de latencia o tasa de error bajo carga.
  • Como parte de una suite regular de pruebas de regresion de rendimiento.
  • Antes de la planificacion de capacidad o la optimizacion de costos.

Prerequisitos

  • Un entorno de prueba similar a produccion que refleje topologia y datos.
  • Herramientas de pruebas de carga como k6, JMeter, Gatling o Locust.
  • Monitoreo y observabilidad del sistema bajo prueba.
  • Metricas de linea base del trafico normal de produccion.
  • Dueno claro y una ventana de prueba programada.
  • Un plan de rollback o escalado si la prueba revela problemas.

Solucion

Plantilla

1. Objetivos y Alcance de la Prueba

CampoDescripcionEjemplo
ID de pruebaIdentificador unicoLT-2026-Q3-001
Sistema bajo pruebaAplicacion o servicioCheckout API
Fecha de pruebaCuando se ejecuta la prueba2026-06-27
Dueno de la pruebaIngeniero responsable de la ejecucionEquipo de rendimiento
StakeholdersEquipos a notificarSRE, backend, plataforma, producto
ObjetivoPor que se ejecuta la pruebaValidar que el checkout soporte 10x de trafico en el lanzamiento
AlcanceQue se incluyeEndpoints de API, base de datos, cache, cola
Fuera de alcanceQue no se pruebaProcesador de pagos, integraciones de terceros

2. Escenarios de Prueba

ID de EscenarioDescripcionEndpoint / FlujoUsuarios VirtualesRamp UpDuracionThink Time
S01Navegar catalogoGET /products5002 min10 min1-3 s
S02Agregar al carritoPOST /cart/items3002 min10 min1-3 s
S03CheckoutPOST /orders2002 min10 min2-5 s
S04BusquedaGET /search?q=...4002 min10 min1-2 s
S05Pico maximoTodos los endpoints combinados20005 min15 min0-1 s

3. Criterios de Exito

MetricaLinea BaseObjetivoNo Debe SuperarNotas
Latencia p5045 ms< 60 ms80 msPara respuestas de API
Latencia p95120 ms< 150 ms200 msPara respuestas de API
Latencia p99300 ms< 400 ms600 msPara respuestas de API
Tasa de error0.01%< 0.1%0.5%HTTP 5xx y timeouts
Throughput1000 RPS> 2000 RPS-Ordenes por segundo
Uso de CPU40%< 70%80%Por nodo de aplicacion
Uso de memoria50%< 70%85%Por nodo de aplicacion
Conexiones de base de datos80< 150200Conexiones activas
Profundidad de cola10< 50100Jobs en segundo plano

4. Configuracion del Entorno

Recursodev/testproductionNotas
Nodos de aplicacion26Mismo tamano de instancia
Load balancer12Misma configuracion
Base de datosInstancia unicaCluster Multi-AZMisma version mayor
Cache1 nodo3 nodosMisma version del engine
Cola de mensajes1 nodo3 nodosMisma configuracion
Generador de carga4 inyectoresN/AInstancias cloud o contenedores
RedVPC aisladaVPC de produccionReflejar latencia y topologia
Volumen de datos10% de produccionProduccion completaUsar datos anonimizados

5. Plan de Ejecucion

PasoAccionDuenoTiempo
1Verificar entorno y monitoreoSRET-30 min
2Reiniciar entorno a estado conocidoSRET-20 min
3Desplegar scripts de prueba y datosEquipo de rendimientoT-15 min
4Ejecutar prueba de linea base con carga bajaEquipo de rendimientoT-10 min
5Ejecutar escenarios S01-S04Equipo de rendimientoT0
6Ejecutar escenario de pico S05Equipo de rendimientoT+15 min
7Monitorear sistema y recolectar metricasSRET+15 a T+30 min
8Reducir carga gradualmente y detener la pruebaEquipo de rendimientoT+30 min
9Exportar resultados y logsEquipo de rendimientoT+35 min
10Restaurar entornoSRET+45 min

6. Resultados y Analisis

EscenarioMax VUsPico RPSLatencia p95Latencia p99Tasa de ErrorCPU PromMemoria PromResultado
S01500120055 ms180 ms0.01%45%60%Aprobado
S0230080090 ms250 ms0.02%55%65%Aprobado
S03200450140 ms380 ms0.05%60%70%Aprobado
S0440095070 ms210 ms0.01%50%62%Aprobado
S0520003400220 ms700 ms0.8%85%88%Fallido

7. Hallazgos y Remediacion

ID de HallazgoDescripcionSeveridadRecomendacionDuenoFecha Limite
LT-001Pool de conexiones de base de datos agotado durante el picoAltaAumentar tamano del pool y agregar reintentos de conexionEquipo backend2026-07-04
LT-002Tasa de aciertos de cache cae bajo carga de busquedaMediaAgregar cache de resultados de busqueda y ajustar TTLEquipo backend2026-07-11
LT-003Profundidad de cola crece cuando la tasa de ordenes excede la capacidad del consumidorMediaEscalar workers de segundo plano horizontalmenteEquipo de plataforma2026-07-11

Explicacion

Las pruebas de carga no solo tratan de encontrar el punto de ruptura. Se trata de entender como se degrada un sistema, donde estan los cuellos de botella y si la capacidad actual cumple con las expectativas de usuarios y negocio. Un plan de ejecucion documentado hace que las pruebas de rendimiento sean repetibles, comparables entre releases y accionables para los equipos de ingenieria.

Variantes

  • Plan de spike test: Enfocado en rafagas repentinas de trafico y comportamiento de recuperacion.
  • Plan de stress test: Empuja el sistema mas alla de los limites esperados para encontrar modos de falla.
  • Plan de endurance test: Ejecuta carga moderada por horas o dias para detectar fugas de memoria o deriva.
  • Plan de soak test: Prueba de larga duracion con carga similar a produccion para validar estabilidad.
  • Plan de scalability test: Aumenta la carga mientras se agregan recursos para medir eficiencia de escalado.
  • Plan de prueba de carga basada en navegador: Usa sesiones reales de navegador para medir rendimiento frontend y API juntos.

Mejores Practicas

  • Prueba en un entorno similar a produccion con datos representativos y patrones de trafico reales.
  • Define criterios de exito antes de ejecutar la prueba.
  • Comienza con una linea base y aumenta la carga gradualmente.
  • Monitorea tanto metricas de aplicacion como de infraestructura.
  • Ejecuta las pruebas multiples veces para confirmar reproducibilidad.
  • Incluye metricas de negocio como tasa de conversion o throughput de transacciones.
  • Documenta hallazgos y asigna duenos antes de cerrar la prueba.
  • Automatiza pruebas de regresion en CI/CD para caminos criticos.
  • Coordina con el equipo para evitar impactar produccion o entornos compartidos.

Errores Comunes

  • Ejecutar pruebas de carga directamente contra produccion.
  • Usar trafico sintetico que no coincide con el comportamiento real de usuarios.
  • Probar solo un endpoint en lugar de la jornada completa del usuario.
  • Ignorar cold start, warm-up de cache o efectos de seeding de base de datos.
  • No involucrar al equipo de plataforma o SRE durante la ejecucion.
  • Definir criterios de exito demasiado laxos o indefinidos.
  • Ejecutar las pruebas una sola vez y no repetirlas despues de cambios.
  • No correlacionar metricas de infraestructura con la latencia de aplicacion.

FAQs

Que herramientas se usan comúnmente para pruebas de carga?

Las herramientas populares incluyen k6, Apache JMeter, Gatling, Locust y Artillery. La eleccion depende del soporte de protocolos, lenguaje de scripting y necesidades de reportes.

Como simulamos el comportamiento real de usuarios?

Usa logs de produccion para modelar patrones de request, agrega think time entre requests, varia los inputs de datos e incluye una mezcla de operaciones de lectura y escritura.

Deberiamos ejecutar pruebas de carga en produccion?

Las pruebas de carga en produccion son riesgosas y generalmente solo se hacen con trafico sintetico, feature flags y aislamiento. Prefiere entornos dedicados similares a produccion para la mayoria de las pruebas de carga.