Predicción de COVID-19 en contextos metropolitanos: optimización de modelos de contagio con Recocido Simulado

Una mejora al algoritmo NIPA con datos del brote en Hubei, China

Autores

Teun Hoven, Tilburg University
Alberto García Robledo, SECIHTI–CentroGeo
Mahboobeh Zangiabady, University of Twente

Resumen

En este estudio se propone una mejora al algoritmo de predicción NIPA (Network Inference-based Prediction Algorithm), que se basa en modelos epidémicos de tipo SIR e inferencia de redes, mediante la aplicación del algoritmo de Recocido Simulado para optimizar parámetros críticos. Esta optimización permite mejorar la predicción de la evolución temporal de enfermedades infecciosas como el COVID-19, especialmente en regiones densamente pobladas. La validación se realizó utilizando datos del brote de COVID-19 en la provincia china de Hubei entre el 21 de enero y el 14 de febrero de 2020. Los resultados muestran que el uso de Recocido Simulado mejora la precisión predictiva respecto a técnicas tradicionales como la validación cruzada, lo que representa una contribución relevante para la modelación y gestión de crisis sanitarias en entornos metropolitanos.

Introducción

Desde el inicio de la pandemia de COVID-19, las ciudades y zonas metropolitanas se convirtieron en epicentros de propagación del virus debido a su alta densidad poblacional, movilidad intensa y redes de interacción complejas. Predecir la evolución de contagios en estos contextos representa un desafío técnico y estratégico, ya que implica anticipar dinámicas no lineales influenciadas por múltiples factores biológicos, sociales y espaciales.

Numerosos enfoques se han propuesto para modelar estas dinámicas, desde modelos compartimentales simples como el modelo SIR hasta modelos de aprendizaje automático. Una línea especialmente prometedora ha sido la que combina modelos epidemiológicos con estructuras de red, lo que permite representar explícitamente las interacciones entre regiones o grupos poblacionales. En este contexto, el algoritmo NIPA ha demostrado ser uno de los métodos más precisos para predecir brotes epidémicos a partir de datos observacionales, utilizando técnicas de inferencia estadística sobre redes dirigidas.

Sin embargo, uno de los cuellos de botella del modelo es el proceso de calibración de sus parámetros clave, en particular el coeficiente de regularización de LASSO, que controla cuántos vínculos de contagio son considerados significativos. Tradicionalmente, este valor se ajusta mediante validación cruzada, un método costoso y a veces inestable. Este estudio propone sustituir dicha técnica por el algoritmo de Recocido Simulado, con el objetivo de mejorar la eficiencia y precisión del proceso de predicción, especialmente en entornos urbanos complejos.

Modelos epidemiológicos y redes de contagio

La predicción de brotes epidémicos en zonas urbanas requiere herramientas que consideren tanto la dinámica biológica de transmisión como las características topológicas del territorio. El algoritmo NIPA combina el modelo SIR (Susceptible–Infectado–Recuperado) con una formulación de inferencia estadística basada en redes. Su objetivo es estimar una matriz de probabilidades de infección entre regiones o nodos geográficos, a partir de series temporales de casos.

NIPA resuelve este problema formulando una regresión penalizada mediante el operador LASSO (Least Absolute Shrinkage and Selection Operator), que permite inducir una estructura dispersa en la red inferida, es decir, identificar un subconjunto relevante de enlaces de contagio. La calidad de la predicción depende fuertemente del valor del parámetro de regularización (ρ), que controla dicha dispersión. Hasta ahora, este parámetro se seleccionaba utilizando validación cruzada (CV), una técnica intensiva en cómputo y potencialmente inestable.

Introducción del Recocido Simulado como técnica de optimización

El presente estudio propone reemplazar la validación cruzada por una técnica de optimización metaheurística conocida como Recocido Simulado. Este método, inspirado en procesos físicos de enfriamiento de metales, permite explorar el espacio de parámetros de manera controlada pero aleatoria, escapando de mínimos locales y mejorando la búsqueda de soluciones óptimas.

El Recocido Simulado se aplicó para optimizar tanto el parámetro de regularización (ρ) como la probabilidad de recuperación (δ) en el modelo SIR. La implementación se realizó con el algoritmo de dual annealing del paquete SciPy, el cual combina el Recocido Clásico con búsqueda local, incorporando estrategias de exploración global basadas en distribuciones tipo Cauchy-Lorentz.

Datos y validación: el caso de Hubei, China

Para evaluar la efectividad del enfoque, se utilizó el conjunto de datos de casos confirmados de COVID-19 en la provincia de Hubei, China, entre el 21 de enero y el 14 de febrero de 2020. Esta provincia, cuya capital es Wuhan, representa una región metropolitana de gran densidad y movilidad, siendo además el epicentro inicial de la pandemia.

Los datos fueron procesados para ajustar el modelo NIPA con y sin Recocido Simulado, comparando la capacidad predictiva en horizontes de 1 a 6 días. Se utilizó el error cuadrático medio (MSE) como métrica principal, aplicando la evaluación sobre subconjuntos de datos removidos para simular predicción prospectiva.

Resultados y análisis comparativo

Los resultados muestran que el modelo NIPA optimizado con Recocido Simulado logra una ligera pero consistente mejora en la precisión de las predicciones en comparación con la versión tradicional basada en CV. Las curvas de predicción se ajustan mejor al comportamiento real de los casos acumulados, salvo excepciones en ciertos días puntuales, atribuibles a la naturaleza estocástica del algoritmo.

En términos de cómputo, el Recocido Simulado presenta un mayor tiempo de ejecución (promedio de 4 min 24 s frente a 1 min 7 s de CV), debido a su naturaleza secuencial. Sin embargo, esta diferencia puede mitigarse mediante paralelización o estrategias de reducción del espacio de búsqueda, y puede justificarse en escenarios donde la precisión sea prioritaria.

Relevancia metropolitana y perspectivas

La utilidad del modelo se acentúa en zonas metropolitanas, donde las decisiones de política pública deben considerar patrones complejos de propagación y movilidad interregional. La capacidad del Recocido Simulado para mejorar la calibración de modelos SIR con inferencia de redes ofrece una herramienta valiosa para los observatorios urbanos y de salud pública.

El estudio sugiere líneas futuras de investigación, incluyendo la aplicación del algoritmo a variantes de NIPA con redes dinámicas, conocimiento previo de movilidad o integración con enfoques bayesianos.

Conclusiones

  • Se propone el uso del Recocido Simulado para la optimización de parámetros en el modelo NIPA.
  • Los resultados empíricos muestran una mejora en la precisión predictiva respecto a validación cruzada.
  • El enfoque fue validado en la provincia de Hubei, una región metropolitana crítica durante la pandemia de COVID-19.
  • Este tipo de metodologías es particularmente relevante para entornos urbanos y metropolitanos donde la densidad, movilidad y conectividad amplifican los riesgos epidémicos.
  • El Recocido Simulado constituye una técnica robusta para apoyar la predicción epidemiológica en modelos basados en redes.

Referencia:
Hoven, T., García-Robledo, A., & Zangiabady, M. (2024). Enhancing Epidemic Prediction Using Simulated Annealing for Parameter Optimization in Infection Network Inference. Proceedings of the 7th International Conference on Algorithms, Computing and Artificial Intelligence (ACAI 2024), pp. 1–8. IEEE. https://doi.org/10.1109/ACAI63924.2024.10899726