Detalles técnicos de la calculadora de riesgo de muerte
La calculadora consiste en un modelo basado en ensembles de árboles de decisión llamado Light Gradient Boosting Model (LightGBM). A diferencia de otros modelos basados en árboles, este tiene una muy buena eficiencia computacional. Se utilizó una optimización bayesiana para escoger los mejores hiperparámetros. La métrica para el optimizador del modelo fue el área bajo la curva Receiving Operating Characteristic (ROC). Se realizó una calibración de probabilidades con una función sigmoid para hacer las predicciones.
Los datos para entrenar el modelo fueron extraídos de la base de datos recopilados por el Gobierno de México presentes en https://coronavirus.gob.mx/datos/#DownZCSV. Estos datos contienen información clave de los infectados por covid-19 incluyendo su edad, género y comorbilidades.
El resultado final obtuvo un Área bajo la curva ROC (en inglés, AUC) de 90%.