Cuestiones sobre la aplicación predictiva en variables de coyuntura económica
La experiencia del equipo de JuiceTIC posibilita que la ciencia de datos aporte soluciones predictivas también a nivel económico.
Nuestros retos:
- ¿Es posible aplicar la ciencia de datos para obtener bases de cálculo de indicadores económicos?
- ¿Cabe la posibilidad de estimar los ponderadores de agregación de los índices oficiales de precios al consumo?

Y la pregunta a la que queremos dar respuesta:
¿Seremos capaces de “predecir” los ponderadores de los IPC, verdadera incógnita del modelo de integración, de forma genérica y concretar una fórmula aplicable país a país, como en el IPC en México?

El Índice de Precios al Consumidor
El IPC en los paises alineados en materia de inflación con el Banco Mundial es un indicador que mide en el tiempo la variación de los precios de una canasta de bienes y servicios representativa del consumo de los hogares mexicanos.
El cambio en el tiempo del IPC es el valor de la inflación.
Para medir la importancia relativa de un precio específico en el IPC se le otorga un ponderador a cada bien y servicio.
De forma genérica y muy sencilla, el ponderador se calcula a partir de dividir el gasto en el bien o servicio de todas las familias mexicanas entre el total del gasto de todas las familias mexicanas. Pero las variables en la aplicación de esta fórmula son muchas y de una gran complejidad.
El IPC en México. Grupos de Precios en el INPC
Nuestro caso práctico de aplicación de la experiencia de la Ciencia de Datos de JuiceTIC es ne México. En este país, el indice se denomina INPC y se desagrega por objeto de gasto en 8 grupos de precios:
- Alimentos, bebidas y tabaco
- Ropa, calzado y accesorios
- Vivienda
- Muebles, aparatos accesorios
- Salud y cuidado personal
- Transporte
- Educación y esparcimiento
- Otros servicios
La ponderación (peso) de cada grupo de precios es conocida, pero la ponderación del desagregado de precios de cada grupo no es pública y supone información crítica para instituciones financieras, inversores y agentes económicos
Matemáticas en el INPC (IPC de México).Base analítica de la Ciencia de datos.
- De acuerdo con el INEGI, Instituto de Estadística Mexicano, el índice de precios de México (de forma análoga a la de otros países) se calcula utilizando la fórmula de Laspeyres, índice que mide las variaciones de precios de una canasta fija a través del tiempo.
- El INPC se calcula como la media aritmética ponderada de 299 productos genéricos conforme a la siguiente fórmula:
- El uso del índice Laspeyres presupone que los consumidores tienen función de utilidad tipo Leontief (matriz monetaria de insumos):
- Las cantidades relativas se mantienen constantes independientes de los precios relativos.
- No se hace sustituciones en respuesta a cambios en los precios relativos. Las elasticidades cruzadas de demanda son cero.
- Con estas premisas es tan complejo como posible obtener los ponderadores de forma predictiva, con la aplicación de la Ciencia de Datos y la capacidad de proceso del Big Data.
- Además, la bondad o certeza de la solución que aportamos podemos contrastarla frente a cientos de miles de series publicadas históricamente por el INPC desde el año 1969.

Modelación y traducción del problema: a la búsqueda de los ponderadores.
- Elección de algoritmos para encontrar las estructuras estadísticas latentes
- Desintegrar la fórmula integrada del índice, que siempre vamos a tratar como un función lineal
- Los parámetros de esa función lineal son los propios ponderadores (que deben permanecer estables en el tiempo para posibilitar la comparación entre coyunturas)
- Afortunadamente, en la parte analítica nos enfrentemos a una ecuación con restricciones, incluida en el campo de la programación lineal
- Con todo lo anterior, hemos traducido una necesidad “predictiva” en un problema matemático (complejo, pero de esa naturaleza)
Resultados y comprobación de los mismos
Los resultados que debía arrojar nuestra solución son ponderadores por ciudad y los productos genéricos nacionales.
La elección de estos datos está relacionada con el hecho de que el INEGI tiene publicadas estas series y era muy sencillo contrastar los resultados predictivos.
No obstante, la metodología es replicable y escalable para obtener ponderadores por ciudad y por clasificación de productos.
El éxito del modelo. Desviaciones
La precisión de las “predicciones” sobre los ponderadores del INPC se ven fuertemente influidos por el redondeo que realiza el INEGI al publicar los datos (los índices se publican a tres decimales).
Para los ejercicios presentados la diferencia en la inflación con los ponderadores calculados con nuestro modelo de ciencia de datos no supera 0.01 puntos porcentuales.
Grupo | Real | Pred, | Dif. |
Alimentos, bebidas y tabaco | 30.29 | 30.31 | -0.02 |
Ropa, calzado y accesorios | 5.04 | 5.11 | -0.07 |
Vivienda | 22.09 | 22.08 | 0.01 |
Muebles, aparatos accesorios | 4.72 | 4.68 | 0.04 |
Salud y cuidado personal | 6.74 | 6.72 | 0.02 |
Transporte | 13.98 | 13.96 | 0.02 |
Educación y esparcimiento | 9.18 | 9.19 | -0.02 |
Otros servicios | 7.96 | 7.95 | 0.02 |
Análisis de detalle de las desviaciones en la estimación de ponderadores por producto genérico nacional
Desviaciones sobre las variaciones quincenales mediante el índice que se obtuvo con las series por producto genérico nacional publicadas por el INEGI y las predicciones de ponderadores obtenidas por nuestro equipo de ciencia de datos. La desviación siempre es menor a 0.08 puntos porcentuales


Análisis de detalle de las desviaciones en la estimación de ponderadores por ciudad
Desviaciones sobre las variaciones quincenales mediante el índice que se obtuvo con las series por ciudad publicadas por el INEGI y las predicciones de ponderadores obtenidas por nuestro equipo de ciencia de datos. En estas estimaciones de datos por ciudad y agregadas por región la diferencia es menor a 0.14 %