EN
Ciencia de datos

Mejor prevenir que curar: así aplicamos Machine Learning para mitigar la deuda (resumen ejecutivo)

30/01/2024

Read in english



En BBVA AI Factory desarrollamos modelos predictivos para la resolución temprana de la deuda, con el objetivo de adelantarnos a posibles situaciones desfavorables para nuestros clientes y ofrecer soluciones de forma ágil.

El negocio principal de un banco es prestar dinero. Mediante el pago de cuotas, la entidad financiera ofrece a las personas la posibilidad de comprar una casa, un coche o de crear sus propios comercios. Sin embargo, cuando los clientes afrontan adversidades y entran en mora, es decir, cuando se retrasan en el pago de sus cuotas, se puede generar una situación desfavorable tanto para el banco como para los mismos clientes.

En AI Factory, centro global donde BBVA construye sus principales soluciones basadas en inteligencia artificial, desarrollamos modelos predictivos para la resolución temprana de la deuda. Para ello, utilizamos técnicas punteras de Machine Learning (ML, por sus siglas en inglés), en el contexto del aprendizaje supervisado1 con datos tabulares, es decir, datos estructurados. El objetivo es que el cliente salga pronto de esa situación desfavorable, o que dicha situación no empeore. Gracias a estos modelos, el banco puede ofrecer soluciones tempranas, como refinanciaciones y adecuación a cuotas asequibles.

En concreto, hemos creado un pipeline para automatizar varios procesos estándar que aplicamos a los modelos de recuperación de deuda que desarrollamos. En el ámbito de ML, un pipeline es una secuencia estructurada de pasos para el procesamiento y modelado de datos. En otras palabras, se puede entender un pipeline de ML como una receta para crear y desplegar modelos: guía el proceso desde la recopilación y limpieza de datos hasta el entrenamiento de un modelo, la evaluación de su rendimiento y su puesta en funcionamiento. También mejora la organización del flujo de trabajo, la reproducibilidad y la escalabilidad de los proyectos de ciencia de datos.

En nuestro caso, el pipeline o flujo de trabajo que presentamos combina métodos tradicionales del mundo del análisis de riesgos con lo último en librerías de aprendizaje supervisado.

Nuestros casos de uso: diferentes modelos para afrontar diferentes estados de deuda

Los clientes pueden encontrarse en diferentes estados respecto al pago de sus deudas, para los que aplicamos diferentes modelos de datos. Todos estos modelos ayudan a los gestores de BBVA a decidir qué acciones tomar lo antes posible.

Estado respecto a la deuda Al corriente de pago En inversión irregular, cuando tiene alguna cuota atrasada durante un periodo menor de tres meses En mora, cuando el cliente ha dejado de pagar una o más cuotas durante tres meses o más.
Modelos 1. Modelo de predicción de entrada en inversión irregular 2. Modelo de salida de inversión irregular 3. Modelo de predicción de salida de mora en un periodo corto de tiempo (45 días)

4. Modelo de predicción de no salida de mora en un largo periodo (dos años).
Estado respecto a la deuda Modelos
Al corriente de pago 1. Modelo de predicción de entrada en inversión irregular
En inversión irregular, cuando tiene alguna cuota atrasada durante un periodo menor de tres meses 2. Modelo de salida de inversión irregular
En mora, cuando el cliente ha dejado de pagar una o más cuotas durante tres meses o más. 3. Modelo de predicción de salida de mora en un periodo corto de tiempo (45 días)

4. Modelo de predicción de no salida de mora en un largo periodo (dos años).

¿Por qué un pipeline de ML para gestión de deuda?

Históricamente, en el ámbito de análisis de riesgos se utilizan modelos matemáticos tradicionales como son las regresiones logísticas. Estos modelos son sencillos y muy interpretables; pero, a veces no alcanzan los valores de rendimiento de otros métodos de ML no lineales. En AI Factory encontramos un balance entre las metodologías más tradicionales estandarizadas en riesgos, las cuales nos ayudan a tener una referencia de la cual partir, y la innovación, que nos permite crear modelos productivizables y con mayor poder predictivo.

Al abordar diferentes problemas relacionados con la gestión de deuda y aplicar modelos de ML para resolverlos, nos dimos cuenta de que había una serie de pasos que se repetían continuamente, como es habitual en este tipo de proyectos. Es por esta razón que, para ser más ágiles, decidimos unificar estas fases en un pipeline de modelización, el cual nos permite reutilizar código y automatizar procesos en diferentes proyectos.

Partimos de algunas premisas:

Nuestros modelos se centran en el aprendizaje supervisado con conjuntos de datos tabulares para predecir variables, generalmente de tipo binario.
Manejamos una cantidad considerable de variables – más de 1800 en algunos casos – que incluyen datos comportamentales, sociodemográficos, transaccionales y niveles de deuda. Esta diversidad y volumen de datos exigen un proceso de reducción de dimensionalidad consistente2.
Nos enfrentamos a fechas de entrega ajustadas, para las cuales debemos construir modelos efectivos y validarlos previamente. Un pipeline automatizado acelera significativamente este proceso.
Es imprescindible crear modelos explicables que nos permitan interpretar sus resultados para así trasladarlos a las unidades de negocio.
La tramificación del score es necesaria para una evaluación precisa y adaptada a diferentes contextos.

La estandarización que establece nuestro pipeline también nos ayuda a reducir el time-to-value, es decir, el tiempo que tardamos en aportar valor al cliente, cuando comenzamos un nuevo proyecto con la misma área de negocio. En un artículo más extenso publicado recientemente contamos en detalle las fases de nuestro pipeline de ML, así como las librerías del estado-del-arte que hemos utilizado.

Conclusiones: simbiosis tradición-innovación para crear modelos productivizables

Con el empleo de métodos innovadores de Machine Learning podemos crear mejores modelos preventivos de forma más ágil. En el contexto de la gestión de deudas, estos modelos nos ayudan a prevenir situaciones indeseables para nuestros clientes en relación con su estado respecto a la deuda y a ofrecerles soluciones para mitigarlas. El pipeline de ML que proponemos, además, puede usarse en cualquier caso de uso en el que se aplique aprendizaje supervisado.

Al aplicarse las nuevas librerías del estado del arte en las tradicionales fases de un ciclo de desarrollo de productos de ML conseguimos una mayor precisión y eficiencia: simbiosis perfecta entre tradición e innovación.