El process mining, es decir, el análisis y la gestión de procesos de negocio con base en información de la ejecución de esos procesos, es un campo bastante complejo, lleno de álgebra y algoritmia aunque, en el fondo, la idea que se persigue es bastante fácil de entender.
En su libro ‘Process Mining. Data Science in action‘ de Wil van der Aalst, el autor hace una excelente descripción de todos los conceptos y algoritmos usados en process mining hasta la fecha.
Sin embargo, es cierto que, aun siendo un libro excelente, a veces resulta farragoso y difícil de seguir por la abundancia de formalismos y de algoritmia.
Quizá por eso el propio autor, hacia la mitad de la obra, nos proporciona un ‘framework’ que sirve de marco general para entender todo el campo del process mining y para agrupar y resumir de alguna manera todo lo visto hasta ese momento.
Por lo ilustrativo y clarificador que resulta, me ha parecido interesante traerlo a este blog. El ‘framework’ es el que se ilustra en la figura inferior (propiedad del autor y de Springer):
En la parte superior de ese framework se sitúa el ‘mundo real’ (‘world‘), un mundo real que es donde existen organizaciones y personas que ejecutan procesos de negocio.
Esos procesos de negocio, en mayor o menor medida están soportados por unos sistemas de información (‘information system(s)‘. Esos sistemas de información son el origen o procedencia (‘provenance‘) de unos datos en forma de trazas (‘logs‘).
Esas trazas, a su vez, pueden tomarse de instancias o casos de procesos ya finalizados (‘historic data‘) o bien de instancias o casos aún en curso (‘current data‘). El primer caso nos servirá para lo que se conoce como análisis ‘post-mortem‘ (para, por ejemplo, a nivel individual conocer qué fue mal en una instancia o, a nivel agregado, obtener medidas de los procesos) mientras que en el segundo caso hablaríamos de un análisis ‘pre-mortem‘ que nos debería servir para monitorizar y guiar la ejecución.
En la parte inferior de la figura se observan los modelos de proceso de negocio. Unos modelos que incorporan la información de flujo (‘control-flow‘), de los datos y reglas de negocio (‘data/rules‘) así como de la organización que los ejecuta y los recursos que utiliza (‘resources/organization‘).
Estos modelos de negocio pueden ser modelos teóricos o ‘de jure‘ es decir los procesos que en teoría se están o deberían estar ejecutando, y los procesos ‘de facto‘ que son los que en la realidad suceden. Las dos flechas, una ascendente y otra descendente, nos hablan de cómo se relacionan los modelos con el mundo real. Los modelos ‘de iure’ intentan moldear la realidad e influir en ella, es decir, que los procesos que suceden en el mundo real se correspondan con el modelo de proceso teórico (flecha ascendente). Los modelos ‘de facto’ intentan recoger y representar lo que sucede en el mundo real (flecha descendente).
En la zona media, entre los logs y los modelos de procesos, se desarrolla la actividad del process mining propiamente dicho. Y ahí tenemos las siguientes actividades, recorriendo la figura de derecha a izquierda:
- ‘Cartography:’ Se ocupa de describir la realidad, realizando un cierto nivel de abstracción sobre ella. En cierto sentido, se trata de un bloque que mira hacia el pasado. Incluye tres actividades:
- ‘Discover:’ quizá lo más representativo del process mining, a saber, deducir el modelo de procesos a partir de la información de las trazas.
- ‘Enhance:’ Es decir, revisión de modelos de procesos existentes, bien para hacer correcciones en los mismos, bien para enriquecerlos de alguna manera.
- ‘Diagnose:’ En realidad no exactamente process mining, sino análisis de procesos más tradicional. Se ocupa de diagnosticar los procesos de negocio detectando cuellos de botella, ineficiencias o, en general, posibilidades de mejora.
- ‘Auditing‘ Ahora miramos al presente de los procesos de negocio con la idea, fundamentalmente, de asegurarnos que dichos procesos se ejecutan conforme a lo diseñado y previsto.
- ‘Detect:’ Compara los procesos que se están ejecutando con los modelos de proceso ‘de jure’ y, en caso de detectar inconsistencias, se eleva una alarma o aviso.
- ‘Check:’ Compara datos ‘post-mortem’ de los procesos con los modelos ‘de jure’ con el objetivo de detectar desviaciones y medir el nivel de cumplimiento ‘compliance’.
- ‘Compare:’ Compara los modelos ‘de facto’ con los modelos ‘de iure’ aunque ahora sin utilizar ya directamente los logs.
- ‘Promote:’ Con base en el análisis anterior se `puede promover que algunos aspectos del modelo ‘de facto’ pasen a los modelos ‘de iure’, incorporándose como buenas prácticas.
- ‘Navigation:’ Finalmente, ahora nos enfocamos al futuro con la idea, por ejemplo, de hacer recomendaciones.
- ‘Explore:’ Se comparan los casos en ejecución con las ejecuciones pasadas del mismo modelo de proceso
- ‘Predict:’ Combinando la información de los casos actualmente en ejecución con los modelos de proceso, se pueden hacer predicciones respecto al futuro.
- ‘Recommend:’ La misma información usada para predecir el futuro se puede usar para emitir recomendaciones (por ejemplo, para intentar minimizar tiempos y/o costes).
La verdad es que visto el framework y entendiendo sus conceptos resulta mucho más sencillo de entender, casi trivial, este, por otro lado, bastante farragoso, campo del process mining.