Aplicación de aprendizaje de máquinas para evaluación de calidad de experiencia y servicios

El “PINV 15-257: Monitoreo de dispositivos móviles y descarga de datos en redes colaborativas MOSAICPy”, es un proyecto de investigación institucional, cuyo objetivo general es el: “Diseño de estrategias de evaluación de la calidad de la experiencia y de la calidad de servicios”.

En cuanto a los resultados esperados, se pueden mencionar:
1. Diseño e implementación de la plataforma de recolección y monitoreo de parámetros del sistema.
2. Diseño de un modelo de predicción de Calidad de la Experiencia (QoE)
3. Experimentación y prueba de las soluciones propuestas.
4. El aumento y fortalecimiento del intercambio científico y académico, sinergia y experiencia para futuras investigaciones.
5. Presentar un número de publicaciones científicas y trabajos técnicos basados en las conclusiones del proyecto y construir conocimiento e interacciones entre los socios para participar en futuros proyectos más ambiciosos.
6. Transferencia de Conocimiento a través de talleres y cursos. 

Son miembros del equipo de investigación de este proyecto:
Prof. Dr. Carlos Nuñez, investigador principal.
Prof. MSc. María Elena García y el  Prof. Dr. Diego Pinto, investigadores asociados locales.
Prof. Dr. Miguel García, de la Universidad Pablo de Olavide de Sevilla, España; investigador asociado internacional.
Los investigadores en formación: Ing. Brenda Quiñonez, Ing. Gabriela Vázquez e Ing. Mauricio Allegretti, y 
Los estudiantes Guillermo Osorio y  Jorge Mezquita.

Es Gerente del Proyecto, el Prof. Dr. Diego Pinto.
Acceder a curriculum: 
https://cv.conacyt.gov.py/publicar/cv?id=e9f42c6b146930735489d101457338a4


Acerca de lo que se realizó con este proyecto, el Prof. Pinto, explicó que se desarrolló un sistema que pueda monitorear el estado de un sistema de comunicación y la percepción de los usuarios: 


“Cuando las personas acceden a un servicio como Youtube,  Whatsapp o navega, existe una percepción desde el punto de vista del usuario y, esa percepción, está en función de varios factores: el estado de la red, el estado del smartphone y también del estado de ánimo de las personas. También, está en función de la expectativa de la persona, que depende mucho de la edad, de su interacción con la tecnología. No es lo mismo un niño que una persona adulta; entonces, existen factores cuantitativos y existen factores cualitativos, en general”.


De izquierda a derecha: Dr. Miguel García, investigador asociado internacional y el Dr. Carlos Nuñez, investigador principal.

Sobre la pregunta fundamental que se hicieron: ¿Cómo se logra determinar, en un momento dado, si una aplicación utilizada por una persona está bien percibida por ella, sin ir a preguntarle: “¿qué te parece…? O hacer una llamada por WhatsApp que da una escala de 5 estrellas…
El tema es que, nosotros, queremos determinar cómo es la experiencia de uso de las aplicaciones que necesitan datos transportados a través del sistema de comunicación; queremos entender la percepción de muchas personas, simultáneamente en muchos momentos, sin que ello implique realizar una encuesta o consulta con los usuarios continuamente.

Entonces, la idea es crear un modelo matemático de tal forma a que pueda predecir lo que la persona está percibiendo. Eso se conoce como la “calidad de la experiencia”; cómo se puede inferir lo que está experimentando la persona, a partir de parámetros como el estado de la red, el estado del teléfono y la aplicación, y alguna otra información asociada a esa persona, como su edad y demás que se puede tener por el perfil.

En una primera etapa, es necesario recolectar mucha información. Basada en toda esa información, se genera un modelo matemático a partir de las técnicas conocidas como Machine Learning que es un área de la Inteligencia Artificial. El general, el cálculo de dicho modelo es lo que se conoce como aprendizaje. En particular el problema que abordamos es un problema de clasificación, y cae dentro de la categoría de aprendizaje supervisado. Así, con los datos que se monitorean en la red, el modelo de clasificación nos puede decir: “si la percepción del usuario es muy buena, buena, más o menos, regular o mala”. En consecuencia a este resultado, los algoritmos de administración de la red de comunicación pueden realizar acciones correctivas en varios niveles según necesidad, como en el sistema o en la aplicación, de tal forma que las personas comienzan a percibir mejor el uso de las aplicaciones a través del sistema de comunicación. Esa es la idea central: crear un sistema que pueda predecir la calidad de la experiencia, a través de factores cualitativos y cuantitativos.  

Figura 1. Etapas del Proyecto

Por ejemplo, si la percepción no es buena, ¿cómo saben qué se debe corregir para que esa percepción subauba de buena a muy buena?
El proyecto completo tiene dos etapas: en la primera se encuentra el monitoreo y el diseño del modelo que predice la calidad de la experiencia y, la siguiente etapa, es utilizar esa información para realizar acciones de corrección en la Ingeniería de Tráfico.

Una vez que se identifica qué factores determinan una mala calidad de la experiencia en cada escenario posible, se pueden modificar dichos factores. Por ejemplo, de forma muy simple, para entender si es un problema de retardo, se podría encaminar el tráfico por otro camino menos recargado; si es un problema del estado del teléfono, enviar la información con menor calidad. En este último caso, por ejemplo para video, se puedo bajar la calidad del video para que la persona siga comprendiendo la información manteniendo la fluidez de la misma.

De esta manera, cada escenario va a tener su corrección, por eso, es un problema complejo. Se puede tener muchas situaciones y, para cada situación, va a haber una acción correctiva, respectivamente. Se ha observado que existen muchos factores; en particular, en este proyecto, se trabajó con 17 parámetros. Si dividimos cada parámetro en una escala de 1 al 10 se tienen aproximadamente 1017 escenarios posibles. Además, cada cliente puede encontrarse en un escenario particular el cual cambia en el tiempo. En primera instancia -fase de diseño-, se busca determinar qué escenarios corresponden a qué nivel de experiencia o sea una clasificación. Esta primera fase se encuentra conformada por las etapas descritas en la Figura 1. En segunda instancia -fase operativa-, se desea detectar si el usuario se encuentra en un escenario donde tiene una mala calidad de la experiencia para llevarlo a un escenario de buena a excelente calidad de la experiencia. Esta última fase queda fuera del alcance de la investigación.

En la Figura 2, se puede observar la plataforma diseñada e implementada para el monitoreo y recolección de parámetros del sistema como de entrenamiento de modelos. Cabe destacar que, el desarrollo de la plataforma fue realizado, en principio, en una primera versión para un ambiente de laboratorio. Dicha plataforma, fue extendida para un ambiente real durante el desarrollo de este proyecto.

Figura 2. Plataforma de monitoreo y recolección de parámetros de cálculo de modelos de clasificación de la experiencia

¿A quién le servirá este producto?
Hay que entender que las comunicaciones tienen varios niveles: tenemos las redes ópticas en los core network, y sobre las redes ópticas se encuentran las redes de comunicación celular. En una compañía celular, por ejemplo, el éxito de mantener con fidelidad a los clientes, es que tengan una buena experiencia del sistema en todo momento. Si los usuarios, constantemente, tienen una excelente experiencia, se va a tener una clientela fiel. Entonces, esto va directamente asociado a la industria de la comunicación celular, en primera instancia. Por otra parte, el conocimiento adquirido en este proyecto puede ser aplicado a otros contextos donde se tenga el problema de determinar la percepción de un usuario respecto a una tecnología utilizada.


De izquierda a derecha, Univ. Guillermo Osorio y el Prof. Dr. Diego Pinto. CCIS 2019. Atlanta (USA)

Además de lograr los resultados esperados, también cuentan con publicaciones
Los resultados del proyecto fueron publicados en dos trabajos:
      QoE Estimation in mobile networks using Machine Learning; presentado en la Conference of Computational Interdisciplinary Science – CCIS 2019 (marzo, Atlanta, USA) y,
      Map-Elites Algorithm for Features Selection Problem; esté aceptado y que será presentado en el 13th Alberto Mendelzon International Workshop Foundations of Data Management – AFW 2019 (junio-julio, Asunción, Paraguay).

Por otra parte, estamos trabajando en paralelo con otras tres futuras publicaciones, apuntando a revistas de prestigio. Las mismas serán sometidas posteriormente a la finalización del proyecto en las áreas de Selección de atributos y Calidad de la Experiencia basada en Machine Learning.
           

En cuanto a transferencia de conocimiento, se ha tenido una escuela de Machine Learning con dos cursos dictados por el Prof. Miguel García: “Introducción a la Minería de Datos” e “Introducción a la Selección de Atributos”,  y una charla en la Dirección Nacinal de Aeronáutica Civil - DINAC sobre el Impacto de la Minería de Datos.


Prof. Miguel García, dictando curso. Facultad Politécnica, julio 2018.

¿Qué queda como trabajo futuro?
El proyecto es una extensión de un previo proyecto denominado MOSAIC, el cual fue desarrollado dentro del SticAmSud 2013 en la que varios grupos internacionales colaboraron: de Francia, de Uruguay, de Chile y, nosotros, por Paraguay. Cada grupo, trabajó en un área específica. En nuestro grupo, el alcance es el monitoreo y el diseño del modelo basado en técnicas de aprendizaje de máquinas. Alcanzamos las metas correspondientes del proyecto: se diseñó la plataforma de recolección y monitoreo, se entrenaron los algoritmos con diferentes técnicas de aprendizaje del estado del arte y llegamos a 60% de nivel de predicción de la calidad de la experiencia. Nosotros queremos llegar al menos a un 90% de calidad.

Charla sobre Minería de datos en la DINAC

Por otra parte, dado que entrenar un modelo depende en gran medida del conjunto de parámetros utilizados, tenemos el desafío de aumentar el número de parámetros monitoreados y a la vez la cantidad de datos de forma a determinar de forma más precisa la experiencia del usuario. Lo anterior, implica mayores desafíos computacionales en términos de manejo de datos y de entrenamiento de los modelos. Encontrar los parámetros más importantes para la tarea de clasificación es clave y se denomina como selección de atributos, el cual, es un problema de optimización combinatoria donde la calidad del conjunto de atributos seleccionados se determina por la calidad del aprendizaje del modelo.