Continuamos enfocando esta etapa de confinamiento con actitud positiva, y abiertos a seguir formándonos sobre nuevas tecnologías para aplicar en nuestros proyectos. Así, tras arrancar con una ilustrativa charla sobre chatbots, hemos seguido con una interesantísima introducción a Machine Learning, repleta de ejemplos y, de nuevo, a cargo de nuestro CTO, Unai Martínez.
Para que os hagáis una idea de todas las posibilidades que ofrece el ML en una empresa, intentaremos trasladar su funcionamiento en este post, además de las aplicaciones que le estamos dando para que nuestros clientes saquen rendimiento.
¿Qué es Machine Learning?
El Machine Learning (o Aprendizaje Automático) es un conjunto de técnicas dentro del campo de la Inteligencia Artificial para la construcción de sistemas que aprenden automáticamente.
Como matizaba Unai, “aprender” en este contexto significa identificar patrones complejos en miles o millones de datos. Y “automáticamente” se refiere a que estos sistemas se mejoran de forma autónoma, con el tiempo y sin intervención humana.
Con esto, podemos decir que los sistemas de Machine Learning aprenden cómo combinar entradas para producir predicciones útiles sobre datos nunca antes vistos.
Clasificación de los principales algoritmos para ML

Supervised Learning, o Aprendizaje Supervisado
El Aprendizaje Supervisado es el algoritmo más importante para aplicación global a día de hoy. La gran mayoría de los algoritmos que se utilizan actualmente son de aprendizaje supervisado.
Se parte de datos etiquetados, o datos tabulares, que se “ponen a entrenar” para terminar prediciendo un valor numérico (como en los problemas de regresión) o una etiqueta de clase (como en los de clasificación)
¿Qué problemas reales solucionamos con Supervised Learning?
La mayor parte de los problemas que se resuelven con algoritmos de Supervised Learning son de clasificación y de regresión.
Casos de clasificación. Un ejemplo sencillo sería el caso de los correos SPAM. Se categorizan directamente como SPAM según determinadas características del email que han demostrado contener correo basura: mayúsculas o exclamaciones en el asunto, enlaces rotos, cantidad de imágenes adjuntos… Todos estos datos se etiquetan, y se utilizan para filtrar la calidad de futuros correos entrantes.
Casos de regresión. Por ejemplo, predecir números escalares concretos, como puede ser predecir el precio medio del alquiler tras el estado de alarma provocado por el Covid-19.

El resto de problemas son más especializados. Es el caso de situaciones de ranking, cómo las búsquedas en Google; recomendadores (sugerir productos en un ecommerce en función de nuestros perfiles, búsquedas y compras); predicción de series temporales (basadas en la regresión, pero teniendo en cuenta influencias externas como modas, estacionalidad, etc) y, por último, situaciones de detección de fraude.
Unsupervised Learning, o Aprendizaje No Supervisado
El Unsupervised Learning se distingue del Aprendizaje Supervisado por el hecho de que no tenemos datos etiquetados de partida. Tiene varios casos de uso como el clustering, la reducción de dimensionalidad, detección de anomalías, etc. En los últimos años su importancia ha crecido debido a su uso en redes neuronales estilo GAN o en los autoencoders usados para ciertas tareas de NLP.
Reinforcement Learning, o Aprendizaje por Refuerzo
El Reinforcement Learning es aprendizaje por refuerzo. Tiene casos muy concretos de aplicabilidad, más aislados.
Un ejemplo de Reinforcement Learning está en este vídeo en el que el algoritmo va aprendiendo a controlar una cápsula para su correcto alunizaje. Trabaja intentando que el cohete alunice entre las dos banderas, a velocidad cero.
Tras varias horas de entrenamiento, vemos cómo la curva de aprendizaje (recompensas) va en aumento.
Requisitos y consideraciones del ML

Aplicaciones para clientes industriales y/o con grandes volúmenes de información
En Ideable somos especialistas en desarrollar proyectos para clientes industriales, por lo que hemos orientado la formación hacia las soluciones que aumentan su eficiencia, y el servicio que ofrecen a su cliente final. Por ejemplo:
Clustering de productos
Técnica que permite encontrar similitudes en un conjunto de datos y agrupar entidades similares, detectando relaciones que escapan al estudio de los datos con técnicas tradicionales.
Ejemplo
Utilizado para detectar tendencias en ventas o interés de los usuarios en productos de cierta industria, aplicación o beneficio, segmentando por tipos de usuario.
Recomendador de producto por aplicación o uso
Otra aplicación interesante es la de ofrecer un recomendador de productos en base al uso que hagan otros usuarios similares al conectado, o en base a las características del producto seleccionado. Se contemplan aspectos como los siguientes:
● Productos con beneficios similares
● Productos orientados a la misma aplicación
● Combinación de alguna de las anteriores con la industria
Y podríamos hablar de muchísimas más, como la predicción de la demanda de los productos; la mejora de las búsquedas con entendimiento de lenguaje natural, o el uso de interfaces conversacionales (o chatbots)
Para cerrar la sesión, Unai habló sobre el workflow, o cómo enfrentarnos desde cero a un proyecto de Machine Learning, aportando multitud de ejemplos de funcionamiento que podremos utilizar para trabajar con nuestros clientes (actuales y futuros) muy pronto.