Aprendizaje automático (machine learning)

El aprendizaje automático (machine learning) es una rama de la inteligencia artificial que se enfoca en el desarrollo de modelos y algoritmos computacionales.

En otras palabras, trata de permitir a las computadoras aprender de los datos y mejorar con la experiencia sin ser programadas explícitamente. Esto hace que el aprendizaje automático a través de datos y experiencias propias o pasadas pueda tomar decisiones.  

En resumidas cuentas, esta tecnología intenta imitar acciones humanas, tales como decisión razonada en datos, enfocándose en la eficacia y la eficiencia de estas.

Origen e historia del aprendizaje automático (machine learning)

El concepto de aprendizaje automático (o machine learning) se remonta a la década de 1950, cuando los científicos comenzaron a explorar la posibilidad de enseñar a las computadoras a aprender de los datos.

Desde entonces, el aprendizaje automático ha evolucionado significativamente, teniendo como edad de desarrollo temprano la década de los 2000 y 2010, con las versiones básicas de Siri (Apple), Alexa (Amazon) o Google Now siendo clave los inicios de la década de 2020 con la irrupción de ChatGPT (OpenAI).

Este fue el primer chatbot con tal autonomía y avance, que por sí solo podía resolver desde problemas de lógica medios, a complejos problemas matemáticos o de programación, además de tener una habilidad de conversación bastante avanzada.

Sin embargo, la primera versión de ChatGPT no consiguió pasar el test de Turing, siendo evidente que se estaba manteniendo una conversación con una máquina. Aunque eso sí, a un gran nivel.

¿Para qué sirve el aprendizaje automático (machine learning)?

El machine learning, como tecnología, nos permite mejorar la realización de tareas o procesos. Pero, ¿cómo lo hace? Es muy sencillo:

Imagina que trabajas de una tienda de ropa y te gustaría saber cómo aumentar las ventas.

Para ello, deberás recopilar una gran cantidad de datos, como información directa de tus clientes (edad, gustos y preferencias, nacionalidad…), horarios y tráfico de tu tienda a lo largo del día, tipos de prendas más vendidas, campañas de marketing más efectivas, etc. Con ello, estarás recopilando tal cantidad de datos que, si bien puedes guiarte por estadísticas (media de edad de tus clientes, top prendas más vendidas…), también puedes apoyarte del aprendizaje automático.

¿Cómo? Esto ya no es tan sencillo. El aprendizaje automático o machine learning te hace la vida más fácil (predice datos que te interesan) pero no es fácil de implementar. ¿Por qué? Pues porque primero debes tener una base de datos de calidad para que un algoritmo de machine learning pueda darte unos resultados decentes.

En el caso que estamos abordando, el de la tienda de ropa, de nada servirá almacenar la edad de los clientes si no sabemos en qué prendas y cuánto ha gastado cada cliente. A partir de aquí, el algoritmo interpretará tu base de datos para imitar lo mejor posible el escenario que más te interesa: la venta.

¿Cómo funciona el aprendizaje automático (machine learning)?

El machine learning (o aprendizaje automático) funciona como una especie de app meteorológica. Es decir, se trata de una herramienta que nos permite predecir resultados finales alimentándose de una base de datos.

Su funcionamiento radica en que dependiendo de los datos que le ofrezcas, será más o menos preciso, por lo que testear qué datos predicen mejor o peor es relativamente sencillo.

La gran mayoría de algoritmos de aprendizaje automático se dividen en las siguientes fases de funcionamiento:

  1. Dado un conjunto de datos de entrenamiento, se etiquetan las clases y formamos un modelo que prediga la clase de un dato nuevo a introducir en el dataset (muestra).
  2. Más tarde, el modelo se entrena empleando algoritmos de aprendizaje automático, que buscan patrones y correlaciones en los datos.
  3. Por último, una vez que el modelo ha sido entrenado, se usa para hacer predicciones sobre nuevos datos.

Esta forma de proceder es una de las grandes bazas de esta tecnología, ya que su máxima es proceder por la experiencia obtenida y por la información que arrojan los datos, evitando situaciones humanas de euforia, excesiva confianza o simple intuición.

Sin embargo, hay ocasiones en las que el aprendizaje en sus inicios debe ser supervisado, esto es, vigilado y etiquetado manualmente.

Características del aprendizaje automático (machine learning)

En otro orden, el aprendizaje automático tiene varias características que lo hacen útil en una variedad de aplicaciones. Algunas de estas características son:

  • Adaptabilidad según el proyecto, habiendo una gran gama de algoritmos para cada clase de problemática.
  • Efectividad en casos en los que el número de dimensiones es mayor que el número de muestras, y viceversa.
  • Trata de ser eficiente en el uso de memoria y cómputo, aunque esto depende también del algoritmo utilizado.
  • Versatilidad, puesto que puede ser utilizado para resolver problemas de clasificación, regresión, agrupamiento y reducción de dimensionalidad.

Cabe destacar, que el aprendizaje automático forma parte de su disciplina troncal: la inteligencia artificial. Así pues, cuando hablamos de aprendizaje automático debemos tener en cuenta que las características y las aplicaciones a las se asocia también deben ser relacionadas con la inteligencia artificial.

Ventajas y desventajas del aprendizaje automático (machine learning)

En este epígrafe, se van a enumerar algunas de las principales ventajas y desventajas que posee el machine learning. Empezamos con las ventajas:

  • Mayor eficiencia y automatización.
  • Capacidad para manejar grandes cantidades de datos.
  • Capacidad para detectar patrones.

En lo que se refiere a la eficiencia y automatización, se traduce en ahorro de costes y tiempo en la realización de la tarea. Luego, el machine learning es ideal en grandes conjuntos de datos, por lo que es muy frecuente ver su uso en entornos de big data. Además, al ser una tecnología orientada a predecir, su capacidad de detectar patrones es muy efectiva.

Por otro lado, estas son algunas de sus desventajas:

  • Elevado coste, y compleja aplicación.
  • Depende de la cantidad de datos y de su calidad.
  • Posibles sesgos en los datos de entrenamiento.

Debido a su complejo funcionamiento, el coste es elevado. Luego, también cabe destacar que si no se aplica en entornos donde los datos tengan una mínima calidad y/o cantidad, sus resultados no deben ser tomados en cuenta. Es por ello que depende en gran medida del big data.

Por último, en lo que respecta a los sesgos, esto quiere decir que si entrenamos de una forma muy concreta nuestro algoritmo, si nuestro set de datos muta o se modifica, su capacidad de predicción se puede ver muy mermada.

Luego, aunque algunas de las desventajas se deben tener en cuenta, si se hace balance, las ventajas poseen un peso bastante mayor, como cualquier tecnología que contribuye a un progreso. Nada es gratis, y el coste de oportunidad siempre existirá en el desarrollo y adopción de tecnologías de cualquier tipo.

Principales algoritmos de machine learning

Por otro lado, a continuación, se enumeran algunos de los algoritmos más destacados:

  • SVM (Máquinas de vector soporte): Se trata de un algoritmo que se centra en la creación de un hiperplano para separar las clases de un conjunto de datos.
  • KNN (K Nearest Neighbors): En este caso, el KNN aplica en un rango determinado, una votación con mayoría simple que determina qué clase será un nuevo dato insertado en el conjunto.
  • Árboles de decisión: Mediante ramas y decisiones binarias, se van abriendo posibilidades vía errores cuadrados mínimos para así, tomar la decisión más precisa.
  • Naïve Bayes: En resumidas cuentas, este método trata, vía pesos y porcentajes, de aplicar una cifra proporcional. Es decir, se centra en las probabilidades de cada clase y el número total de casos del conjunto de datos.

Cada uno de estos algoritmos funcionan de una forma distinta, por lo que habrá proyectos o tareas en los que unos ajusten mejor la predicción de datos que en otros.

Técnicas orientadas al aprendizaje automático (machine learning)

En las técnicas de aprendizaje automático el objetivo principal es, mediante un proceso iterativo, mejorar el desempeño de una tarea aprendiendo de ella. Es decir, para mejorar procesos, se deben estudiar, ejecutar, aprender, mejorar y repetir una y otra vez. Esto nos lleva teóricamente a conseguir niveles de eficiencia y precisión cada vez mejores.

En este orden, se dan los 2 tipos de aprendizajes más extendidos:

Por un lado, aprendizaje supervisado se basa en datos etiquetados y se utiliza para predecir o clasificar, mientras que el aprendizaje no supervisado, se basa en datos no etiquetados y se utiliza para descubrir patrones o estructuras en los datos.

Otro aprendizaje a destacar es el denominado ‘aprendizaje por refuerzo’, el cual, trata de incentivar el buen hacer vía recompensas para así, conseguir un mejor desempeño del proceso o tarea.

Ejemplos de aplicaciones de aprendizaje automático (machine learning)

Algunos de los ejemplos más destacados en este tipo de tecnologías son:

  • Reconocimiento de voz: Cuando le hablas a tu dispositivo móvil con los asistentes Siri o Alexa, la función de reconocimiento de voz está desarrollada, mayormente, con redes neuronales.
  • Vehículos autónomos: Este tipo de productos buscan ser lo más independientes posible y uno de los núcleos de su desarrollo es el deep learning.
  • ChatGPT: Esta herramienta está diseñada para que puedas interactuar por la vía escrita, ya que entiende lo que le dices, lo procesa, y te responde, imitando así la interacción con una persona. Esto sucede gracias a tecnologías orientadas al procesamiento del lenguaje natural (PLN).

En resumidas cuentas, aunque en cada uno de los ejemplos se relaciona con una tecnología específica, es muy frecuente que se combinen entre sí, ya que están muy relacionadas y se suelen retroalimentar mutuamente.

¿Quieres referenciar este artículo?

Jonathan Llamas , 19 de diciembre, 2023
Aprendizaje automático (machine learning). Economipedia.com