¿Qué es Machine Learning?

¿Qué es Machine Learning?

Hace años un portal de empleos de Estados Unidos publicó que entre los años de 2015 y 2018 se han duplicado las ofertas de empleo relacionadas a la Inteligencia Artificial.
Pero al mismo tiempo, se cree que se llegara a un punto en donde haya más ofertas de empleo que profesionales que puedan cubrir esas vacantes, por esa razón es un muy buen presagio empezar tu ruta de aprendizaje en el área de Machine Learning.

En resumen, el Machine Learning es un procedimiento de análisis de datos que automatiza la construcción de modelos analíticos, una rama científica de la Inteligencia Artificial apoyada en la idea de que los sistemas pueden aprender de datos, identificar patrones y que puedan tomar decisiones sin que el humano intervenga en lo más mínimo.

Su evolución

El Machine Learning nace de la idea que dice que las computadoras podrían aprender sin ser programadas y así realizar tareas específicas; los investigadores de esta teoría deseaban saber si las computadoras podían aprender de datos.
Esta ciencia no es nueva, pero tiene un nuevo impulso, gracias a las nuevas tecnologías. Hay muchos algoritmos de aprendizaje basados en máquinas que han estado por largo tiempo entre nosotros, pero la posibilidad de aplicar de manera automática cálculos matemáticos complejos al big data es un logro muy reciente.

Tipos de aprendizaje

Existen tres tipos de aprendizaje en el Machine Learning, los cuales comprenden, el supervisado, el no supervisado y el reforzado.

Aprendizaje Supervisado

El aprendizaje supervisado es uno de los tipos de Machine Learning que se basan en la generación de conocimiento a través del análisis de datos etiquetados. En este proceso se incluyen en los datos de estudio un conjunto de ejemplos con resultados conocidos con anticipación y en el cual el modelo de aprendizaje comprende los parámetros de la muestra para progresivamente ir adaptando e incorporando los datos nuevos y clasificarlos de forma correcta.

Este tipo de aprendizaje automático permite realizar predicciones adecuadas del comportamiento de datos que aún no han ingresado al sistema o no han sido procesados. Es un método de análisis muy utilizado en herramientas con las que tenemos contacto a diario como detectores de correo spam, detectores de imágenes en captchas y otro tipo de aplicaciones.

Adicionalmente es importante destacar que existen dos modelos principales de análisis supervisado. Estos sub tipos son los que se conocen como métodos de clasificación y regresión.

Modelo de aprendizaje supervisado de clasificación
El modelo de aprendizaje supervisado de clasificación es en esencia un análisis predictivo que tiene la finalidad de estimar las clases categóricas de un conjunto de datos basados en un patrón binario o muticlase. (valores discretos, no ordenados o pertenencia a grupos).
Modelo de aprendizaje supervisado de regresión
Este modelo se utiliza para asignar categorías a datos sin etiquetar. En este modelo podemos contar con diversos números de variables predictivas de orden explicativo y una variable de respuesta que puede ser nuestro resultado, la función del modelo sería determinar si existe alguna relación entre dichas variables.

Aprendizaje no supervisado

El aprendizaje no supervisado es otra modalidad de Machine Learning en la que se incluyen conjuntos de datos sin etiquetar para realizar análisis y clasificaciones a pesar de que no se conoce con anticipación la estructura que poseen los datos. Con estos análisis se puede obtener información importante o vital sin poseer referencia alguna de las variables de salida. En este caso a diferencia del aprendizaje supervisado, el aprendizaje se logra mediante el análisis de la data que aún no posee resultados.

Dentro de este tipo de Machine Learning existen dos categorías específicas de gran importancia. En primer lugar, se encuentra lo que conocemos como clustering. Este método consiste en una técnica exploratoria de análisis de datos en la que se clasifica la información por grupos. De forma previa no se posee una referencia lógica de la estructura que los compone y se ajusta progresivamente la composición de los grupos con la finalidad de crear segmentos de datos con características similares.

Este tipo de análisis es implementado con regularidad en estrategias de diseño de segmentos de mercadeo y otras estrategias de comercialización debido a que permite ubicar de forma eficiente, elementos comunes en un mercado objetivo. Adicionalmente, se cuenta con la sub categoría de aprendizaje no supervisado que conocemos como reducción dimensional.

Esta se utiliza para analizar datos de alta complejidad que requieren capacidad de procesamiento a gran escala. Su función principal es determinar la existencia de correlaciones entre las características que se presentan en los conjuntos de datos. Permitiendo de esta manera eliminar la redundancia de información y disminuyendo el tiempo de análisis.

Aprendizaje Reforzado

El aprendizaje reforzado es un modelo de Machine Learning diferente a los anteriores. Este tipo de análisis forma parte de lo que conocemos como aprendizaje profundo o Deep Learning. En él se tiene como objetivo principal la construcción de modelos que incrementen el rendimiento en base al análisis de resultados ya procesados. El marco ideal de este método de aprendizaje es que cada resultado produzca una recompensa.

Una recompensa en este módulo de aprendizaje es un resultado producto de una acción completa realizada con todos los criterios establecidos en el conjunto de datos. A medida que se generan estas recompensas el módulo de aprendizaje debe incorporar o ajustar la información de su comportamiento para decidir sobre acciones futuras, buscando obtener una recompensa máxima.

Este es uno de los tipos de Machine Learning más famosos del mundo tecnológico. Uno de los casos más destacados sobre este tipo de aprendizaje es el programa Alpha Zero que fue utilizado para comprender y conocer las posibles combinaciones a desarrollarse en un juego de ajedrez. En tan solo cuatro horas este software logró descubrir todas las combinaciones posibles para así derrotar al módulo computarizado de ajedrez Stockfish que es un motor de ajedrez UCI de código abierto para múltiples plataformas desarrollado por Tord Romstad, Joona Kiiski, Marco Costalba y Gary Linscott, con la colaboración de la comunidad de desarrolladores de código abierto.​

Related Articles

Responses

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *