Carlos Vargas “El título de Científico de Datos no es la meta final, el siguiente paso es Machine Learning Engineer”

El Científico de Datos, Financiero, Maestro en analítica y sistemas de información y Profesor Mexicano, considera que existen 3 pilares para convertirte en un Científico de Datos.

Carlos Vargas considera que existen 3 pilares para convertirte en un Científico de Datos:

  1. La tecnología
  2. Las matemáticas
  3. El conocimiento del negocio

Éste último depende de la industria en la que tengas experiencia. Puedes ir perfeccionando cada pilar conforme pasa el tiempo y en su caso, elegir esta carrera fue de manera muy orgánica.

Trayectoria profesional

Estudiar finanzas, despertó su interés en la analítica y durante su carrera desarrolló este tipo de habilidades, aunque después de algunos años de estudio se dio cuenta que necesitaba complementar su conocimiento con el manejo de Software para este fin como Python, R y SQL. Él toda la vida ha programado, de esa forma fue realmente orgánico su desarrollo como Científico de Datos a lo largo de su carrera.

Empezó su vida laboral en áreas de Inteligencia de Negocio, haciendo reportería en el nivel más básico. Posteriormente desarrolló habilidades en Python lo cual habilitó la posibilidad de modelos estadísticos, modelos de clusterización y sistemas de recomendación. 

En este momento de su carrera trabaja en Chubb seguros como Científico de Datos Senior haciendo las siguientes actividades principales:

  1. Modelos de predicción de fraude: normalmente está utilizando modelos de clasificación binaria para predecir fraude.
  2. Modelos de cliente: tiene modelos de Churn en donde analiza la tasa de abandono de los clientes. Cuando obtienen un cliente nuevo, revisan la probabilidad de abandono del mismo juntando modelos de propensidad de compra por reglas de asociación donde se especifica cuál es la probabilidad de que un cliente compre un producto. Con la combinación de estos 2 modelos puede generar customer life time value y con el valor, apoya a campañas de Marketing para identificación de los mejores clientes.
  3. Modelos de pricing: En donde checa la elasticidad de los precios comparativamente contra la tasa de conversión de ventas.

¿Con cuáles departamentos de la empresa trabaja un Científico de Datos mayormente?

El área de ventas para establecer modelos de elasticidad de precios, para entender a qué precio puedes tener una menor tasa de conversión, así como mejorar el rendimiento. 

Por otro lado, en la industria de las aseguradoras, el área de fraude en México es crucial, este modelo identifica posibles transacciones fraudulentas a través de bases de datos historicas del cliente y de los transacciones.

El departamento de Marketing Digital es el que hace las campañas masivas con la información de life time value. Éstas en parte son en Redes Sociales donde por ejemplo, Facebook pide retroalimentación de los resultados de la campaña para hacer cada vez más certeras las futuras campañas. 

¿Por qué te gusta dar clases?

Porque el conocimiento está destinado a ser libre. Cuando compartes conocimiento, a la vez haces Networking y con ello puedes solucionar problemas cada vez más complejos, que es el día a día de un Científico de Datos.

Además, explicar los temas a tus alumnos, refuerza los conocimientos propios. Aprendo yo, aprenden los demás y crece la red, así que es un ganar-ganar.

El siguiente paso es Machine Learning Engineer

El 90% de los modelos de Inteligencia Artificial, nunca llegan a producción debido a que es difícil aplicarlos y por la cultura de falta de confianza de los modelos, eso hace que esta cifra sea tan alta.

Ser un Machine Learning Engineer es la evolución orgánica de un Científico de Datos debido a que te permite operacionalizar y monitorear los modelos para crear resultados tangibles hacia el negocio.

Y entonces además de los 3 pilares mencionados al principio del artículo ¿Qué perfil debe tener un Científico de Datos?

Debe tener un gusto apasionado por los datos y por los modelos, es una carrera en la que entre más buscas, más encuentras y siempre se pone más interesante.

Es necesario también seguir estudiando en línea todo el tiempo y haciendo prácticas con Bases de Datos reales como las que puedes encontrar  en Kaggle. 

¿Cuál fue la mayor Base de Datos que has manejado y qué resultados obtuviste?

Fue una base de datos de 33,000 tweets para un procesamiento de lenguaje natural como parte de mi tesis de Maestría con un 84% de accuracy. Trataba de identificar la relación entre la percepción pública y la estrategia de precios de una marca.  

Como parte de las acciones de la limpieza de la Base de datos, removí texto, arrobas y hashtags, así como stopwords, caracteres especiales y los nombres de las marcas objeto de estudio. También removí el spam y vectoricé el texto. 

Dependiendo de la manera en la que el tweet estaba escrito, podía predecir a qué marca le estaban hablando validando la hipótesis de que cada empresa tiene una manera distintiva en la que se refieren a ella, asumiendo así que es el servicio que presta al cliente.

Para cerrar

Si nos dedicamos o no a las matemáticas o informática, es nuestra responsabilidad entender la Ciencia de Datos, aunque no sea a un nivel técnico ya que seguramente somos usuarios de plataformas tecnológicas como Facebook, Twitter, Netflix, Amazon, entre otras. Estas y muchas otras están utilizando Inteligencia Artificial y es nuestra responsabilidad cómo usuarios saber cómo funcionan a grandes rasgos.

Entrevista realizada a Carlos Vargas, Profesor de Lo esencial de la ciencia de datos del Colegio de Matemáticas Bourbaki a través de Blenio por parte de Lilia Solís.

Related Articles

Responses

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *