Implementar machine learning: ¿es realmente necesario?

ESPECIAL

Guía de preguntas esenciales para implementar machine learning



Dirección copiada

El aprendizaje automático no es una solución mágica y no aplica a todos los casos de uso ni tipos de empresa.

Publicado el 10 jul 2018



Machine learning
Crédito: ShutterStock

El machine learning ya dejó de ser una tendencia novedosa para transformarse en un elemento fundamental en el funcionamiento y los modelos de negocio posible de diversas organizaciones. Sin embargo, como siempre sucede con las nuevas herramientas IT, no es una solución mágica y no aplica a todos los casos de uso ni tipos de empresa.

Es por esto que los CIO y sus equipos deben tener el panorama claro antes de realizar alguna inversión. Para esos fines, el sitio business.com recopiló cuatro preguntas que los tomadores de decisiones deben hacerse antes de embarcarse en el océano de soluciones y aplicaciones de las máquinas que aprenden.

1. ¿Realmente necesitamos machine learning?

Los proyectos de machine learning son costosos y suelen tener un tiempo de implementación largo. Además, las estimaciones de costos para investigación y desarrollo de inteligencia artificial suelen ser vagas y poco realistas. Pero quizás lo más importante a considerar es que no todas las empresas necesitan machine learning. ¿Por qué aventurarse en este tipo de iniciativas si muchas veces la ingeniería de datos puede bastar para solucionar las necesidades de la organización?

El número de profesionales con experiencia en inteligencia artificial también presenta un reto, no importa en qué parte del globo esté operando su organización. ¿Cómo evaluar entonces la utilidad efectiva del machine learning?

De acuerdo con TechCrunch, es posible dividir los casos de uso de machine learning en dos categorías:

  • Clasificación: Estos modelos son utilizados para reducir extensos sets de datos en subgrupos con un sentido de mayor valor. Algunos ejemplos son el reconocimiento de imágenes y el procesamiento de lenguaje natural.
  • Regresión: Cuando se necesita predecir, estos modelos son la respuesta. ¿La organización necesita hacer proyecciones de ventas que tomen en consideración miles de factores, desde indicadores macroeconómicos hasta peligros del escenario político? Un modelo de regresión puede otorgar el poder de análisis e interpretación necesario.

2. ¿Qué tipo de machine learning se necesita?

Los tipos de machine learning más extendidos en la actualidad son tres: supervisado, no-supervisado, y de aprendizaje de refuerzo.

El modelo supervisado es utilizado por cerca del 90% de los proyectos actuales de machine learning, según datos de Kostiantyn Didur, manager senior de Markerting en N-iX. Consiste en la predicción de una variable Y a partir de un set de datos X, y es válida cuando existen, por ejemplo, grandes sets de datos de clientes y registros históricos que revelan cómo se han comportado enfrentados a decisiones (como cuándo dar click a un ad).

Otros casos de uso efectivos serían la detección temprana de fallas en equipos, o la estimación de la puntuación de crédito de un cliente, entre otras.

Por otro lado, en el machine learning no supervisado solo existe un set de datos X, sin variables objetivo. Los algoritmos de IA en este caso trabajan con sets de datos gigantescos para encontrar patrones útiles que tomarían años a los humanos identificar.

Esta técnica se suele usar para generar clusters de información que luego puedan analizarse y relacionarse en una segunda instancia.

Un modelo menos utilizado pero de alta utilidad es el de aprendizaje de refuerzo. Aquí los científicos de datos especifican las reglas de un”juego”, el ambiente en que el “juego” se desarrolla, y la recompensa final. El caso más conocido de este modelo es el de AlphaGo, de Google, en el que una máquina aprendió a jugar mejor que cualquier humano el juego asiático Go, solo teniendo las reglas y generando un número muy alto de simulaciones en las que se enfrentaba a sí misma.

3. ¿Está listo para una ingeniería de datos extensiva?

La ciencia de datos y el machine learning dependen en buena medida de la ingeniería de datos. Un paso previo a hacer ciencia de datos es la extracción de la información a partir de fuentes fragmentadas, luego es necesario transformar esa información en sets de datos útiles y cargarlos en el motor de inteligencia artificial. Estas son tareas que usualmente no pueden automatizarse y requieren de un trabajo manual arduo y detallado.

Estos procesos, conocidos como extraer, transformar y cargar (ETL, por sus siglas en inglés) suelen tomar alrededor del 80% del tiempo invertido en un proyecto de machine learning.

4. ¿Se necesita un desarrollo a la medida, una API o la adquisición de una startup?

Existen tres estrategias principales para que una compañía adopte machine learning:

  • Construir una solución machine learning desde cero. Esta es la alternativa más riesgosa, tanto así que, de acuerdo a datos de N-iX, solo el 10% de los proyectos de este tipo prosperan. Aún así, para los casos menos comunes o para industrias con necesidades muy específicas podría ser la única opción viable.
  • Explorar machine learning a partir de motores cloud. Diversos proveedores ofrecen alternativas de machine learning como servicio. Esta es la puerta de entrada más fácil a esta tecnología. Por lo mismo, es una solución menos personalizable y con menos parámetros para configurar. Amazon, por ejemplo, solo cuenta con modelos de regresión, por lo que servirá a solo a necesidades muy específicas.
  • Adquirir una empresa con experiencia en machine learning. Si no se cuenta con la experiencia, siempre es una opción comprar a quien sí la tenga. Si bien esta opción es la más costosa, presenta tiempo de implementación más rápidos y la posibilidad de ajustar las soluciones a las necesidades de la organización, como si de un traje a la medida se tratara.

Para profundizar aún más en este tema, puede visitar la guía de cursos en línea para el desarrollo de habilidades en machine learning.

Artículos relacionados

Artículo 1 de 4