Qué es Automated Machine Learning: la próxima generación de inteligencia artificial

Tener conocimientos de Machine Learning (ML) es una habilidad que cada vez adquiere mayor relevancia en las organizaciones. Los científicos de datos pueden utilizar ML para ahorrar tiempo y recursos, especialmente a la hora de interactuar con grandes volúmenes de datos.  El problema es que al desarrollar modelos ML aún hay que lidiar con tareas lentas y repetitivas, como el entrenamiento mismo de la inteligencia artificial. Es por esto que surgió la categoría de Automated Machine Learning, o autoML: automatizar al automatizador.

Con AutoML el desarrollador reduce el tiempo necesario para crear modelos de ML que estén listos para entrar en producción. Entre sus ventajas está el hecho de democratizar el proceso de desarrollo de un modelo ML, ya que sin importar los conocimientos en ciencia de datos de los usuarios estos pueden identificar qué algoritmos ML analizan mejor la información y resuelven las problemáticas para las que fueron creados.

¿Cómo puede subirse a esta ola una compañía? AutoML resulta de utilidad tanto para científicos de datos como para quienes están empezando a utilizar ML para especializarse. Trabajar en esta rama de inteligencia artificial requiere saber cómo importar, limpiar, transformar y visualizar los datos; sobre todo si se considera que es necesario integrar tanto datos estructurados como no estructurados.

En “A Brief Introduction to AutoML”, publicado por la revista de AI Becoming human, se indica que ML puede requerir contratar varias personas experimentadas y seguir sus sugerencias a propósito de qué modelo elegir. Mientras que con AutoML no hace falta hacer tal contratación, porque personal con menos experiencia técnica puede hacer un desarrollo exitoso utilizando un modelo pre-construido en el sistema y que hasta puede usarse para implementaciones futuras.


Un esquema de cómo funciona y con qué interactúa AutoML. Fuente: Becoming Human

AutoML aplica algoritmos ML a problemas reales mediante un proceso sencillo: se hace la lectura de los datos que se recuperaron de la fuente, luego de verificar valores redundantes o nulos; el pre procesamiento de la información revisa las características de extracción, selección, ingeniería y optimización. En la fase de optimización se corrige el modelo del conjunto de datos para producir el resultado requerido. En la implementación se pueden reducir los gastos y el tiempo. Esto requiere manejar datos predictivos y generar nuevas técnicas para que el negocio funcione exitosamente.

A pesar del optimismo, este no es un tema de magia, ni se logran cambios de la noche a la mañana. El año pasado, cuando el presidente y director general de Google, Sundar Pichai, anunció un producto cloud de AutoML, dijo que actualmente se requiere mucho tiempo y expertos para diseñar redes neuronales. “AutoML muestra que es posible que sean las propias redes neurales las que diseñen este tipo de redes”. El ejecutivo señaló que confía en que AutoML podrá tener la habilidad que tiene hoy en día un doctor en física, para que dentro de tres o cinco años, haya miles de desarrolladores capaces de desarrollar nuevas redes neurales para necesidades particulares.

¿Qué plataforma es mejor para la empresa?

Ante esto surge la inquietud de por dónde empezar. En el reporte AI Within Reach: AutoML Platforms for the Enterprise, se afirma que AutoML es una disciplina de AI que está tomando ímpetu actualmente. El blog hace algunas recomendaciones para optar por la plataforma AutoML que mejor convenga a los usuarios:

  • Si luego de investigar y calcular el retorno de inversión que tendría la organización luego de implementar AI/ML, la organización pondera estar lista para proceder y cuenta científicos de datos, podría empezar con plataformas AI/ML convencionales y después definir algunos temas que quisiera abordar con AutoML.
  • ¿Es una compañía entusiasta de AI pero no tiene científicos de datos? Mientras consigue el talento (tarea difícil, si se toma en cuenta que se considera el nuevo activo de la economía digital) hay dos opciones: Si tiene desarrolladores en su staff IT puede evaluar el uso de APIs AutoML comerciales y de código abierto. Pero si no tiene esa opción es posible recurrir a plataformas con interfaces de usuario orientadas a negocio.
  • En el escenario en que tenga un equipo de científicos de datos pero se les ha acumulado la labor de un gran proyecto y necesitan apoyo, puede buscar plataformas AutoML que eleven la productividad del equipo y cuenten con características orientados a científicos de datos. O bien, dar prioridad a plataformas AutoML que destaquen la afinación de hiperparámetros y agrupamientos para su creación.
  • ¿Está buscando optimizar un modelo más preciso? Puede recurrir a plataformas que sirvan para soluciones ML y deep learning, capaces de identificar los mejores algoritmos de ambas.
  • ¿Sus necesidades de AI son muy específicas, como reconocimiento de imagen, análisis de texto y traducción? En este caso, lo que requiere es algo específico, con servicios cognitivos basados en AutoML, nativos de cloud.

En fin, las posibilidades son múltiples pero el principio no cambia: la inteligencia artificial y el big data están presentando retos cada vez más grandes para los que la capacidad humana no es suficiente. Automatizar máquinas para que automaticen otras máquinas será una tarea cada vez más común en las organizaciones que tomen el camino de la AI.

Herramientas AutoML

Entre las opciones de AutoML disponibles en la actualidad están Dataiku, plataforma de software colaborativo para analíticos de autoservicio y modelos ML; DataRobot AutoPilot, plataforma de AutoML que permite generar modelos predictivos; H20 Driverless AI, solución AutoML que funciona como científico de datos experto, por lo que ofrece potencia a equipos principiantes y especializados; RapidMiner, herramienta de minería de datos que permite construir modelos predictivos en poco tiempo; y TIBCO Data Science, solución que reúne ML, datos, procesos y personas.

También existen opciones en la nube de AutoML: Microsoft Automated Machine Learning, Amazon SageMaker Automatic Model Tuning y Google AutoML. Entre las alternativas de código abierto se encuentran, entre otras, las bibliotecas de Auto-sklearn, Auto-Keras y H20 AutoML.

Si bien uno de los argumentos para considerar que AutoML es la “nueva ola” de ML es que involucra inversiones económicas más pequeñas, en el portal Heartbeat publicaron recientemente algunos casos que muestran soluciones adoptadas por usuarios de distintos mercados que han desarrollado modelos ML para resolver problemáticas complejas.

El texto destaca tres grandes ventajas que ofrece AutoML: Incrementa la productividad al automatizar tareas repetitivas, lo que permite que el científico de datos se enfoque en el problema a resolver más que en los modelos que tiene que desarrollar; al automatizar la fuente de información de ML se evitan errores difíciles de identificar manualmente;  y la tercera ya se había mencionado al inicio, es la democratización que ML implica al acercar esta tecnología a usuarios menos experimentados.

Como siempre, dependerá de las necesidades y recursos que la empresa pueda dedicar a esta disciplina el tipo de solución por la que opte. La promesa de que sea más ágil el desarrollo de modelos vale el tiempo dedicado a conocer más de esta categoría de ML.

Maricela Ochoa

Reportera de tecnología. Suele buscar temas de innovación, nuevas aplicaciones IT y seguridad de la información. Periodista por la UNAM; estudió Marketing en el ITAM y Branding en la Universidad de Bogotá Jorge Tadeo Lozano. Storyteller apasionada por la astronomía.

Related posts

Deja un comentario