Cómo una nueva mentalidad de IA para AutoML hará que el aprendizaje profundo sea más accesible

En esta función especial para invitados, Yonatan Geifman, director ejecutivo y cofundador de Deci, analiza cómo el aprendizaje automático automatizado (o AutoML) puede «democratizar la ciencia de datos» mediante la implementación gradual de diferentes niveles de automatización. Yonatan cofundó Deci después de completar su doctorado en ciencias de la computación en el Technion-Israel Institute of Technology. Su investigación se centró en hacer que las redes neuronales profundas (DNN) fueran más aplicables para tareas de misión crítica. Durante sus estudios, Yonatan también fue miembro del equipo MorphNet de Google AI. Su investigación se ha publicado y presentado en conferencias líderes en todo el mundo, incluida la Conferencia sobre sistemas de procesamiento de información neuronal (NeurIPS), la Conferencia internacional sobre aprendizaje automático (ICML) y la Conferencia internacional sobre representaciones de aprendizaje (ICLR).

El aprendizaje automático automatizado, o AutoML, ha generado mucho entusiasmo como camino hacia la “democratización de la ciencia de datos” y también ha encontrado su parte justa de escepticismo por parte de los guardianes de la ciencia de datos.

Para complicar aún más la conversación, no existe una definición estándar de AutoML, lo que puede hacer que el debate sea increíblemente difícil de seguir, incluso para los más versados.

El objetivo es bastante sencillo: al adoptar una nueva mentalidad de inteligencia artificial y automatizar los elementos clave del diseño de algoritmos, AutoML puede hacer que el aprendizaje automático sea más accesible para los usuarios de diversos tipos, incluidos individuos, pequeñas empresas emergentes y grandes empresas. Más específicamente, AutoML puede hacer que el aprendizaje profundo, el subconjunto más complejo del aprendizaje automático, sea accesible para los científicos de datos, a pesar de su naturaleza más complicada.

Esa es una propuesta de valor atractiva, una que promete una eficiencia sin precedentes, ahorros de costos y oportunidades de creación de ingresos. También ayuda a explicar por qué el mercado de AutoML crecerá astronómicamente en los próximos años. Según un pronóstico de P&S Intelligence, el mercado global de AutoML está en camino de crecer de $ 269.6 millones en 2019 a más de $ 14.5 mil millones para 2030, avanzando a una tasa compuesta anual de más del 40%.

Pero, ¿qué caerá bajo el paraguas de este mercado en rápida expansión? No hay una respuesta clara y sencilla. En cambio, para comprender mejor AutoML, debemos examinarlo como un espectro, y no tan en blanco y negro como completamente autónomo o completamente manual. Considere la industria automotriz, donde la autonomía se divide en diferentes niveles, que van desde el Nivel 1 (tecnología de asistencia al conductor) hasta el Nivel 5 (automóviles totalmente autónomos, que siguen siendo una perspectiva lejana). Pensar en AutoML de esta manera sirve como un recordatorio útil: la creación de modelos de IA automatizados no es una propuesta de todo o nada. Aquí hay un vistazo más de cerca a la escala graduada que está redefiniendo la canalización de la IA.

Nivel 0: sin automatización

Por definición, los procesos de aprendizaje profundo totalmente manuales se basan en las habilidades de los científicos de datos y otros especialistas para llevar a cabo procesos clave, incluida la programación de redes neuronales, el manejo de datos, la realización de búsquedas de arquitectura, etc.

El nivel de habilidad requerido para ejecutar estas tareas es formidable, lo que ayuda a explicar por qué el aprendizaje profundo (junto con el costoso talento requerido para implementarlo) ha resultado difícil de alcanzar para muchas organizaciones.

Nivel 1: Frameworks DL de alto nivel

Si bien la implementación manual de DL desde cero plantea muchos obstáculos, el trabajo acumulado de los programadores de DL y los científicos de datos ha llevado a la creación de marcos de alto nivel como Caffe, TensorFlow y PyTorch, que proporcionan modelos y canalizaciones de DL para que los usuarios escriban sus propias redes. y más.

Así como la conducción autónoma de nivel 1, que abarca los sistemas avanzados de asistencia al conductor (ADAS), ha brindado beneficios sustanciales a los conductores comunes sin dejar de estar muy lejos de la autonomía total, estas bibliotecas DL de alto nivel están haciendo que las canalizaciones DL sean más simples y eficientes. La implementación aún requiere un alto grado de experiencia en programación y DL, pero no requiere experiencia en ciencia de datos a nivel de doctorado, lo que la hace mucho más accesible para muchas organizaciones.

Nivel 2: Resolver tareas de conjuntos

Aprovechar los modelos previamente entrenados junto con el aprendizaje por transferencia produce un proceso aún más automatizado.

Este nivel de automatización se basa en la disponibilidad de modelos entrenados, como repositorios de código abierto y datos etiquetados, que luego se ajustan para resolver un problema determinado. Una vez más, esta etapa no evita la necesidad de conocimientos especializados en datos; depende de los ingenieros para preprocesar los datos y ajustar el modelo de acuerdo con la tarea en cuestión.

Nivel 3: AutoML con NAS

La búsqueda de arquitectura neuronal (NAS) es un campo emergente en el que los algoritmos escanean miles de modelos de IA disponibles para producir un algoritmo apropiado para una tarea determinada. Dicho de otra manera, la IA se utiliza para construir una IA aún mejor.

Si bien NAS ha sido el coto exclusivo de compañías de Big Tech como Google, Facebook y las principales instituciones académicas como la Universidad de Stanford, una mayor innovación en el campo generará una mayor escalabilidad y asequibilidad, abriendo una gama de aplicaciones de gran valor, incluido un análisis más sofisticado de la medicina. imágenes, por ejemplo.

Nivel 4: Automatización total

Cuando la canalización de aprendizaje profundo está completamente automatizada, los metamodelos establecerán los parámetros necesarios para una tarea determinada. Dados los datos de entrenamiento, el metamodelo puede inventar las arquitecturas adecuadas necesarias para la tarea en cuestión, así como ofrecer conocimiento previo sobre los hiperparámetros de la arquitectura.

Aunque todavía faltan varios años para la automatización total, trabajar hacia metamodelos brindará ganancias vitales en eficiencia y sofisticación incluso en los niveles más bajos de autonomía (al igual que los innovadores que trabajan para desarrollar automóviles autónomos ya han implementado mejoras en la tecnología automotriz). . Debido a que cada nivel de autonomía se basa en el otro, los modelos NAS desempeñarán un papel importante en la búsqueda de los metamodelos correctos para ejecutar en cada caso de uso.

Hacer que el aprendizaje profundo sea accesible para una audiencia más amplia

Queda por ver exactamente cuánto tiempo se necesita para que la automatización completa sea factible. Pero con un aprendizaje profundo más accesible como la estrella polar, los desarrolladores de IA están adoptando una nueva mentalidad y allanando el camino hacia un futuro en el que muchas de las tareas más engorrosas y costosas del ciclo de vida de la IA se volverán obsoletas, desatando una nueva generación de progreso de la IA.

Al final del día, independientemente de cómo definamos AutoML, el objetivo es hacer que el aprendizaje profundo sea más accesible para quienes lo necesitan. Esto significa simplificar su uso para que cualquier empresa, grande o pequeña, pueda producir IA.

Suscríbase al boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1