Por qué necesitamos operaciones ML: 4 cosas a considerar cuando se prueba la IA

En este reportaje especial, Stephan Jou, CTO de Interset, una compañía de Micro Focus, explora las cosas que los negocios deben considerar cuando despliegan tuberías de producción ML y prueban la IA. Interset es una empresa líder en ciberseguridad e In-Q-Tel que utiliza el aprendizaje automático y el análisis de comportamiento. Jou tiene una maestría en Neurociencia Computacional e Ingeniería Biomédica, y una doble licenciatura en Ciencias de la Computación y Fisiología Humana, todas de la Universidad de Toronto. Ha ocupado cargos de asesoramiento en las redes estratégicas del NSERC y participa en el establecimiento de objetivos para los temas de investigación de la Beca de Investigación Estratégica del NSERC en las áreas de análisis y seguridad para Canadá y fue un participante invitado en la Conferencia de múltiples interesados del G7 sobre Inteligencia Artificial de 2018.

MLOps – un compuesto de “aprendizaje automático” y “operaciones” – es una nueva práctica óptima emergente en el espacio empresarial que está ayudando a los líderes de la ciencia de los datos a desarrollar, desplegar y supervisar eficazmente los modelos de datos. Según las nuevas investigaciones, se prevé que el mercado de los MLOPS sólo crecerá en los próximos años, y se estima que alcanzará casi 4.000 millones de dólares en 2025. Con un crecimiento tan rápido, es importante que las empresas den prioridad a la innovación de los MLOPS ahora.

¿Por qué es tan importante el MLOPS?


Recomendado: ¿Qué es el Big data?.


Un estudio reciente descubrió que el 89% de los responsables de la toma de decisiones de TI a nivel mundial encuestados creen que la IA y el aprendizaje automático son fundamentales para que las organizaciones lleven a cabo sus operaciones de TI.

Aunque es tentador pensar en un modelo de aprendizaje de máquinas como una caja negra, en realidad, es una tubería con muchos componentes. De manera similar a como DevOps surgió de la necesidad de proporcionar un marco para el ciclo de vida del desarrollo de software, MLOps se ha desarrollado como un marco y una práctica óptima para el desarrollo y la implementación de sistemas de aprendizaje automático. El desarrollo y la implantación del aprendizaje automático comprende un complejo conjunto de personas, procesos y tecnologías que, de manera similar al mundo del desarrollo de software, tiene un ciclo de vida que debe ser gestionado, supervisado y optimizado para ser eficaz. Ahora que las empresas han aceptado el valor de la IA y el ML, es importante que se centren en extraer el valor prometido de esos sistemas de ML a través de los MLOps.

¿Cómo pueden las empresas probar mejor la IA?

Debido a que los MLOPS en la industria empresarial no se ralentizarán, aquí hay cuatro maneras en que las empresas pueden empezar a probar la IA de manera más efectiva y eficiente:

Enfoque en el despliegue del modelo

Los modelos matemáticos de aprendizaje automático tienen un ciclo de vida que abarca desde la hipótesis hasta la prueba, el aprendizaje, la codificación, la puesta en escena y la producción. Todo el proceso de despliegue de extremo a extremo necesita ser rastreado, monitoreado e, idealmente, automatizado.

Estos modelos matemáticos deben ser probados y reproducidos en nuevos conjuntos de datos no vistos durante el desarrollo inicial, tanto en la fase previa a la producción como en la fase posterior continua, para detectar la deriva del modelo (cuando las condiciones o supuestos del modelo original ya no se aplican). Al igual que el código fuente y las pruebas de regresión de los programas informáticos, los modelos deben ser controlados por la versión y probados de forma automática y continua.

Dar prioridad a la seguridad y la gobernanza del modelo

Los ataques contra la IA y los modelos de aprendizaje automático siguen siendo expuestos tanto por los hackers como por los líderes de la comunidad de investigación. A medida que los MLOPS crecen en prominencia dentro de la industria de la TI, es importante que los profesionales incorporen la seguridad en todo el ciclo de vida de la IA. Dada la dependencia del aprendizaje automático de los datos, la privacidad de los datos y las consideraciones éticas deben ser evaluadas y consideradas con frecuencia. Muchos ataques de IA se basan en vulnerabilidades que pueden prevenirse fácilmente mediante revisiones y pruebas regulares.

Monitorizar el rendimiento del modelo

En la producción, dado que el aprendizaje de la máquina rara vez es binario y se asocia con la precisión de la predicción, es crucial vigilar el rendimiento del modelo. Las empresas deben seguir preguntándose cuán preciso es el modelo de aprendizaje por máquina en la producción con datos reales. Los profesionales de la informática también deberían medir si el rendimiento está decayendo o mejorando con el tiempo. Por ejemplo, un modelo que se ejecuta rápidamente con pequeñas cantidades de datos podría encontrarse con dificultades en un gran número de puntos de datos en producción, o con nuevas condiciones de datos cambiantes que afecten a la carga computacional. Es importante disponer de sistemas de vigilancia para medir y registrar para mejorar el rendimiento y la escalabilidad del modelo.

Automatizar a escala

La automatización a través de MLOps es crítica para escalar los sistemas de producción basados en el aprendizaje de la máquina. A medida que la IA se democratiza cada vez más y se vuelve más importante para las empresas, y no es el dominio exclusivo de grandes compañías como Google, Facebook y Amazon, los MLOps se convertirán en un requisito crítico para el despliegue masivo y la gestión de esos sistemas de IA.

Durante las etapas iniciales del desarrollo de los modelos, muchas de las tareas mencionadas anteriormente son realizadas por científicos o ingenieros de datos humanos, utilizando herramientas y procesos manuales. Si bien esto es aceptable durante la fase inicial de desarrollo exploratorio, la excesiva dependencia de los métodos humanos y manuales limitará innecesariamente la producción, especialmente a medida que el número de modelos aumente hasta los cientos o miles.

En la actualidad, las herramientas y prácticas de MLOps están teniendo un impacto dramático en el mundo de la tecnología de la información, ayudando a aumentar la productividad a través de la automatización e inteligencia que pone a las empresas en una mayor ventaja frente a sus competidores. Los responsables de la toma de decisiones y los líderes de TI deben tener en cuenta el papel que desempeñarán los MLOPS en su negocio y reconocer el rendimiento, la seguridad y la escalabilidad del modelo a medida que los MLOPS sigan evolucionando y creciendo en el mercado.

Suscríbete al boletín de noticias gratuito de InsideBIGDATA.