Los desafíos de podar modelos de IA en el borde

En esta función de invitado especial, Nick Romano, CEO de Deeplite, analiza cómo la lucha por adaptar modelos avanzados en dispositivos de borde con recursos limitados obliga a los equipos de aprendizaje profundo a comenzar a «podar» los modelos, esencialmente recortando partes que no se consideran críticas. Deeplite es una empresa de nueva creación cuya misión es habilitar la inteligencia artificial para la vida cotidiana. Deeplite tiene su sede en Montreal y una oficina en Toronto. Nick es un emprendedor en serie y un consejero delegado consumado que ha obtenido resultados satisfactorios durante más de 20 años. Recientemente, cofundó y escaló una plataforma SaaS empresarial con ingresos recurrentes multimillonarios y más de 100 empleados. Ha sido honrado por McMaster University Engineering como Top 150 Alumni.

No es ningún secreto que el increíble poder de la tecnología de inteligencia artificial está despegando en todo el mundo. De hecho, los modelos de IA están impactando casi todas las facetas de nuestra vida personal y profesional, desde las compras en línea y el reconocimiento facial en los aeropuertos, hasta la mejora de las capacidades de detección en tiempo real de las defensas de ciberseguridad y la habilitación de vehículos autónomos. Todo esto y más se está impulsando mediante el uso de modelos de IA.

Y si bien estas capacidades son de gran alcance y esenciales para la innovación continua de la sociedad, no vienen sin desafíos. Las redes neuronales profundas (DNN) que permiten estas tareas se basan en grandes modelos de IA, que requieren grandes cantidades de datos. Con mucho entrenamiento y ajuste, estos modelos se vuelven muy precisos, pero también necesitan una cantidad significativa de almacenamiento, memoria y recursos informáticos. Este requisito puede hacer que los proyectos de IA sean demasiado complejos y costosos para muchas organizaciones.

Poda de modelos de IA

Si está ejecutando estos grandes modelos de IA en un centro de datos, probablemente no tenga que preocuparse por podarlos, pero ¿qué pasa con una cámara pequeña en un piso de fabricación? ¿O en un dron analizando agricultura y agricultura? Estos pequeños dispositivos no pueden soportar las enormes cantidades de datos y potencia de cómputo necesarios para que los modelos funcionen de manera eficiente y precisa. Entonces, ¿cómo intentan los equipos de aprendizaje profundo hacer que sus modelos sean más eficientes? El enfoque común es «podarlos», lo que significa esencialmente eliminar las partes que no se consideran críticas. La poda puede reducir el tamaño del modelo de IA, pero tiene un precio. La poda puede reducir significativamente la precisión del modelo, lo que significa que no funciona tan bien como el original.

Para tratar de minimizar el impacto en la precisión, ese mismo equipo de aprendizaje profundo deberá intentar determinar manualmente qué partes del modelo deben podarse y cuáles no. Esta prueba y error requiere mucho tiempo, esfuerzo y costo y, en general, solo mejora marginalmente los resultados. Por ejemplo, si tenemos una aplicación de misión crítica como la detección de personas para un vehículo autónomo, utilizar técnicas de poda para optimizar el modelo da como resultado una menor precisión. Menos precisión en la detección en persona para este caso de uso no es un comienzo.

Y eso es exactamente lo que no queremos hacer con la IA. El poder de la IA debe desatarse en el borde con total precisión y la capacidad de ejecutarse en dispositivos con recursos limitados. Eso significa optimizar la tecnología dentro de los modelos.

El poder de la optimización

Los motores de optimización automatizados lo están haciendo posible. Con estas herramientas, los modelos de IA no tienen que sacrificar la precisión al eliminar grandes cantidades de datos. En cambio, los motores de optimización automatizados solo se enfocan en la forma en que se construyó el modelo en primer lugar y transforman el modelo en una versión optimizada de lo que era antes. Los desarrolladores de modelos pueden concentrarse en entrenar su modelo con la mayor precisión posible y confiar en motores de optimización automatizados para producir de manera rápida y confiable una versión compacta de su modelo que no sacrifique el rendimiento funcional.

Además, al utilizar datos de entrenamiento junto con el proceso de optimización, estas herramientas aseguran que la precisión en el nuevo modelo no solo se mantenga, sino que se pueda hacer más robusta en datos totalmente invisibles (del mundo real). Los modelos que son más pequeños, más rápidos y que consumen menos energía, pero igualmente precisos, se pueden usar para resolver problemas complejos directamente en dispositivos como teléfonos inteligentes y automóviles, así como herramientas que hacen que las empresas funcionen, como cámaras de video en plantas de fabricación.

Hacer que la IA sea más rápida y más pequeña mientras se mantiene la precisión no es lo único que pueden hacer los motores de optimización. También reduce los costos en la nube y los back-end de hardware, lo que puede ayudar a las empresas a escalar sus servicios de inteligencia artificial. Además, puede acelerar el tiempo de comercialización al encontrar más fácilmente diseños robustos y eficientes. De hecho, las aplicaciones de visión artificial, como la clasificación de imágenes, la detección de objetos y la segmentación, ahora pueden estar operativas en días o incluso horas, en lugar de varios meses.

Estas herramientas de optimización de IA se pueden usar en cualquier dispositivo, incluidos teléfonos inteligentes y cámaras, vehículos, drones, dispositivos conectados para IoT y mucho más. La optimización se puede aplicar a diferentes dominios de aplicaciones, como la visión, el audio y el procesamiento del lenguaje natural. En algunos casos, los modelos de IA optimizados pueden lograr la misma precisión que sus contrapartes iniciales, ¡con tan solo 100x de memoria y 10x menos de energía!

La IA se está convirtiendo en parte de la vida cotidiana y, con los motores de optimización, los modelos de poda pueden convertirse en una cosa del pasado, lo que ayudará a que la IA despegue más rápido que nunca.

Suscríbase al boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1