Saltar al contenido

Databricks lanza aprendizaje automático simplificado en tiempo real para Lakehouse

7 de marzo de 2023

Databricks, la compañía de Lakehouse, anunció el lanzamiento de Databricks Model Serving para proporcionar aprendizaje automático (ML) de producción simplificado de forma nativa dentro de Databricks Lakehouse Platform. Model Serving elimina la complejidad de construir y mantener una infraestructura complicada para aplicaciones inteligentes. Ahora, las organizaciones pueden aprovechar Databricks Lakehouse Platform para integrar sistemas de aprendizaje automático en tiempo real en su negocio, desde recomendaciones personalizadas hasta chatbots de atención al cliente, sin necesidad de configurar y administrar la infraestructura subyacente. La integración profunda dentro de Lakehouse Platform ofrece linaje de datos y modelos, gobernanza y monitoreo a lo largo del ciclo de vida de ML, desde la experimentación hasta la capacitación y la producción. Databricks Model Serving ya está disponible de forma general en AWS y Azure.

Con las oportunidades que rodean a la inteligencia artificial (IA) generativa como centro de atención, las empresas sienten la urgencia de priorizar las inversiones en IA en todos los ámbitos. Aprovechar AI/ML permite a las organizaciones descubrir información de sus datos, hacer predicciones precisas e instantáneas que brindan valor comercial e impulsar nuevas experiencias impulsadas por AI para sus clientes. Por ejemplo, la IA puede permitir que un banco identifique y combata rápidamente los cargos fraudulentos en la cuenta de un cliente o brindarle a un minorista la capacidad de sugerir instantáneamente accesorios complementarios en función de las compras de ropa de un cliente. La mayoría de estas experiencias están integradas en aplicaciones en tiempo real. Sin embargo, la implementación de estos sistemas de ML en tiempo real sigue siendo un desafío para muchas organizaciones debido a la carga que recae sobre los expertos en ML para diseñar y mantener una infraestructura que pueda escalar dinámicamente para satisfacer la demanda.

“Databricks Model Serving acelera el camino de los equipos de ciencia de datos hacia la producción al simplificar las implementaciones, reducir los gastos generales y brindar una experiencia totalmente integrada directamente dentro de Databricks Lakehouse”, dijo Patrick Wendell, cofundador y vicepresidente de ingeniería de Databricks. “Esta oferta permitirá a los clientes implementar muchos más modelos, con menos tiempo de producción, al mismo tiempo que reduce el costo total de propiedad y la carga de administrar una infraestructura compleja”.

Databricks Model Serving elimina la complejidad de construir y operar estos sistemas y ofrece integraciones nativas en toda la casa del lago, incluido el catálogo Unity de Databricks, Feature Store y MLflow. Ofrece un servicio de alta disponibilidad y baja latencia para el servicio de modelos, lo que brinda a las empresas la capacidad de integrar fácilmente las predicciones de ML en sus cargas de trabajo de producción. Totalmente administrado por Databricks, Model Serving escala rápidamente desde cero y retrocede a medida que cambia la demanda, lo que reduce los costos operativos y garantiza que los clientes paguen solo por el procesamiento que utilizan.

“Como empresa líder mundial en electrodomésticos, Electrolux se compromete a brindar las mejores experiencias para nuestros consumidores a escala: vendemos aproximadamente 60 millones de productos para el hogar en alrededor de 120 mercados cada año. Pasar a Databricks Model Serving ha respaldado nuestras ambiciones y nos ha permitido avanzar rápidamente: redujimos nuestra latencia de inferencia en 10 veces, lo que nos ayudó a ofrecer predicciones relevantes y precisas aún más rápido”, dijo Daniel Edsgärd, director de ciencia de datos de Electrolux. “Al hacer el servicio de modelos en la misma plataforma donde viven nuestros datos y donde entrenamos modelos, hemos podido acelerar las implementaciones y reducir el mantenimiento, lo que finalmente nos ayuda a cumplir con nuestros clientes e impulsar una vida más placentera y sostenible en todo el mundo”.

El enfoque unificado y centrado en datos de Databricks para el aprendizaje automático desde Lakehouse permite a las empresas incorporar IA a escala y permite que la plataforma de capacitación de datos y ML sirva modelos. Lakehouse proporciona una vista coherente de los datos a lo largo de todo el ciclo de vida de ML, lo que acelera las implementaciones y reduce los errores, sin tener que unir servicios dispares. Con Databricks, las organizaciones pueden administrar todo el proceso de ML, desde la preparación y experimentación de datos hasta la capacitación, implementación y monitoreo de modelos, todo en un solo lugar. Databricks Model Serving se integra con las capacidades de Lakehouse Platform, que incluyen:

  • Tienda de funciones: proporciona búsquedas en línea automatizadas para evitar sesgos en línea/fuera de línea. Defina características una vez durante el entrenamiento del modelo y Databricks recuperará y unirá automáticamente las características relevantes en el futuro.
  • Integración de MLflow: se conecta de forma nativa a MLflow Model Registry, lo que permite una implementación rápida y fácil de modelos. Después de proporcionar el modelo subyacente, Databricks preparará automáticamente un contenedor listo para producción para la implementación del modelo.
  • Gobierno de datos unificado: Administre y gobierne todos los activos de datos y ML con Unity Catalog, incluidos los consumidos y producidos por el servicio de modelos.
Recomendado:  ¿Cómo está revolucionando la tecnología el futuro del desarrollo empresarial?

Databricks se compromete a impulsar la innovación con su plataforma Lakehouse y ofrecer más capacidades que hagan que el aprendizaje automático potente y en tiempo real sea accesible para cualquier organización. Esto incluye nuevas funciones de diagnóstico y calidad que estarán disponibles próximamente para el servicio de modelos de ladrillos de datos, que capturará automáticamente las solicitudes y respuestas en una tabla Delta para monitorear y depurar modelos y generar conjuntos de datos de entrenamiento. Databricks también está habilitando la compatibilidad con la inferencia basada en GPU, que está disponible en versión preliminar.

Regístrese para recibir el boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: https://twitter.com/InsideBigData1

Únase a nosotros en LinkedIn: https://www.linkedin.com/company/insidebigdata/

Únase a nosotros en Facebook: https://www.facebook.com/insideBIGDATANOW