Por qué es hora de adoptar Data Lakes

En esta función especial para invitados, Craig Kelly, vicepresidente de análisis de Syntax, analiza cómo los lagos de datos pueden ayudar a las empresas a analizar y utilizar mejor los montones de datos que ya almacenan. Craig dirige los servicios profesionales y administrados en torno a la analítica y el desarrollo de productos y aplicaciones para la práctica de la analítica. Antes de trabajar en Syntax, Craig fue cofundador de EmeraldCube Solutions. Ha estado en el espacio analítico durante los últimos 20 años, trabajando con IBM Cognos, Oracle BI, herramientas GoodData para crear soluciones para clientes de ERP. Craig y su equipo ahora se enfocan principalmente en el análisis de AWS, integrando el almacenamiento de datos tradicional y la inteligencia empresarial, junto con las capacidades de pronóstico y aprendizaje automático con visión de futuro.

El año pasado, casi la mitad de los líderes de TI (42%) despriorizaron las iniciativas de análisis de datos e inteligencia empresarial (BI) debido a prioridades cambiantes. Ahora que las empresas se han ajustado, el análisis de datos y la BI están volviendo a ocupar el primer lugar en su lista de prioridades. El 55% de las empresas planean invertir en análisis de datos y tecnología de inteligencia empresarial este año.

A medida que las empresas se esfuerzan por estar más impulsadas por los datos, deben ser estratégicas desde el principio. Si su organización no es deliberada sobre cómo almacena y analiza los datos, no generará información que lo ayude a superar a la competencia. La tecnología del lago de datos está ayudando a las organizaciones de vanguardia a tomar el control y generar valor a partir de sus datos.

Los datos están creciendo, pero eso no significa que la información


Recomendado: ¿Qué es el Big data?.


Todo líder de TI sabe que los datos que producimos y recopilamos están creciendo exponencialmente. Para 2025, casi el 60% de los datos serán creados y administrados por empresas, el doble de la cantidad que produjeron desde 2015. La empresa promedio ahora administra 33 fuentes de datos únicas.

El volumen de datos y fuentes de datos significa que ya no es una opción para las empresas depender del almacenamiento y análisis basados ​​en hojas de cálculo. Las hojas de cálculo proporcionan una revisión limitada y retrospectiva de sus datos, son propensas a las inexactitudes y su mantenimiento requiere mucho tiempo.

Todas las empresas afirman que quieren estar basadas en datos, pero debido a la molestia percibida, muchas no van más allá de la recopilación y el almacenamiento. Entre el 60% y el 73% de todos los datos de una empresa nunca se analizan. ¿Por qué molestarse en gastar tiempo y dinero recogiéndolo si no lo va a utilizar?

Los datos intactos son una oportunidad perdida para impulsar la rentabilidad, la eficiencia operativa y la transformación empresarial. Con más datos que nunca provenientes de fuentes dispares, las empresas necesitan una forma más inteligente y eficiente de administrar la información que recopilan.

4 formas en que los lagos de datos pueden ayudarlo a estar más impulsado por los datos

Los líderes de TI deben considerar los lagos de datos como una posible solución tanto para la gestión como para el análisis de datos. Un lago de datos es un área de almacenamiento en la nube centralizada que puede albergar grandes cantidades de datos sin procesar en su formato nativo y de múltiples fuentes. Aberdeen descubrió que las organizaciones con prácticas superiores de lago de datos experimentaron un aumento del 9% en el crecimiento orgánico de sus ingresos. Los beneficios de los lagos de datos incluyen:

1. Repositorio centralizado: El análisis de datos de unas pocas fuentes limita los conocimientos que puede desarrollar. La empresa promedio aumenta sus fuentes de datos en un 50% cada año, y las empresas más competitivas están utilizando esta abundancia de información para su beneficio.

Los lagos de datos consolidan información de múltiples fuentes en toda la empresa, como su ERP, CRM, sistemas de recursos humanos o dispositivos de IoT, independientemente de si está almacenada en la nube o en las instalaciones. La centralización de datos aumenta la precisión de los datos, reduce los silos de datos y elimina la entrada manual de datos, lo que permite a su equipo dedicar más tiempo a actividades de valor agregado como el análisis.

2. Acceso conveniente: Uno de los beneficios más atractivos de un lago de datos es su capacidad para ayudar a los usuarios a analizar rápida y convenientemente una gran cantidad de datos. Las empresas con prácticas líderes en lagos de datos tienen tres veces más probabilidades de reportar un proceso de comercialización “fuerte” o “altamente efectivo” como resultado.

Debido a que los datos se almacenan en su formato nativo, la preparación, recuperación y análisis de datos son mucho menos onerosos con un lago de datos. Se requiere poco para la preparación de datos, a diferencia de las hojas de cálculo o los almacenes de datos donde los datos ingresados ​​deben estandarizarse. La recuperación de datos no requiere parámetros predefinidos para la búsqueda, lo que facilita el acceso y la extracción de datos.

3. Rentable: A diferencia de un almacén de datos, que almacena datos de forma jerárquica a través de archivos o carpetas, un lago de datos utiliza una arquitectura plana. Las organizaciones pueden escalar el almacenamiento a medida que crecen, lo que es más rentable y más fácil de implementar, lo que significa que no hay grandes desembolsos de capital ni meses de espera para el desarrollo.

Agregar tecnología de lago de datos a su ecosistema también mejora la funcionalidad de los sistemas heredados existentes al descargar la capacidad. Esto es especialmente atractivo para las empresas más grandes y establecidas que han realizado importantes inversiones previas en tecnologías de almacenamiento de datos y mainframe.

4. Capacidades modernas: Los lagos de datos permiten a las empresas utilizar técnicas analíticas más avanzadas y sofisticadas. Las organizaciones pueden aplicar el aprendizaje automático y la inteligencia artificial para limpiar y aumentar los datos entrantes, ejecutar algoritmos complejos para correlacionar diferentes fuentes de información o aplicar análisis predictivos. Los conocimientos se vuelven más maduros, lo que genera aún más valor para su organización con el tiempo.

Pero tenga en cuenta que sin la gobernanza y los procesos adecuados, un lago de datos tiene el potencial de convertirse en un pantano de datos. Si no se administra, un lago de datos puede deteriorarse hasta el punto de que sea inaccesible para los usuarios finales. Trabaje con un asesor de confianza para garantizar que se establezcan protocolos y responsabilidades claros desde el principio.

Empoderando una mejor toma de decisiones y crecimiento

Si bien las empresas están generando información digital más rica que nunca, el simple hecho de tener datos no equivale a crecimiento. Las organizaciones necesitan aprovechar los avances en la computación en la nube para facilitar medios más eficientes y complejos de almacenamiento y análisis de datos. Los lagos de datos permiten a las organizaciones recopilar más datos, de más fuentes, en menos tiempo, a una fracción del costo. Con una implementación adecuada, estos sistemas de almacenamiento de datos pueden generar un análisis comercial más sólido y una toma de decisiones más rápida, lo que permite que su organización se vuelva verdaderamente impulsada por los datos.

Suscríbase al boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1