El problema con los lagos de datos: Cómo las empresas pueden sacar el máximo provecho de sus datos

En este reportaje especial, Bob Friday, CTO de Mist Systems, una empresa de Juniper Networks, cree que los lagos de datos han crecido más allá de lo que nadie imaginó inicialmente, hasta el punto de que se han convertido en océanos de datos. Afortunadamente, hay varias maneras en que las empresas pueden navegar por estas aguas para aprovechar al máximo sus datos. Bob comenzó su carrera en el sector inalámbrico en Metricom (red inalámbrica Ricochet) desarrollando y desplegando redes de malla inalámbrica en todo el país para conectar la primera generación de navegadores de Internet. Después de Metricom, cofundó Airespace, una empresa de nueva creación centrada en ayudar a las empresas a gestionar la avalancha de empleados que traen tecnología WiFi sin licencia a sus negocios. Tras la adquisición de Airespace por parte de Cisco en 2005, Bob se convirtió en el VP/CTO de movilidad empresarial de Cisco e impulsó la estrategia de movilidad y las inversiones en el negocio de la telefonía móvil (por ejemplo, Navini, Cognio, ThinkSmart, Phunware, Wilocity, Meraki).

Las empresas están buscando en los lagos de datos para resolver una serie de retos de la red, desde el diagnóstico de los problemas de la red hasta la detección de las brechas de seguridad en las redes. Con el impacto comercial de COVID-19 y el cambio de los patrones de tráfico de datos en la red, las empresas deben responder cada vez más a las preguntas que requieren que los conjuntos de datos distribuidos se almacenen en múltiples proveedores, una medida que nos hará replantear la forma en que accedemos a los datos para ayudar a resolver problemas comerciales remotos. En el futuro del trabajo desde casa, la mala calidad de las conferencias telefónicas puede pasar de ser una molestia menor a un gran impedimento, y será necesario disponer de los datos adecuados para ayudar a resolver ese problema.

Aunque los lagos de datos desempeñan un papel vital para ayudar a las empresas a resolver una serie de problemas de red, nuestra creciente dependencia de los lagos de datos ha creado un nuevo problema en sí mismo: son simplemente demasiado grandes dada la cantidad exponencialmente creciente de datos que se generan. Los lagos de datos han crecido más allá de lo que nadie imaginó inicialmente, hasta el punto de que se han convertido en océanos de datos. Afortunadamente, hay varias maneras en que las empresas pueden navegar por estas aguas para aprovechar al máximo sus datos.


Recomendado: ¿Qué es el Big data?.


El problema con los océanos de datos

La transformación de los lagos de datos a los océanos de datos crea una serie de nuevas implicaciones. En un mundo de trabajadores remotos, uno de los mayores puntos dolorosos que los equipos de TI están tratando de abordar es el diagnóstico de dónde está ocurriendo un problema o raíz en la red. Esto se vuelve mucho más difícil de resolver para IT cuando se mira un océano de datos. Simplemente hay demasiadas fuentes de información, lo que hace difícil entender por dónde empezar a buscar una respuesta.

Mientras que la gran cantidad de datos puede ser abrumadora para los informáticos y los científicos de datos, el costo monetario del almacenamiento de los datos puede ser igualmente abrumador. Si las empresas ignoran el problema, entonces con el tiempo, el costo de almacenamiento de datos seguirá subiendo, añadiendo una costosa carga a un problema ya existente. Para utilizar los datos de manera más eficaz, las empresas deben aprender a virtualizar sus conjuntos de datos distribuidos. Eso comienza asegurándose de que tienen los datos correctos necesarios para responder a la pregunta.

No todos los datos son iguales

Antes de tratar de organizar estas grandes cantidades de datos, las empresas deben dar un paso atrás y preguntarse: “¿Cuál es la pregunta que necesito que se responda?” Este es un paso necesario antes de apilar datos en lagos de datos. Una vez que se determina esta pregunta, se puede reducir dónde comenzar el viaje de búsqueda de una respuesta. De esta manera, todo comienza con el uso de los datos correctos.

Los datos correctos deben ser completos, precisos y actuales. Por simple que parezca, la calidad de los datos es algo que puede pasarse por alto y descuidarse fácilmente. Sin embargo, con empleados que dependen más que nunca de los lagos de datos, y con empleados en transición hacia el trabajo a distancia, este es un buen momento para que las empresas reconsideren su estrategia comercial. Esa estrategia debería incluir la inversión en herramientas de gestión de la calidad de los datos que puedan ayudar a que los datos estén en un buen lugar para responder a nuevas preguntas y resolver nuevos problemas.

Una vez que las empresas han identificado la información adecuada para responder a sus preguntas y virtualizar sus conjuntos de datos distribuidos, están listas para aprovechar su inversión en AIOps. Esto significa pasar de un paradigma de gestión de elementos de red a uno de gestión de las experiencias de usuario de extremo a extremo en sus redes y de las experiencias de aplicaciones de extremo a extremo en sus centros de datos.

Mirando hacia adelante: Redes de autoconducción de IA

Así que, tienes tus datos etiquetados, tus conjuntos de datos distribuidos virtualizados y la tecnología de la IA implementada. ¿Qué es lo siguiente? Desde la perspectiva de la industria, el próximo objetivo es llegar al punto de las redes autogestionadas. Con una red autogestionada, los futuros departamentos de TI tendrán un asistente de IA virtual para liberar recursos para trabajar en esfuerzos de negocios más estratégicos. El asistente virtual de IA del futuro detectará y resolverá los problemas de la red a la par de un experto en el dominio de la red, pero a la velocidad de una computadora.

Para hacer realidad este objetivo, las empresas deben hacer el trabajo para llegar a él. Esto incluye la creación de mejores soluciones y estrategias para correlacionar los datos y virtualizar el acceso a los cada vez más numerosos conjuntos de datos distribuidos. Al comenzar con la pregunta inicial y los datos correctos, las empresas pueden crear una base sólida para aprovechar al máximo los datos que tienen y resolver sus problemas más críticos, mientras mueven a la industria hacia el siguiente nivel de soluciones de datos impulsados por la IA.