Saltar al contenido

Tendencias 2022 en la gobernanza de datos: capacidades operativas

28 de noviembre de 2021

Para las organizaciones de todo el mundo, independientemente de la industria, el tamaño o el área de interés, la gobernanza de datos ha alcanzado un punto de inflexión crítico. Se ha establecido durante mucho tiempo como un área vital de la gestión de riesgos basada en lograr el cumplimiento normativo, mantener la privacidad de los datos y garantizar la sostenibilidad continua de los datos como un activo empresarial.

Hoy, sin embargo, está saltando más allá de sus capacidades de gestión de riesgos para entrar con valentía en la arena de las operaciones como una de las construcciones más viables para determinar o influir en la acción basada en datos. Además, los desarrollos recientes le han permitido hacerlo de forma dinámica, casi instantáneamente y potencialmente con tanta influencia como los análisis posteriores y la toma de decisiones resultante que inevitablemente sigue.

“Uno de los temas importantes para Gartner es la idea de metadatos activos”, reconoció Irene Polikoff, CEO de TopQuadrant. “Un aspecto de eso es que es directamente procesable; en realidad, los sistemas operativos lo utilizan en tiempo real para hacer varias cosas «.

La funcionalidad operativa que la gobernanza de datos ofrecerá en 2022 y más allá se refiere a la gestión de metadatos, el modelado de datos, la administración de datos, el aprendizaje automático y la inteligencia artificial, y varios otros componentes.

Su transición de un conjunto de principios y protocolos principalmente estático y pasivo a la aplicabilidad en tiempo real para una variedad de casos de uso que producen valor comercial naturalmente respalda lo que se está convirtiendo rápidamente en una economía de datos en la que las empresas se están «moviendo hacia un mercado de datos», agregó Purnima. Kuchikulla, Director de Éxito del Cliente de Privacera.

Modelado de datos operativos

Algunas de las acciones operativas más significativas derivadas de la gobernanza de datos se derivan del modelado de datos. El intercambio de datos entre diversos sistemas como parte de un tejido de datos colectivos es más indispensable que nunca, y más organizaciones adoptan este enfoque de gestión de datos. Los modelos de datos altamente expresivos con una semántica y taxonomías claras pueden aprovechar la inteligencia de la máquina para inferir cómo se pueden combinar los diversos esquemas de diferentes sistemas de datos para lo que el CTO de TopQuadrant, Ralph Hodgson, llamó integración sin fricciones. «Tiene información similar en diferentes sistemas y la solución de gobernanza tiene asignaciones entre cómo se expresa en estos diferentes sistemas», explicó Polikoff. «Puede involucrar la solución de gobernanza en tiempo real cuando necesite comunicarse entre esos sistemas».

Este enfoque reduce los costos, el tiempo y el esfuerzo para la integración de datos al «evitar la necesidad de escribir programas especiales para aprovechar lo que se hace en el mundo de la gobernanza», observó Hodgson. Más importante aún, al utilizar un sistema de restricciones y la capacidad de inferencias inteligentes, las organizaciones se benefician de «la capacidad de generar nuevos conocimientos», señaló Hodgson. El ejemplo más convincente es el cumplimiento normativo, en el que las inferencias lógicas sobre el acceso a los datos para una fuente de datos, una regulación o un grupo de usuarios pueden afectar a otra fuente, una regulación o un grupo de usuarios para automatizar las medidas de cumplimiento.

Recomendado:  I + D de mercado habilitado para Big Data, incluidos los principales actores clave IBM, HP, Dell, SAP - UNLV The Rebel Yell

Estadísticas de metadatos

Las inferencias sobre metadatos en modelos de datos pueden simplificar las taxonomías para los motores de contenido de la industria de los medios y el entretenimiento, por ejemplo, en fuentes globales y locales para obtener resultados casi en tiempo real. Las técnicas de computación cognitiva pueden automatizar rápidamente la entrada de metadatos; de lo contrario, «las descripciones de metadatos y sus palabras clave serían manuales», confirmó Jennifer Krizanek, CMO de Contentserv. En otros ejemplos, la visibilidad detallada de los metadatos puede presagiar eventos o proporcionar una hoja de ruta infalible de los anteriores para garantizar elementos básicos del linaje y la calidad de los datos. La conexión de metadatos con lo que el director ejecutivo de Datafold, Gleb Mezhanskiy, denominó un «gráfico de metadatos» ofrece los siguientes beneficios a escala empresarial:

  • Linaje de datos y BI: La trazabilidad proporcionada por los metadatos es imprescindible para comprender y confiar en la información de la analítica. En este caso de uso, «si hay un tablero de BI que alguien mira, puede revelar quién lo mira y de dónde provienen esos datos», mencionó Mezhanskiy.
  • Análisis de raíz de la causa: Cualquier valor atípico o aberración en los procesos relacionados con la analítica se ilustra fácilmente analizando los metadatos. “Si alguien ve una anomalía o algo que parece un error en un tablero, porque hay un gráfico que muestra cómo llegaron los datos, es fácil hacer un análisis de la causa raíz”, sostuvo Mezhanskiy.
  • Análisis de impacto: Al examinar los metadatos sobre cada faceta de SQL que se utiliza para generar información sobre tablas, columnas y filas de datos, «si alguien les hace un cambio, puedes saber exactamente qué va a pasar porque puedes verlo en el gráfico», señaló Mezhanskiy. .

La capacidad de operacionalizar metadatos (particularmente en entornos de gráficos) amplía la utilidad de esta faceta de gobernanza de datos para incluir todo, desde datos de referencia hasta vocabularios controlados. La acumulación de metadatos es fundamental para generar nuevos conocimientos a partir de ellos, como la propagación automática de reglas de datos de referencia en los sistemas financieros o para la gestión de registros en los sistemas de salud. Tanto el aprendizaje automático como el razonamiento basado en reglas pueden crear la información resultante. “Este es el otro aspecto de los metadatos activos: no solo lo que existe, sino lo que se puede generar o inferir a partir de lo que se declara explícitamente”, comentó Polikoff.

Recomendado:  Por qué Big Data Analytics para la sostenibilidad impulsará cambios transformadores en el sector industrial

Activación de la administración de datos

El empoderamiento de los administradores de datos es otra repercusión directa de cambiar la gobernanza de datos de los empleos pasivos a los activos. Las innovaciones modernas en torno al acceso controlado a los datos que se centran en los administradores de datos son fundamentales para acelerar el tiempo necesario para usar los datos y, al mismo tiempo, se ajustan invariablemente a los estándares de gobernanza sobre qué usuarios ven qué datos. Los mecanismos de gobierno de datos compartidos emiten «aprobación automática y reglas de gobierno centralizadas de provisión en infraestructura como Snowflake», reveló el CEO de Privacera, Balaji Ganesan. «El propietario de los datos de ventas, por ejemplo, puede decir que esta es la parte de los datos a la que le daré acceso a John Doe».

Automatizar la distribución de políticas de gobernanza centralizada en fuentes descentralizadas elimina el cuello de botella de TI para el acceso a los datos, facilita el uso compartido de datos poco latentes y coloca a los administradores de datos, que son los que mejor conocen los datos, a la vanguardia de la delegación de los datos a los que se accede. Reemplaza “la fricción en un proceso que solía llevar semanas”, recordó Ganesan, con uno fluido que requiere minutos para compartir datos controlados a un ritmo equitativo al de las operaciones. Este método se basa en la administración activa de datos, en la que los administradores «facilitan datos y recuperan el acceso si lo necesitan de forma automática, pero al mismo tiempo le demuestran a una persona de cumplimiento la pista de auditoría completa de quién está usando los datos y para qué». Indicó Ganesan.

Calidad de los datos

La calidad de los datos (así como los aspectos relacionados con la validación y la confiabilidad de los datos) es el sustrato del que depende cualquier forma de gobierno de datos, particularmente en entornos operativos. “No se pueden realizar procesos de automatización o aumento si, para empezar, sus datos no son saludables o de alta calidad”, propuso Krizanek. La integración de elementos básicos de la gobernanza de datos, como la gestión activa de metadatos, en los sistemas operativos que generan metadatos en tiempo real, requiere medidas de validación de datos para garantizar que “sea sensato y se adhiera a las mejores prácticas”, estipuló Polikoff. Existen varios medios para facilitar la calidad de los datos en los niveles en los que son confiables tanto para las operaciones como para la toma de decisiones convencional.

Algunos involucran lo que Krizanek describió como «motores de reglas comerciales tradicionales, flujos de trabajo, cosas que pueden automatizar ese proceso y usted tiene un tablero que le dirá que ahora va a esta persona, luego esta persona necesita revisar y agregar esta pieza antes de que salga». la puerta.» También hay un movimiento creciente en torno a lo que Mezhanskiy describió como «ingeniería de confiabilidad de datos como una práctica para lograr una mejor calidad y confiabilidad de los datos». Esta práctica se basa en evaluar rigurosamente los metadatos para que “los datos correctos representen la realidad”, denotó Mezhanskiy. Por último, las soluciones de gestión de datos maestros tienen transformaciones para «varios controles de calidad de datos para validarlos y normalizarlos», dijo Krizanek.

Recomendado:  ¿Qué es el modelado de datos? Tipos, Técnicas y Ejemplos

Aprendizaje automático

Otra forma en que la gobernanza de datos está ampliando su esfera para involucrar actividades más cercanas a las operaciones es anexando gradualmente diferentes facetas de la IA. El uso de inferencias inteligentes es el ejemplo más eminente; La gobernanza también abarca varios aspectos del aprendizaje automático. Las características que informan la capacidad de aprendizaje de los modelos de análisis cognitivo pueden tratarse como metadatos. Los almacenes de características dedicados para la ingeniería de características están cada vez más influenciados por los pilares de la gobernanza de la gestión de metadatos, el linaje de datos y más para obtener una serie de beneficios.

Según Polikoff, “Una de las tendencias es incluir la gestión del modelo de aprendizaje automático y la gestión de funciones en la solución de gobierno de datos. El gobierno de datos se expande para administrar el modelo de aprendizaje automático y los procesos de aprendizaje automático aprovechan la solución de gobierno de datos porque es importante que los modelos sean precisos, administrarlos y comprender la interrelación de esos modelos y dónde se están aplicando. . «

Por el contrario, el aprendizaje automático se utiliza regularmente para implementar diferentes facetas de la gobernanza de datos recomendando acciones relacionadas con él. Krizanek articuló un caso de uso en el que dichas recomendaciones se utilizan «para mejorar la calidad de sus datos o los flujos de trabajo de los que forman parte».

Mejor que nunca

La concepción de metadatos activos es solo un aspecto de la metamorfosis general de la gobernanza de datos desde los preceptos inmutables y históricos sobre cómo se utilizan los datos hasta los medios mismos de usarlos en entornos que influyen directamente en la producción. Las organizaciones pueden beneficiarse de esta tendencia confiando efectivamente en el modelado de datos operativos, la gestión de metadatos operativos y la administración de datos operativos. Este enfoque depende de la calidad de los datos, expande la gobernanza a la ciencia de los datos y es una progresión que solo le corresponde a la organización que la utiliza.

Sobre el Autor

Jelani Harper es una consultora editorial que presta servicios al mercado de la tecnología de la información. Se especializa en aplicaciones basadas en datos centradas en tecnologías semánticas, gobernanza de datos y análisis.

Suscríbase al boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1