Saltar al contenido

El papel inquebrantable del modelo conceptual de datos en el gobierno de datos

5 de agosto de 2022

En una era en la que el gobierno de datos se ha convertido casi en sinónimo de privacidad y protección de datos, existen numerosos aspectos de la gestión de datos que se consideran de manera muy diferente a como se consideraban tradicionalmente.

El modelado de datos, por ejemplo, se considera con frecuencia una dimensión de la ingeniería de datos o la ciencia de datos. Desde esta perspectiva, los modelos de datos se manipulan para integrar datos entre fuentes para que las organizaciones puedan cargar aplicaciones o herramientas de análisis con una gran cantidad de datos en sus diversos ecosistemas.

Sin embargo, los modelos de datos conceptuales, también denominados ontologías o modelos de áreas temáticas, siempre han permanecido firmemente arraigados en el ámbito de la gobernanza de datos. Estos modelos dan a los datos su significado para lograr los objetivos comerciales. De todas las formas de modelado de datos, los modelos conceptuales son probablemente los más importantes y la base para muchos otros (como los modelos de datos lógicos, los modelos de entidad-relación, etc.).

Según Aaron Colcord, director sénior de Gobernanza y Seguridad del Centro de Excelencia de Privacera, estos modelos conceptuales son «sobre cómo usted, como empresa, se ve a sí mismo». Posteriormente, estos modelos de datos fundamentales incluyen numerosos aspectos de las organizaciones, desde cómo se asignan según las unidades de negocio, hasta terminología, definiciones y taxonomías específicas que influyen en el significado de los datos para diferentes roles.

Estos conceptos son esenciales para gobernar con éxito los datos para que las organizaciones puedan beneficiarse de la reutilización de datos a largo plazo mientras limitan el riesgo.

Mapeo del negocio

Aunque existe un amplio espectro de ontologías o modelos de datos conceptuales (que van desde los básicos hasta los más complejos), al menos solidifican la forma en que se estructura una organización o unidad de negocio. Esa información es integral para asignar la propiedad de los datos y formar los rudimentos de lo que significan los datos de acuerdo con las definiciones organizacionales. Al implementar los conceptos comerciales que se atribuyen a este tipo de modelo de datos, los modeladores de datos deben incorporar los múltiples departamentos, funciones y responsabilidades de sus empresas. “La cuestión es que siempre encontrará que cada organización, los ejecutivos, saben cómo funciona su negocio y así es como se organizan sus datos”, comentó Colcord.

Recomendado:  La nube en constante expansión continúa asaltando el universo de TI

Introducir esa información en un modelo de área temática aclara estos hechos y se convierte en el medio por el cual las organizaciones definen los datos para numerosas aplicaciones posteriores, incluida la gestión de metadatos, la catalogación de datos y la calidad de los datos. Además, para asegurar los datos para preservar la privacidad de los datos y cumplir con las regulaciones, las empresas pueden confiar en los modelos de datos conceptuales para que puedan «saber ahora dónde los datos son, ve a llamarlos y descúbrelo qué son los datos”, comentó Colcord. Esa información se convierte en la base para enmascarar la PII, por ejemplo, para cumplir con las regulaciones para hacerlo.

Esquema

La próxima progresión en las ontologías de utilidad que proporcionan el gobierno de datos se relaciona con el tema del esquema, razón por la cual el modelado de datos se ha anexado de alguna manera al ámbito de la ingeniería de datos. Sin embargo, es importante darse cuenta de que, incluso en términos de esquema, las ontologías reflejan información de dominio sobre conceptos comerciales y su significado. Los modelos de datos conceptuales más exhaustivos y utilitarios involucran «una ontología o esquema de todos los objetos importantes en un dominio particular», observó el director ejecutivo de Franz, Jans Aasman. La cantidad de detalles que incluyen tales ontologías es enorme. Estos no solo involucran diferentes conceptos como tipos de productos y jerarquías de dichos productos, sino también información similar para los usuarios, sus roles e incluso las relaciones entre estos objetos comerciales y los usuarios.

La especificidad de tales ontologías las hace inherentemente únicas. “Para un banco, por supuesto, es completamente diferente que para un hospital o un inspector de aerolíneas como la FAA”, señaló Aasman. El valor de gobierno de datos de estas ontologías altamente detalladas es múltiple. Estandarizan las diversas construcciones requeridas para definir los datos de modo que las reglas de gobierno puedan ser consistentes y uniformemente seguidas. También proporcionan definiciones concretas para los datos en relación con esos objetos comerciales, lo que ayuda a solidificar el significado de los datos en los casos de uso, las unidades comerciales y las fuentes. “Antes de poder compartirlo, debe saber qué significan los datos”, dijo Aasman. Con ontologías que brindan ese significado, las organizaciones pueden agregar datos entre departamentos para obtener vistas de 360° de los clientes, por ejemplo, para obtener valor comercial mientras se ajustan a los mandatos de gobierno.

Recomendado:  ACM otorga a Raluca Ada Popa, presidenta y fundadora de Opaque Systems y UC Berkeley PhD, el premio Grace Murray Hopper 2021

Terminología

La uniformidad de significado a la que aludía Aasman es característica de las ontologías más avanzadas, que suelen incluir taxonomías. La relación entre las jerarquías de definiciones que ofrecen las taxonomías y el modelo de datos conceptual subyacente no siempre es clara. Es posible utilizar taxonomías sin ontologías (y viceversa), aunque las ontologías más sofisticadas invariablemente tienen algún componente para definir las palabras que describen los conceptos comerciales. Este componente de glosario que se presta fácilmente a modelos de datos conceptuales es «donde tienes el vocabulario, la terminología», reveló el CTO de expert.ai, Marco Varone.

La importancia de este elemento de los modelos de datos conceptuales es inestimable para fines de gobernanza. Al estipular exactamente qué términos relacionados con los datos significan para el negocio, se elimina toda ambigüedad para implementar la calidad de los datos y ciertas facetas de la gestión de metadatos. El significado de los datos en relación con los objetivos comerciales se aclara aún más mediante el apoyo de sinónimos que proporciona este aspecto lingüístico de los modelos de datos conceptuales. Varone caracterizó esta utilidad como «más un diccionario de sinónimos… la parte específica del idioma». La definición clara de las palabras y las definiciones que respaldan los conceptos comerciales reflejados en los datos es fundamental para el intercambio de datos bien gobernado entre dominios y aplicaciones. También ayuda con ciertas formas de Inteligencia Artificial, incluidas las técnicas de inferencia, el razonamiento simbólico y la “estructuración del conocimiento de la manera correcta”, indicó Varone.

Gobierno de datos 101

A pesar de las percepciones actuales que sugieren lo contrario, el modelado de datos sigue siendo una parte importante del gobierno de datos. Los modelos de datos conceptuales aclaran cómo se estructuran las organizaciones, los conceptos comerciales críticos para los cuales se utilizan los datos y qué significan específicamente los datos en relación con esos conceptos.

Recomendado:  Lo que los grandes datos han aportado a la discusión sobre la privacidad

Esa información afecta a casi todas las dimensiones del gobierno de datos, desde los métodos de control de acceso hasta la gestión del ciclo de vida y la catalogación de datos. Crear estos modelos de áreas temáticas, perfeccionarlos y fortalecer el gobierno de datos con ellos es fundamental para «tratar de saber qué son exactamente sus datos», resumió Colcord, lo cual es integral para formar las reglas apropiadas sobre las que se basa el gobierno de datos e implementarlas. .

Sobre el Autor

Jelani Harper es una consultora editorial que presta servicios al mercado de la tecnología de la información. Se especializa en aplicaciones basadas en datos centradas en tecnologías semánticas, gobierno de datos y análisis.

Regístrese para recibir el boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1