Los modelos de lenguaje extenso (LLM) han estado en el centro de atención recientemente después de OpenAI, la compañía detrás de chatGPT logró democratizar el acceso a un chatbot de IA avanzado para los consumidores a través de su ChatGPT lanzado recientemente que parece proporcionar una respuesta asombrosamente humana a las indicaciones. Solo tomó 2 meses para llegar a 100 millones de usuarios en enero de 2023, el lanzamiento más rápido de todos los tiempos. En comparación, las tarjetas SIM de prepago tardaron 2 años en alcanzar los 100 millones de usuarios desde su lanzamiento en 1996. Es un testimonio de los efectos de escala de las herramientas digitales gracias a una mejora en la conectividad global. Los modelos de lenguaje grande han sido posibles gracias al entrenamiento de modelos como GPT-3 y GPT-4 en una cantidad masiva de datos de texto, facilitado a través de iniciativas de datos abiertos en todo el mundo.
Los datos abiertos se refieren a los datos a los que cualquiera puede acceder, usar y compartir. Los gobiernos, las empresas y las personas pueden utilizar los datos abiertos para generar beneficios sociales, económicos y ambientales. Los datos deben ser legibles por máquina y de alta calidad (llamados conjuntos de datos de alto valor HVD).
DATOS ABIERTOS GLOBALMENTE
A nivel mundial, la coordinación requerida para lograr la administración de datos abiertos está aumentando, con los gobiernos trabajando entre sí y con el sector privado para compartir datos y desarrollar un marco estándar de datos abiertos. Los bienes públicos digitales se basan en datos abiertos y software de código abierto. El Secretario General de las Naciones Unidas lanzó una Alianza de Bienes Públicos Digitales en 2019 que tiene como objetivo acelerar los ODS (Objetivos de Desarrollo Sostenible) a través de esta plataforma de colaboración de múltiples partes interesadas. A nivel mundial, los estados reconocen cada vez más el valor de las iniciativas de datos abiertos. La tendencia hacia los datos abiertos se refleja en la adopción de políticas e iniciativas por parte de más del 90% de los países encuestados en el Barómetro de Datos Abiertos (ODB). ODB es una evaluación basada en encuestas de las políticas de datos abiertos del gobierno realizada por la fundación World Wide Web. Además, existe un enfoque creciente en conjuntos de datos de alto valor (HVD), como datos de transporte, servicios públicos, movilidad y salud, que podrían actuar como una capa de datos de nivel inferior sobre la cual se pueden construir soluciones digitales. La UE ha adoptado un mercado único de datos mediante el lanzamiento de un portal oficial sobre datos abiertos que se basa en iniciativas de datos abiertos preexistentes de la UE. En los EE. UU., la NASA ha declarado 2023 como un año de ciencia abierta para celebrar el éxito y promover la Ciencia Abierta, estrechamente vinculada a la adopción de datos abiertos para la colaboración entre la comunidad científica.
RETOS
Sin embargo, existen varios desafíos por delante para la adopción de datos abiertos antes de que India pueda adoptar y defender por completo una estrategia de datos abiertos. Uno de los desafíos más apremiantes es la limitada alfabetización digital y la capacidad técnica del personal. Muchos funcionarios gubernamentales y tomadores de decisiones en la India a nivel rural y distrital carecen de las habilidades y el conocimiento para usar e interpretar de manera efectiva los datos abiertos, lo que limita el impacto de las iniciativas de datos abiertos. Además, la absorción de datos abiertos es baja, particularmente para las MIPYME, lo que significa que menos empresas pueden aprovechar los datos abiertos para obtener una ventaja competitiva.
Otro desafío es la preocupación por la privacidad y la seguridad de los datos. India tiene leyes y regulaciones existentes que deben cumplirse para garantizar la privacidad y seguridad de los datos. Cualquier iniciativa de datos abiertos debe tener en cuenta estas preocupaciones y garantizar que se tomen las medidas adecuadas para proteger la privacidad y la seguridad de los datos.
Para superar estos desafíos, el gobierno indio debe adoptar un enfoque multifacético. Primero, debería invertir en programas de alfabetización digital para funcionarios gubernamentales y tomadores de decisiones para aumentar su capacidad técnica. También debe crear programas de concientización para educar al público sobre los beneficios de los datos abiertos y cómo usarlos de manera efectiva. Las MIPYME deben ser un objetivo especial debido al aumento de la ventaja competitiva que esto puede generar, y los consumidores indios ganarán a través de una competencia más sólida de los pequeños actores de la industria.
LA RESPUESTA DE LA INDIA A LAS PREOCUPACIONES SOBRE LA PRIVACIDAD DE DATOS
Debe haber un acto de equilibrio entre la protección de los datos privados con la necesidad de facilitar el flujo de datos. En un informe publicado recientemente en marzo de 2023 titulado Seismic Shift, se mencionó que el gobierno retiró los requisitos anteriores estipulados en el Proyecto de Ley de Protección de Datos Personales de 2019, como el almacenamiento y la localización de datos, y que planea una revisión del proyecto de ley para reducir el cumplimiento. para las empresas tecnológicas. La integración de disposiciones de datos abiertos en el nuevo proyecto de ley sería una adición muy oportuna. El mismo informe también se refiere al borrador del nuevo Proyecto de Ley de Protección de Datos Personales Digitales de 2022 que establece disposiciones para el posible flujo libre de datos a geografías confiables, según lo evaluado por el gobierno de India. El flujo de datos es un tema muy complejo y la intervención oportuna puede tener un efecto dominó en la economía digital de la India. Además, el gobierno debe implementar herramientas e instrumentos legales innovadores para garantizar que India no termine convirtiéndose en un proveedor exclusivo de datos de consumidores.
DATOS ABIERTOS EN LA INDIA
India ha lanzado iniciativas como la Plataforma Nacional de Datos y Análisis, cuyo objetivo es democratizar el acceso a los datos del gobierno público y hacer que los conjuntos de datos sean más accesibles e interoperables, abordando uno de los principales desafíos para la adopción de datos abiertos. India también está emergiendo como líder en el sector geoespacial, utilizando drones para escanear el terreno y generar mapas detallados, y planea lanzar una importante iniciativa de datos que compartirá conjuntos de datos anónimos recopilados bajo el Marco Nacional de Gobernanza de Datos con el ecosistema de IA y la investigación y comunidades de start-ups. Estos esfuerzos se alinean con los objetivos de la iniciativa Digital India, que busca crear una sociedad empoderada digitalmente y una economía del conocimiento habilitada por la tecnología.
Adoptar una estrategia de datos abiertos será un desafío importante para el gobierno indio en 2023, pero es un paso necesario para aumentar la transparencia y la rendición de cuentas. Al superar estos desafíos, India puede desbloquear todo el potencial de los datos abiertos y aprovecharlos y dar forma a la estrategia de gobernanza de los datos abiertos a nivel mundial como un jugador clave en el juego.
Rahul Jha es un experto en tecnología y políticas públicas con sede en la Universidad de Ginebra, Suiza. Rajesh Mehta es un destacado consultor y columnista que trabaja en Entrada al mercado, Innovación y Asuntos internacionales.