Informatica presentó Claire GPT, una integración entre el motor de inteligencia aumentada del proveedor y las capacidades de IA generativa que permitirá a los clientes de Informatica administrar sus datos utilizando lenguaje natural.
Informatica es un proveedor de gestión de datos cuya plataforma es Intelligent Data Management Cloud (IDMC). Mientras tanto, Claire se desarrolló en 2017 y es el motor de inteligencia artificial y aprendizaje automático integrado en las herramientas de administración de datos individuales que conforman el IDMC para unificar metadatos y automatizar la administración de metadatos.
Ahora, a través de sus asociaciones con OpenAI y Microsoft, que comenzaron a invertir en OpenAI en 2019, Informatica está aumentando Claire con IA generativa en un intento de hacer que la gestión de datos empresariales esté disponible para una gama más amplia de usuarios con el procesamiento de lenguaje natural habilitado por la gran capacidad de OpenAI. modelos de lenguaje
Claire GPT, presentada el 9 de mayo, está programada para su disponibilidad general durante la segunda mitad de 2023 y se presentó junto con una serie de otras funciones nuevas durante Informatica World, la conferencia de usuarios del proveedor en Las Vegas esta semana.
Informática e IA generativa
Históricamente, la administración de datos empresariales ha requerido que los ingenieros de datos escriban código para construir canalizaciones de datos e integrar los datos de su organización. Informatica lanzó recientemente una herramienta de integración de datos sin código diseñada para permitir que los usuarios comerciales sin conocimientos técnicos desarrollen sus propias canalizaciones de datos.
Pero incluso la miríada de herramientas sin código desarrolladas por los proveedores de análisis y gestión de datos en los últimos años para permitir cierto nivel de uso de autoservicio requería cierto nivel de alfabetización de datos. Los comandos y las consultas, como mínimo, debían formularse de una manera muy específica para que las herramientas de lenguaje natural los entendieran.
Sin embargo, los modelos de idiomas grandes (LLM) cuentan con bibliotecas de idiomas mucho más grandes que las herramientas tradicionales de NLP y pueden permitir un lenguaje de forma más libre.
Como resultado, numerosos proveedores de análisis han desarrollado integraciones con OpenAI desde el lanzamiento de ChatGPT en noviembre, incluidos ThoughtSpot y Tableau. Entre los proveedores de gestión de datos, Databricks desarrolló su propio LLM.
Ahora, Informatica se une a la refriega en un movimiento destinado a mejorar sus capacidades existentes de IA y ML, incluida la automatización inteligente.
Claire ha estado aprendiendo del uso de big data desde sus inicios, ya que impulsa la gestión de datos a escala, señaló Stewart Bond, analista de IDC. Pero agregar IA generativa tiene el potencial de aumentar su inteligencia al permitirle aprender de más que solo expertos en datos capacitados, lo cual es significativo.
«En medio del nombre de Claire está AI», señaló. «Claire ha estado aprendiendo de los metadatos y aumentando y ayudando el trabajo de los ingenieros de datos, los administradores de datos y los analistas de datos desde hace algún tiempo. Agregar GPT es dar un paso más allá, ampliando sus capacidades generativas».
Pero aún está por verse si las herramientas generativas infundidas con IA que están desarrollando los proveedores de análisis y gestión de datos realmente cumplen su promesa, continuó Bond.
Al igual que con la versión de Informatica, todavía no hay ninguna disponible en general, y cada proveedor ha dicho que será a fines de 2023 antes de que sus capacidades de IA generativa se lancen al público.
«Informatica, junto con otros proveedores en el espacio de integración e inteligencia de datos, ha estado ondeando la bandera de ‘automatización inteligente’ durante algún tiempo y llamándolo todo IA», dijo Bond. «Uno de los beneficios del fenómeno ChatGPT es que las organizaciones ahora comenzarán a evaluar las capacidades de ‘IA’ de estos productos. Es decir, buscarán IA real y no solo automatización basada en reglas».
mantenerse seguro
Si bien la IA generativa tiene el potencial de permitir que más personas trabajen con datos, ChatGPT y otros LLM han planteado preocupaciones de seguridad.
ChatGPT sufrió una violación de datos reciente. Como resultado, Italia y China son dos países que han prohibido su uso (desde entonces, Italia levantó su prohibición), mientras que otros están considerando medidas similares hasta que se sepa más sobre la tecnología. Además, la imprecisión de algunas de las respuestas que generan los LLM es una preocupación para muchos usuarios y potenciales usuarios.
Informatica tiene como objetivo abordar esas preocupaciones al limitar a Claire GPT a la tarea restringida de la gestión de datos, según Jitesh Ghai, director de productos de Informatica.
«En muchos sentidos, se siente como los primeros días de Internet», dijo. «Hay mucho potencial, pero hay muchas preocupaciones relacionadas con la gobernanza y muchas preocupaciones relacionadas con la propiedad intelectual. Estamos simplificando eso tomando modelos de lenguaje grandes y enfocándonos en el problema singular y difícil de la gestión de datos para empresas datos.»
Uno de los beneficios clave de Claire GPT es que simplifica la gestión de datos incluso para los ingenieros de datos capacitados que generalmente tienen la tarea de desarrollar la supervisión de las canalizaciones de datos de su organización. Ghai continuó.
La herramienta proporciona una interfaz basada en avisos para la gestión de datos en la que un usuario puede solicitar que se le conecte a una aplicación como Salesforce. Luego, los usuarios pueden decirle a la herramienta que extraiga ciertos tipos de datos y los agregue de una manera particular, por ejemplo, datos de clientes mensualmente, aplique medidas de control y calidad de datos, y luego cárguelos en un almacén de datos como Snowflake. .
Eso se puede hacer en cuestión de oraciones.
Sin embargo, en el pasado, eso habría requerido que un ingeniero de datos con una herramienta de ingestión de datos se conectara a Salesforce y lo cargara en Snowflake. Luego habría sido necesario otro ingeniero de datos con una herramienta de extracción, carga y transformación para seleccionar los datos en Snowflake. Y, por último, se habría necesitado un tercer experto en datos para garantizar la calidad de los datos.
«Ahora, una persona, con tres oraciones, puede transmitir lo que le gustaría que se hiciera con respecto a la gestión de datos, y luego Claire lo hace», dijo Ghai.
Capacidades adicionales
Más allá de Claire GPT, otras características nuevas presentadas por Informatica incluyen las siguientes:
- IDMC para ESG Sustainability, una versión específica de la industria de IDMC que incluye capacidades preconstruidas y conjuntos de datos relacionados con el medioambiente, la sociedad y la gobernanza y tiene como objetivo ayudar a las organizaciones a cumplir con las regulaciones de ESG y respaldar las iniciativas de ESG.
- Cloud Data Integration para PowerCenter, un servicio diseñado para ayudar a los usuarios de PowerCenter, la plataforma de virtualización de datos de Informatica, a migrar más rápida y fácilmente sus datos locales a IDMC.
- Nueva colaboración con Microsoft para proporcionar a los clientes de Azure las capacidades de Informatica de una forma más nativa.
- Los lanzamientos nativos de Intelligent Master Data Management SaaS de Informatica en Google Cloud e IDMC en Google Cloud en Europa.
- Una relación mejorada con AWS que incluye esfuerzos de comercialización y capacidades de transformación acelerada de la nube para clientes conjuntos.
- Y una asociación ampliada con la empresa de consultoría y tecnología ZS que integrará IDMC en la plataforma Zaidyn de ZS creada para las ciencias de la vida.
Bond señaló que el esfuerzo por hacer que la migración a la nube sea más rápida y sencilla aborda una necesidad persistente.
«Estas nuevas ofertas están acelerando las migraciones de PowerCenter a la nube de Informatica, que era el mayor desafío para los clientes existentes de PowerCenter», dijo.
Además, Bond destacó la importancia de ayudar a las empresas en sus esfuerzos relacionados con ESG al permitirles capturar y limpiar datos que pueden usarse para informes de ESG, así como usar sus datos para estimar su propio impacto ambiental y administrar las emisiones.
Sin embargo, el poder de entrenar grandes modelos de IA puede tener un impacto ambiental, por lo que, al mismo tiempo que Informatica intenta ayudar a los clientes a ser más conscientes del medio ambiente, también permite potencialmente a sus usuarios crear más daño ambiental, señaló.
«Se ve bien en Informatica para ayudar a los clientes a abordar [ESG] problemas», dijo Bond. «Lo que es un poco irónico es que Informatica está aumentando su uso de IA cuando también sabemos que la potencia requerida para entrenar grandes modelos de IA puede tener un impacto ambiental significativo. Como mínimo, podríamos plantear la hipótesis de que Informatica está introduciendo nuevas capacidades ESG para compensar el mayor uso de energía para la IA».
que hay por delante
A medida que Informatica traza su hoja de ruta, permanece enfocada en la tarea de simplificar la gestión de datos incluso cuando la cantidad de datos que las organizaciones ingresan aumenta y los datos que recopilan se vuelven más complejos, según Ghai.
Para el proveedor, eso significa continuar invirtiendo en IA.
«Existe una enorme oportunidad para que nuestros clientes impulsen su transformación digital impulsada por IA», dijo Ghai. «Ya no se trata solo de la transformación digital. Ahora, se trata de la transformación digital impulsada por la IA. Eso significa permitir que nuestros clientes aprovechen la nube, los datos confiables y la IA confiable».
Mientras tanto, Bond señaló que Informatica es uno de los últimos proveedores de integración e inteligencia de datos que quedan. Otros proveedores independientes se han diversificado y ahora ofrecen capacidades adicionales o han sido adquiridos.
Por ejemplo, Qlik está adquiriendo Talend, mientras que Alteryx adquirió Trifacta para agregar capacidades de gestión de datos.
El balance de Informatica parece saludable, como lo demuestran las ganancias recientes del primer trimestre de 2023 que incluyeron un crecimiento anual recurrente de los ingresos del 20 % durante los primeros tres meses de 2022. Pero en el futuro, es posible que el proveedor deba ampliar su cartera.
«Hay [vendors] que se centran solo en la integración de datos y solo en la ingeniería de datos”, dijo Bond. “Pero los competidores más cercanos de Informatica que tienen ambos conjuntos de capacidades también tienen carteras de software más amplias. Ha habido consolidación en el mercado. Será interesante ver cómo responde Informatica».
Eric Avidon es redactor sénior de noticias para TechTarget Editorial y periodista con más de 25 años de experiencia. Cubre el análisis y la gestión de datos.