Saltar al contenido

¿Cómo admiten las bases de datos los algoritmos de IA?

24 de septiembre de 2021

los Transform Technology Summits comienza el 13 de octubre con Low-Code / Sin Code: Habilitación de la agilidad empresarial. ¡Regístrate ahora!


Las bases de datos siempre han podido realizar un trabajo administrativo simple, como encontrar registros particulares que coincidan con algunos criterios determinados, por ejemplo, todos los usuarios que tienen entre 20 y 30 años. Últimamente, las empresas de bases de datos han estado agregando rutinas de inteligencia artificial a las bases de datos para que los usuarios puedan explorar el poder de estos algoritmos más inteligentes y sofisticados en sus propios datos almacenados en la base de datos.

Los algoritmos de IA también están encontrando un hogar debajo de la superficie, donde las rutinas de IA ayudan a optimizar las tareas internas como la reindexación o la planificación de consultas. Estas nuevas funciones a menudo se facturan como una adición de automatización porque alivian al usuario del trabajo de limpieza. Se anima a los desarrolladores a que les dejen hacer su trabajo y se olviden de ellos.

Sin embargo, hay mucho más interés en las rutinas de IA que están abiertas a los usuarios. Estos algoritmos de aprendizaje automático pueden clasificar datos y tomar decisiones más inteligentes que evolucionan y se adaptan con el tiempo. Pueden desbloquear nuevos casos de uso y mejorar la flexibilidad de los algoritmos existentes.

En muchos casos, la integración es en gran medida pragmática y esencialmente cosmética. Los cálculos no son diferentes de los que se producirían si los datos se exportaran y enviaran a un programa de IA separado. Dentro de la base de datos, las rutinas de IA están separadas y simplemente aprovechan cualquier acceso interno a los datos. A veces, este acceso más rápido puede acelerar el proceso de manera espectacular. Cuando los datos son importantes, a veces el simple hecho de moverlos puede llevar una gran parte del tiempo.

La integración también puede limitar el análisis a los algoritmos que forman parte oficialmente de la base de datos. Si los usuarios quieren implementar un algoritmo diferente, deben volver al antiguo proceso de exportar los datos en el formato correcto e importarlos a la rutina de IA.

La integración puede aprovechar algunas de las bases de datos distribuidas en memoria más nuevas que distribuyen fácilmente la carga y el almacenamiento de datos en varias máquinas. Estos pueden manejar fácilmente una gran cantidad de datos. Si es necesario un análisis complejo, puede que no sea difícil aumentar la capacidad de la CPU y la RAM asignada a cada máquina.

Algunas bases de datos impulsadas por IA también pueden aprovechar los chips de GPU. Algunos algoritmos de IA utilizan la arquitectura altamente paralela de las GPU para entrenar modelos de aprendizaje automático y ejecutar otros algoritmos. También hay algunos chips personalizados especialmente diseñados para IA que pueden acelerar drásticamente el análisis.

Recomendado:  Hasura presenta uniones de GraphQL para construir una API de datos unificados para múltiples fuentes de GraphQL

Sin embargo, una de las mayores ventajas puede ser la interfaz estándar, que a menudo es SQL, un lenguaje que ya es familiar para muchos programadores. Muchos paquetes de software ya interactúan fácilmente con bases de datos SQL. Si alguien quiere más análisis de IA, no es más complejo que aprender las nuevas instrucciones SQL.

¿Qué están haciendo las empresas establecidas?

La inteligencia artificial es un campo muy competitivo ahora. Todas las principales empresas de bases de datos están explorando la integración de los algoritmos con sus herramientas. En muchos casos, las empresas ofrecen tantas opciones que es imposible resumirlas aquí.

Oracle ha integrado rutinas de inteligencia artificial en sus bases de datos de varias maneras, y la compañía ofrece un amplio conjunto de opciones en casi todos los rincones de su pila. En los niveles más bajos, algunos desarrolladores, por ejemplo, están ejecutando algoritmos de aprendizaje automático en el intérprete de Python que está integrado en la base de datos de Oracle. También hay opciones más integradas como Oracle’s Machine Learning for R, una versión que usa R para analizar los datos almacenados en las bases de datos de Oracle. Muchos de los servicios se incorporan en niveles superiores, por ejemplo, como funciones para el análisis en las herramientas de ciencia de datos o análisis.

IBM también tiene una serie de herramientas de inteligencia artificial que están integradas con sus diversas bases de datos, y la compañía a veces llama a Db2 «la base de datos de inteligencia artificial». En el nivel más bajo, la base de datos incluye funciones en su versión de SQL para abordar partes comunes de la construcción de modelos de IA, como la regresión lineal. Estos se pueden unir en procedimientos almacenados personalizados para capacitación. Muchas herramientas de IA de IBM, como Watson Studio, están diseñadas para conectarse directamente a la base de datos para acelerar la construcción del modelo.

Hadoop y su ecosistema de herramientas se utilizan comúnmente para analizar grandes conjuntos de datos. Si bien a menudo se los considera más tuberías de procesamiento de datos que bases de datos, a menudo hay una base de datos como HBase enterrada en su interior. Algunas personas usan el sistema de archivos distribuido de Hadoop para almacenar datos, a veces en formato CSV. Una variedad de herramientas de inteligencia artificial ya están integradas en la canalización de Hadoop utilizando herramientas como Submarine, lo que la convierte en una base de datos con inteligencia artificial integrada.

Recomendado:  Extracto del libro: IA del mundo real

Todas las principales empresas de la nube ofrecen bases de datos y productos de inteligencia artificial. La cantidad de integración entre cualquier base de datos en particular y cualquier IA en particular varía sustancialmente, pero a menudo es bastante fácil conectar los dos. Comprehend de Amazon, una herramienta para analizar texto en lenguaje natural, acepta datos de depósitos S3 y almacena las respuestas en muchas ubicaciones, incluidas algunas bases de datos de AWS. SageMaker de Amazon puede acceder a datos de buckets S3 o lagos de datos Redshift, a veces utilizando SQL a través de Amazon Athena. Si bien es una buena pregunta si estos cuentan como una verdadera integración, no hay duda de que simplifican el camino.

En la nube de Google, la herramienta AutoML para el aprendizaje automático automatizado puede obtener datos de las bases de datos de BigQuery. Firebase ML ofrece una serie de herramientas para abordar los desafíos comunes para los desarrolladores de dispositivos móviles, como la clasificación de imágenes. También implementará cualquier modelo entrenado de TensorFlow Lite para trabajar con sus datos.

Microsoft Azure también ofrece una colección de bases de datos y herramientas de inteligencia artificial. La herramienta Databricks, por ejemplo, se basa en la canalización de Apache Spark y viene con conexiones a Cosmos DB de Azure, su almacenamiento de Data Lake y otras bases de datos como Neo4j o Elasticsearch que pueden estar ejecutándose dentro de Azure. Su Azure Data Factory está diseñado para buscar datos en la nube, tanto en bases de datos como en almacenamiento genérico.

¿Qué están haciendo los advenedizos?

Varias nuevas empresas de bases de datos también destacan su apoyo directo al aprendizaje automático y otras rutinas de inteligencia artificial. SingleStore, por ejemplo, ofrece análisis rápidos para rastrear la telemetría entrante en tiempo real. Estos datos también se pueden calificar de acuerdo con varios modelos de IA a medida que se ingieren.

MindsDB agrega rutinas de aprendizaje automático a bases de datos estándar como MariaDB, PostgreSQL o Microsoft SQL. Extiende SQL para incluir características para aprender de los datos que ya están en la base de datos para hacer predicciones y clasificar objetos. Estas funciones también son fácilmente accesibles en más de una docena de aplicaciones de inteligencia empresarial, como Tableau de Salesforce o Power BI de Microsoft, que trabajan en estrecha colaboración con bases de datos SQL.

Muchas de las empresas entierran la base de datos en lo más profundo del producto y venden solo el servicio en sí. Riskified, por ejemplo, rastrea las transacciones financieras utilizando modelos de inteligencia artificial y ofrece protección a los comerciantes a través de «garantías de devolución de cargo». La herramienta ingiere transacciones y mantiene datos históricos, pero hay poca discusión sobre la capa de la base de datos.

Recomendado:  En lo profundo de las cuevas de datos de las grandes tecnologías de China

En muchos casos, las empresas que pueden facturarse a sí mismas como empresas de IA pura también son proveedores de bases de datos. Después de todo, los datos deben estar en algún lugar. H2O.ai, por ejemplo, es solo uno de los proveedores de inteligencia artificial en la nube que ofrece preparación de datos integrada y análisis de inteligencia artificial. Sin embargo, el almacenamiento de datos está más oculto, y muchas personas piensan en software como H2O.ai primero por su poder analítico. Aún así, puede almacenar y analizar los datos.

¿Hay algo que las bases de datos de IA integradas no puedan hacer?

Agregar rutinas de IA directamente al conjunto de características de una base de datos puede simplificar la vida de los desarrolladores y administradores de bases de datos. También puede hacer que el análisis sea un poco más rápido en algunos casos. Pero más allá de la conveniencia y la velocidad de trabajar con un conjunto de datos, esto no ofrece ninguna ventaja grande y continua sobre exportar los datos e importarlos en un programa separado.

El proceso puede limitar a los desarrolladores que pueden optar por explorar solo los algoritmos que se implementan directamente dentro de la base de datos. Si el algoritmo no forma parte de la base de datos, no es una opción.

Por supuesto, muchos problemas no se pueden resolver con el aprendizaje automático o la inteligencia artificial. La integración de los algoritmos de IA con la base de datos no cambia el poder de los algoritmos, simplemente los acelera.

VentureBeat

La misión de VentureBeat es ser una plaza urbana digital para que los responsables de la toma de decisiones técnicas obtengan conocimientos sobre tecnología transformadora y realicen transacciones. Nuestro sitio ofrece información esencial sobre tecnologías y estrategias de datos para guiarlo a medida que dirige sus organizaciones. Te invitamos a convertirte en miembro de nuestra comunidad, para acceder a:

  • información actualizada sobre los temas de su interés
  • nuestros boletines
  • contenido exclusivo de líderes de opinión y acceso con descuento a nuestros preciados eventos, como Transformar 2021: Aprende más
  • funciones de red y más

Hágase miembro