La destreza predictiva del aprendizaje automático es ampliamente aclamada como la cumbre de la inteligencia artificial estadística. Alardeado por su capacidad para mejorar todo, desde el servicio al cliente hasta las operaciones, sus numerosas redes neuronales, múltiples modelos e implementaciones de aprendizaje profundo se consideran una garantía empresarial para beneficiarse de los datos.
Pero de acuerdo con el CEO de Franz, Jans Aasman, hay un pequeño problema con esta alta estima que por lo demás es precisa: en su mayor parte, “solo funciona para lo que ellos llaman conjuntos de datos euclidianos donde puedes simplemente mirar la situación, extraer una serie de datos destacados puntos a partir de eso, conviértalo en un número en un vector, y luego habrá aprendizaje supervisado y aprendizaje no supervisado y todo eso «.
Por supuesto, una generosa porción de datos empresariales es Euclidiana y fácilmente vectorizada. Sin embargo, existe una gran cantidad de datos multidimensionales no euclidianos que sirven como catalizador para casos de uso asombrosos de aprendizaje automático, como:
- Pronóstico de la red: El análisis de todas las relaciones variables entre entidades o eventos en redes sociales complejas de amigos y enemigos arroja predicciones asombrosamente precisas sobre cómo cualquier evento (como un cliente específico que compra un determinado producto) influirá en los participantes de la red. Esta inteligencia puede renovar todo, desde enfoques de marketing y ventas hasta mandatos regulatorios (conozca a su cliente, lucha contra el lavado de dinero, etc.), tratamiento de atención médica, aplicación de la ley y más.
- Clasificación de la entidad: El potencial para clasificar entidades según eventos, como fallas de piezas o fallas del sistema para vehículos conectados, por ejemplo, es fundamental para el mantenimiento predictivo. Esta capacidad tiene connotaciones obvias para la gestión de flotas, el monitoreo de activos de equipos y otras aplicaciones de Internet de las cosas.
- Visión por computadora, procesamiento del lenguaje natural: Comprender la multidimensionalidad de las relaciones de las palabras entre sí o las imágenes en una escena transfigura las implementaciones típicas de redes neuronales para la PNL o la visión por computadora. Este último admite la generación de escenas en la que, en lugar de que las máquinas vean la escena de un automóvil que pasa por una boca de incendios con un perro durmiendo cerca, estas cosas se pueden describir para que la máquina genere esa imagen.
Cada uno de estos casos de uso gira en torno a datos de alta dimensionalidad con relaciones multifacéticas entre entidades o nodos a una escala notable en la que «falla el aprendizaje automático regular», señaló Aasman. Sin embargo, son ideales para redes neuronales de gráficos, que se especializan en estas y otras implementaciones de datos de alta dimensionalidad.
Datos de alta dimensionalidad
Las redes neuronales de gráficos logran estas hazañas porque los enfoques de gráficos se centran en discernir las relaciones entre los datos. Las relaciones en los conjuntos de datos euclidianos no son tan complicadas como las de los datos de alta dimensionalidad, ya que «todo en una línea recta o una superficie plana bidimensional se puede convertir en un vector», observó Aasman. Estos números o vectores forman la base para generar características para casos de uso típicos de aprendizaje automático.
Los ejemplos de conjuntos de datos no euclidianos incluyen cosas como las numerosas relaciones de más de 100 sistemas de aeronaves entre sí, vínculos entre un grupo de clientes a cuatro adicionales y la miríada de interdependencias de los vínculos entre esos grupos adicionales. Esta información no se vectoriza fácilmente y elude la capacidad del aprendizaje automático sin redes neuronales gráficas. “Cada número del vector dependería de otras partes del gráfico, por lo que es demasiado complicado”, comentó Aasman. «Una vez que las cosas se convierten en gráficos dispersos y tienes redes de cosas, redes de fármacos y genes, y moléculas de fármacos, se vuelve realmente difícil predecir si un fármaco en particular no tiene un vínculo con otra cosa».
Predicciones de relaciones
Cuando el contexto entre nodos, entidades o eventos es realmente importante (como en el caso de uso farmacéutico al que hace referencia Aasman o cualquier otra aplicación de red compleja), las redes neuronales de gráficos brindan precisión predictiva al comprender las relaciones de los datos. Esta cualidad se manifiesta de tres formas principales, que incluyen:
- Predicción de enlaces: Las redes neuronales gráficas son expertas en predecir enlaces entre nodos para comprender fácilmente si las entidades están relacionadas, cómo y qué efecto tendrá esa relación en los objetivos comerciales. Esta información es clave para responder preguntas como «¿ciertos eventos ocurren con más frecuencia para un paciente, para un avión o en un documento de texto? ¿Puedo realmente predecir el próximo evento?», Reveló Aasman.
- Entidades clasificadoras: Es sencillo clasificar entidades en función de los atributos. Las redes neuronales gráficas hacen esto considerando los vínculos entre entidades, lo que da como resultado nuevas clasificaciones que son difíciles de lograr sin gráficos. Esta aplicación implica aprendizaje supervisado; predecir relaciones implica un aprendizaje no supervisado.
- Clústeres de gráficos: Esta capacidad indica cuántos gráficos contiene un gráfico específico y cómo se relacionan entre sí. Esta información topológica se basa en el aprendizaje no supervisado.
La combinación de estas cualidades con modelos de datos con información temporal predominante (incluida la hora de los eventos, es decir, cuando los clientes realizaron compras) genera ejemplos convincentes de aprendizaje automático. Este enfoque puede ilustrar el futuro médico de un paciente en función de su pasado y todos los eventos relevantes que lo componen. “Puede decir, dado este paciente, que me dé la próxima enfermedad y la próxima posibilidad de que la contraiga en orden descendente”, comentó Aasman. Las organizaciones pueden hacer lo mismo con la pérdida de clientes, el incumplimiento de los préstamos, ciertos tipos de fraude u otros casos de uso.
Clasificación de texto topológico, comprensión de imágenes
Las redes neuronales gráficas brindan resultados transformacionales cuando su incomparable discernimiento de relaciones se concentra en aspectos de la PNL y la visión por computadora. Para el primero, admite la clasificación de texto topológico, que es fundamental para una comprensión más rápida y granular del lenguaje escrito. La extracción de entidades convencional puede identificar términos clave en el texto. «Pero en una oración, las cosas pueden referirse a una palabra anterior, a una palabra posterior», explicó Aasman. «La extracción de entidades no tiene en cuenta esto en absoluto, pero una red neuronal gráfica observará la estructura de la oración, luego puede hacer mucho más en términos de comprensión».
Este enfoque también sustenta la comprensión de las imágenes, en las que las redes neuronales de gráficos entienden la forma en que se relacionan las diferentes imágenes en una sola imagen. Sin ellos, el aprendizaje automático solo puede identificar varios objetos en una escena. Con ellos, puede deducir cómo esos objetos interactúan o se relacionan entre sí. «[Non-graph neural network] el aprendizaje automático no hace eso ”, especificó Aasman. «No cómo encajan todas las cosas en la escena». El acoplamiento de redes neuronales de gráficos con redes neuronales convencionales puede describir de manera rica las imágenes en escenas y, a la inversa, generar escenas detalladas a partir de descripciones.
Enfoques gráficos
Las redes neuronales gráficas se basan en las redes neuronales que se idearon inicialmente en el 20th siglo. Sin embargo, los enfoques gráficos permiten al primero superar los límites de la vectorización para operar en conjuntos de datos no euclidianos de alta dimensionalidad. Las técnicas gráficas específicas (y las técnicas adecuadas para las gráficas) que ayudan en este esfuerzo incluyen:
- Índice de Jaccard: Al intentar establecer si debe haber o no un vínculo que falta entre un conjunto de nodos u otro conjunto de nodos, por ejemplo, el índice de Jaccard puede informar esta decisión al revelar «hasta qué punto dos nodos son similares en un gráfico». Dijo Aasman.
- Adjunto preferencial: Este concepto estadístico es una «técnica que ellos llaman el ganador toma todo donde puedes predecir si alguien va a conseguir todo o tú no conseguirás nada», mencionó Aasman. El apego preferencial mide qué tan cerca están los nodos.
- Centralidad: La centralidad es un indicador de la importancia de los nodos en las redes, que se relaciona con cuáles están entre otros nodos.
Estos y otros enfoques de gráficos permiten que las redes neuronales de gráficos funcionen con datos de alta dimensionalidad sin vectorizarlos, lo que amplía la utilidad general de las aplicaciones empresariales de aprendizaje automático.
Escala de aprendizaje automático de polidimensionalidad
La distinción fundamental al aplicar redes neuronales de gráficos a los casos de uso anteriores y aplicar enfoques típicos de aprendizaje automático es la complejidad de las relaciones analizadas y la escala de esa complejidad. Aasman explicó un caso de uso en el que las redes neuronales de gráficos hicieron predicciones precisas sobre las acciones de los líderes mundiales en función de las entradas que abarcan la mayor parte de un año, más de 20.000 entidades y casi medio millón de eventos. Tal previsión está lejos de ser académica cuando se traslada al comportamiento del cliente, el tratamiento de la salud u otras implementaciones de misión crítica. En consecuencia, puede estar afectando las implementaciones de computación cognitiva antes de lo que las organizaciones se dan cuenta.
Sobre el Autor
Jelani Harper es una consultora editorial que presta servicios al mercado de la tecnología de la información. Se especializa en aplicaciones basadas en datos centradas en tecnologías semánticas, gobernanza de datos y análisis.
Suscríbase al boletín gratuito insideBIGDATA.
Únase a nosotros en Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1