IBM, Google y Microsoft están listos para lanzar motores semánticos (algoritmos que usan el significado de las palabras) para complementar sus motores de sintaxis actuales (usando la ortografía de palabras, como el motor de búsqueda BM25). Su objetivo común es extender sus capacidades de procesamiento del lenguaje natural (PNL) en motores que compiten con la semántica humana (nuestra comprensión de lo que significan el lenguaje, las palabras / oraciones). En línea con otros contendientes, incluidos Amazon, Intel y Oracle, estos motores semánticos ofrecen comprensión automática del significado con el objetivo de mejorar las búsquedas, la inteligencia artificial (IA), la interacción persona-computadora, la respuesta a preguntas y la generación automática de narrativas (a partir de descripciones / explicaciones a la prosa / poesía).
Los motores de solo sintaxis de hoy en día son ciegos al significado de las palabras clave utilizadas para determinar los resultados. Por ejemplo, un ser humano entiende que «donde nació Alan Turing» significa lo mismo que «el lugar de nacimiento de Alan Turing» y «la ciudad donde Alan Turing nació cuando era un bebé». Su sintaxis es diferente, con palabras clave únicas «dónde, nació»; «lugar de nacimiento»; y «ciudad, entregada», respectivamente. Sin embargo, el significado o la semántica de cada frase son idénticos («Londres» es la respuesta a las tres). La gente entiende esto de inmediato, pero las computadoras, no tanto.
En consecuencia, las tres empresas están desarrollando algoritmos que comprenden el significado de las palabras. Google y Microsoft están construyendo motores semánticos que agregan metadatos a oraciones (Google) o palabras (Microsoft) utilizando grupos de procesadores que ejecutan múltiples redes neuronales profundas (llamadas transformadores, que usan paralelización masiva).
IBM
Durante una década, IBM ha estado extendiendo la PNL a las inteligencias artificiales (IA), comenzando con Watson (2011), la IA que venció a los expertos humanos en el juego de televisión Jeopardy, y más recientemente con su Project Debater (2021). Durante esta década (2014), IBM también desarrolló su transformador Cognos, un algoritmo basado en metadatos para crear motores que denomina PowerCubes, que luego se puede utilizar con su software Business Intelligence. Pero para su motor semántico, IBM optó por aumentar las redes neuronales con una lógica simbólica que reduce la cantidad de ejemplos que necesita aprender. Los transformadores, descubrió al desarrollar Cognos, requieren conjuntos de ejemplos más grandes para aprender, según el analista principal de Forrester Research, Kjell Carlsson.
«La semántica de IBM utiliza una codificación de conocimiento mucho más eficiente, lo que permite construir casos de uso empresarial de alto rendimiento con ejemplos de capacitación significativamente más pequeños», dijo Carlsson. «La semántica de IBM también puede proporcionar explicabilidad de sus conclusiones en virtud del razonamiento lógico-simbólico, la gobernanza para impedir que el modelo utilice una lógica defectuosa, además de proporcionar equidad que evita que los modelos aprendan el razonamiento discriminatorio», dijo Carlsson.
Los transformadores, por otro lado, son todas redes neuronales, de extremo a extremo, sin significado inculcado por la lógica simbólica, lo que también permite explicaciones más fáciles de por qué una red neuronal llega a conclusiones específicas.
«El enfoque neuro-simbólico de IBM», dijo Carlsson, «permite una mayor precisión con menos datos de entrenamiento, además de que también permite a los ingenieros ‘enseñar’ un modelo de relaciones lógicas que los expertos en el dominio saben que son verdaderas, lo cual es mucho más eficiente que tener estos las relaciones se aprenden mediante transformadores «.
En palabras de Salim Roukos, miembro de IBM y líder global de investigación de idiomas de la empresa, así como director de tecnología de la unidad de tecnologías de traducción de la empresa, «los grandes modelos neuronales de extremo a extremo requieren cantidades significativas de datos para funcionar bien en un nuevo dominio. IBM se centra más en el análisis semántico del lenguaje humano para permitir a los desarrolladores crear aplicaciones de comprensión de texto. Al aprovechar la semántica del lenguaje humano, se necesitan cantidades muy pequeñas de datos del dominio de la aplicación para permitir la comprensión «.
Para popularizar los transformadores semánticos, Google y Microsoft han lanzado versiones de prueba gratuitas. Google se llama Experiencias semánticas, que aborda cuatro dominios de aplicación separados más una capacidad de rodar por su cuenta.
Las cuatro demostraciones gratuitas de Google incluyen «Verse-by-Verse», que proporciona una «experiencia» semántica al componer versos de poesía al estilo de poetas famosos a partir de los primeros versos compuestos por los usuarios; «Talk-to-Books», que responde consultas basadas en declaraciones que se encuentran en libros actuales; y «Semantris», un juego de asociación de palabras basado en el significado.
La herramienta de forma libre de Google «Crea tu propia experiencia semántica» permite a los desarrolladores realizar una clasificación de texto semántico, identificación de similitudes y agrupación de palabras clave con significados similares.
Microsoft
Microsoft tiene como objetivo lanzar el primer producto comercial de base semántica, que actualmente se puede probar de forma gratuita. El uso de la granularidad a nivel de palabra en la codificación de significados funciona mejor, según Luis Cabrera-Cordon de Microsoft, gerente de programas grupales de Azure. Por ejemplo, la palabra «Capital» se asocia con grupos de significados relacionados con estados, provincias y países; Crimen y castigo; Letras; y Finanzas, Ganancias, Inversiones, Dinero e Impuestos (vea la ilustración).
Cabrera-Cordon describe la «búsqueda semántica de Microsoft en Azure [as offering] la mejor combinación de relevancia de búsqueda, experiencia de desarrollador y capacidades de servicio en la nube «, en su blog.
Por ejemplo, su motor de búsqueda primero lanza una amplia red utilizando una búsqueda de sintaxis tradicional BM25 en palabras clave, pero luego hace coincidir la semántica de las palabras en cada resultado (su significado) con el significado de las palabras clave en la consulta. Cuanto más cercano sea el significado, más alto será el resultado en la lista presentada al usuario. Como resultado, una búsqueda de «capitales» estatales de EE. UU. Colocará los resultados con nombres de ciudades en la parte superior de los resultados devueltos, con resultados sobre ganancias de capital, pena capital y otros usos semánticos de la palabra clave cerca de la parte inferior de los resultados de búsqueda.
Los vicepresidentes de Microsoft, Rangan Majumder y Jianfeng Gao, los directores de investigación principales Nan Duan y Furu Wei et.al., en su artículo, dicen que el motor semántico de Microsoft «reduce significativamente el nivel de [barrier to] todo el mundo … ya no necesita un equipo de expertos en aprendizaje profundo para aprovechar esta tecnología «.
Carlsson de Forrester Research dijo: «Los mayores avances recientes en IA han sido en el aprendizaje (profundo), que ha abierto el mundo de los datos no estructurados (visión, texto, voz, registros, etc.) para el análisis a escala, pero lo que realmente Lo que queremos es tanto aprendizaje como conocimiento. El aprendizaje nos permite actualizar y adquirir nuevos conocimientos, y el conocimiento hace que el aprendizaje sea más eficiente, gobernable y valioso. Lo que hace que estos nuevos métodos semánticos infundidos en el aprendizaje profundo sean emocionantes es su potencial para ofrecer ambos, expandiendo drásticamente no solo PNL, pero todos los casos de uso de aprendizaje automático «.
R. Colin Johnson es un miembro del premio Kyoto que ha trabajado como periodista de tecnología durante dos décadas.
entradas no encontradas