No hace mucho tiempo, las tecnologías semánticas se consideraban una rama tabú, casi esotérica, de la gestión de datos de la que pocas personas hablaban o admitían abiertamente que las usaban.
Hoy en día, con la creciente popularidad de los gráficos de conocimiento (ubicuos en soluciones que abarcan todo, desde la preparación de datos hasta el análisis) y el creciente ascenso de la Inteligencia Artificial neurosimbólica (que combina la base de conocimiento de la IA con su base estadística), las tecnologías semánticas se buscan activamente para un diversos casos de uso en todas las industrias.
La más convincente, y adecuada para estas capacidades, involucra casi cualquier forma de tecnologías de lenguaje natural para implementaciones tan variadas como la implementación de flujos de trabajo con automatización de procesamiento cognitivo para aplicaciones de IA conversacional.
Según el CTO de expert.ai, Marco Varone, “Están sucediendo muchas cosas en el espacio de comprensión semántica del lenguaje. Han pasado muchas más cosas en los últimos tres, cuatro años que en los 10 o 15 anteriores. En los últimos años el cambio ha sido de experimentos en semántica y lenguaje a proyectos reales”.
Lo más significativo de estos proyectos es que con frecuencia implican la simplificación de múltiples aspectos de la IA relacionados con todo lo relacionado con el procesamiento del lenguaje natural. Además, al utilizar el enfoque de inferencia semántica que es fundamental para las implementaciones simbólicas de IA, las organizaciones están creando un efecto que es tan profundo como innegable.
Lo que están haciendo es hacer que la IA sea más humana, explicable y confiable en los entornos de producción, lo que impulsa esta serie fundamental de tecnologías a la siguiente fase de su evolución y su utilidad empresarial.
“Para muchos, la idea es que la próxima tecnología será tan inteligente que podrá aprender y de alguna manera administrarse a sí misma”, reflexionó Varone. “Esto no es posible y las empresas finalmente han entendido que necesitan humanos en el circuito”.
Human-in-the-Loop
El precepto de human-in-the-loop es uno de los medios por los cuales la IA empresarial se está volviendo más humana a través de enfoques semánticos. Las personas son fundamentales para las reglas comerciales que forman la base del razonamiento de la máquina en el núcleo del método de IA simbólica que sustentan las tecnologías semánticas.
Además, los humanos son indispensables para los enfoques de IA que involucran únicamente la base de conocimiento de la IA, aquellos que involucran su base conexionista ejemplificada por el aprendizaje automático, así como aquellos que se basan en entrelazar estos dos para aplicaciones de IA neurosimbólica. “Human-in-the-loop dará forma a muchas cosas el próximo año porque significa que debe organizar sus procesos de manera que los humanos siempre puedan agregar la parte final del valor que solo los humanos pueden hacer”, explicó Varone.
Expertos humanos, razonamiento automático
Hay dos formas principales en que los humanos son directamente responsables del valor subyacente del razonamiento simbólico para los casos de uso de la tecnología del lenguaje natural. El primero involucra a expertos en la materia que “enriquecen el gráfico de conocimiento, que es una súper tendencia para trabajar”, reveló Varone. Los gráficos de conocimiento se pueden compilar para cualquier número de dominios, incluidos reglamentos, asuntos legales o productos; la experiencia humana es fundamental para poblar estas aplicaciones con el conocimiento curado más relevante. Con ese fin, la segunda forma en que los humanos fortalecen los despliegues de inferencia semántica es ensamblando vocabularios, taxonomías, tesauros y reglas sobre las que estos sistemas inteligentes razonan para aplicaciones como el análisis de texto.
“Necesitas tener a tu persona experta que pueda poner el conocimiento, que pueda usar la capacidad de abstracción de la persona humana que realmente pueda decidir cuáles son las cosas importantes y cuáles son las cosas que son solo ruido”, mencionó Varone. Las aplicaciones de análisis de texto son fundamentales para superar la brecha de datos no estructurados en numerosas áreas, incluida la comprensión de las fuerzas del mercado en finanzas o comercio minorista, la investigación de nuevas soluciones en farmacia y atención médica, y el fortalecimiento de la seguridad para varias agencias de inteligencia. “Con la navegación del conocimiento de análisis de texto, tiene una gran cantidad de información recopilada internamente, externamente y una combinación de los dos, y desea extraer información para ayudar a sus trabajadores del conocimiento”, especificó Varone.
Humanizando el aprendizaje automático
La experiencia humana que es central para crear las herramientas mencionadas anteriormente (gráficos de conocimiento, reglas, taxonomías y glosarios) para explotar la base de conocimiento semántico de AI para tecnologías de lenguaje natural es igualmente aplicable a implementaciones de AI estadística. En particular, los humanos han llegado a desempeñar un papel vital en todo, desde la creación de modelos avanzados de aprendizaje automático hasta la eficacia de sus actuaciones en curso. Las principales formas en que la experiencia en la materia puede afectar positivamente estas técnicas conexionistas incluyen:
- Datos de entrenamiento: Los científicos de datos y los modeladores predictivos deben consultar con frecuencia a expertos en la materia al refinar modelos con datos de entrenamiento adicionales. “Incluso para brindar más datos para entrenar sus modelos, necesita una persona que diga que esta es una fuente de información valiosa y disponible, así que úsela, o esto no es bueno debido a todo este ruido”, señaló Varone. La intimidad del conocimiento perteneciente a sus dominios que tienen los expertos, que puede pasar desapercibido para los científicos de datos, es fundamental para entregar los mejores datos de capacitación.
- Parcialidad: Detectar, rectificar y eliminar el sesgo del modelo es fundamental para mantener los modelos con estándares de IA responsables. “Los modelos estadísticos pueden aprender sesgos muy rápidamente”, admitió Varone. “Pueden aprender cosas equivocadas y, si no tienes un experto, puede llevar mucho tiempo detectarlas. Si tiene un experto en el circuito, puede detectar de inmediato cuando algo está mal o no es relevante”.
- Exactitud: En última instancia, el empleo de expertos para validar los resultados de los modelos avanzados de aprendizaje automático aumenta inherentemente su precisión al monitorear eventos como la desviación del modelo, por ejemplo. “Los expertos deben ser parte de cualquier proceso de conocimiento del idioma”, planteó Varone. “Porque entonces puede estar seguro de que lo que está obteniendo es de la mejor calidad y… al final obtendrá mejores resultados y gastará menos recursos”.
IA compuesta dirigida por humanos
La forma óptima de conservar recursos, aumentar la eficiencia y perfeccionar el resultado de la IA con técnicas semánticas es combinar el aprendizaje automático y el razonamiento simbólico con lo que Varone caracterizó como un «enfoque híbrido». Tal hibridación es parte de la noción de IA compuesta que introdujo Gartner, en la que las organizaciones invocan una plétora de metodologías de IA para generar estos resultados ideales. Existen numerosas formas de utilizar las capacidades de razonamiento y aprendizaje de la IA para mejorar los procesos de comprensión del lenguaje por parte de las máquinas. Etiquetar los datos de entrenamiento para implementaciones de aprendizaje supervisado es uno de los principales inhibidores de este enfoque. Varone citó un ejemplo en el que, para este propósito, las empresas pueden consultar a un experto que dice «sí, debe [annotate data], pero tardará 30 días en hacerlo”.
Sin embargo, al emplear a ese experto en la materia para diseñar reglas comerciales para anotar los datos de capacitación necesarios, «podemos hacerlo en tres días», concluyó Varone, lo que agiliza el tiempo de creación de valor. También hay instancias en las que las organizaciones pueden utilizar métodos de aprendizaje automático para refinar o completar la base de conocimientos sobre la cual crear reglas simbólicas de IA. Los métodos de aprendizaje supervisado generalmente se incluyen en estos esfuerzos, aunque Varone insinuó la eficacia de «crear o enriquecer un gráfico de conocimiento en un modo no supervisado». Independientemente del enfoque que se utilice, la participación humana es crucial para tener éxito con estas oportunidades de IA para procesar el lenguaje, aunque la confianza en los enfoques conexionistas y basados en reglas puede no ser igual. “La razón por la que ves cada vez más interés en el enfoque híbrido es porque mezclar lo simbólico es súper eficiente en términos de recursos; es mil veces más eficiente”, observó Varone.
Gestión de IA con semántica
Las tecnologías y los principios semánticos son algunas de las formas más efectivas de supervisar los casos de uso empresarial de IA para tecnologías de lenguaje natural. Estas capacidades han sido formadas por el conocimiento curado por humanos, razón por la cual la noción de humano en el circuito es tan prominente en la época contemporánea.
Al extender este concepto a los enfoques estadísticos de IA o aquellos que involucran una combinación de capacidades de aprendizaje y razonamiento de IA, las empresas pueden acelerar sus implementaciones, mejorarlas y hacer que se ajusten aún más a los estándares humanos por los cuales se juzga en última instancia su valor subyacente. . “Human-in-the-loop finalmente es entendido por todos que se necesitarán personas en el futuro”, resumió Varone. “No se puede prescindir de la gente. Necesitas darle a la gente las mejores herramientas, sí. Pero, la gente debe estar al tanto”.
Los sistemas subyacentes que la gente supervisa no pueden evitar beneficiarse de este desarrollo, como de hecho lo son.
Sobre el Autor
Jelani Harper es una consultora editorial que presta servicios al mercado de la tecnología de la información. Se especializa en aplicaciones basadas en datos centradas en tecnologías semánticas, gobierno de datos y análisis.
Regístrese para recibir el boletín gratuito insideBIGDATA.
Únase a nosotros en Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1