Saltar al contenido

El futuro del procesamiento del lenguaje natural es brillante

23 de diciembre de 2021

El procesamiento del lenguaje natural (PNL) denota el uso de inteligencia artificial (IA) para manipular el lenguaje escrito o hablado. Al igual que el aire que respiramos, la PNL es tan omnipresente hoy que apenas lo notamos. Cuando usa Alexa, está conversando con una máquina de PNL; cuando escribe en su chatbot o realiza una búsqueda, la tecnología de PNL pasa a primer plano. Cuando usa algoritmos de aprendizaje automático (ML) para extraer datos de documentos, usa NLP una vez más. De manera similar, cuando usa Zoom o Google Meet, es la PNL la que transcribe su discurso. La lista es prácticamente interminable.

La PNL en sí es un término general que se refiere a un montón de tecnologías relacionadas. La PNL es el núcleo del análisis de sentimientos, la extracción de texto, la traducción automática, la inteligencia artificial conversacional, la inteligencia artificial de documentos, el resumen de texto … y la lista es única. A medida que los sistemas de IA se vuelven cada vez más inteligentes, estos sistemas deberían interactuar con los humanos de una manera rica y consciente del contexto. Es la PNL lo que haría posible que las máquinas comprendan el contexto en el que operan. Por ejemplo, cuando un usuario dice «banco» en el contexto de una institución financiera, los motores de PNL pueden diferenciarlo de la «orilla» de un río, etc. Este mayor nivel de inteligencia es un requisito principal para que los humanos conversen con las máquinas sin problemas.

Los impulsores tecnológicos del éxito de la PNL

Tradicionalmente, la PNL ha sido un problema complejo de resolver. Sin embargo, dos avances significativos, uno en 2017 y otro en 2019, trajeron mejoras sustanciales a la PNL. En 2017, una nueva forma de modelo de aprendizaje profundo llamada Transformador hizo posible paralelizar el entrenamiento de ML de manera más eficiente, lo que resultó en precisiones enormemente mejoradas.

En 2019, Google presentó Representaciones de codificador bidireccional de Transformers (BERT), que mejora la arquitectura de Transformer anterior. Inmediatamente BERT ayudó a lograr Rendimiento de vanguardia en varias tareas de PNL, como comprensión de lectura, extracción de texto, análisis de sentimientos, etc. Estos dos avances significaron que la PNL podría superar fácilmente a los humanos promedio en muchas tareas y, en algunos casos, incluso superar el rendimiento de la asignatura. expertos en la materia.

Recomendado:  Aprendizaje automático en la mesa de negociación

Lea también: El procesamiento del lenguaje natural hará que las aplicaciones de inteligencia empresarial sean más accesibles

Entonces, ¿qué tan grande es el mercado de la PNL?

El mercado de la PNL se encuentra en una etapa relativamente incipiente, pero se está expandiendo rápidamente. Según la firma de investigación, MarketsandMarkets, el mercado de PNL crecería a una tasa compuesta anual del 20,3% (de 11.600 millones en 2020 a 35.100 millones de dólares en 2026). La firma de investigación Statistica es aún más optimista. Según su artículo de octubre de 2021, la PNL se multiplicaría por 14 entre los años 2017 y 2025. Sin duda, este es un crecimiento fenomenal para una tecnología que estaba prácticamente confinada a los laboratorios incluso hace una década.

Una palabra de precaución

Incluso a medida que el mercado de la PNL crece y se generaliza, los profesionales deben tener cuidado al invertir en PNL. Lo primero y más importante es el entendimiento de que la PNL no es una tecnología única, sino un conjunto de tecnologías. En consecuencia, no todos los sistemas subyacentes tienen la misma curva de vencimiento. En principio, los profesionales deben valorar la PNL en dos dimensiones: una que mide los beneficios comerciales y dos, la propensión de la tecnología de PNL subyacente a convertirse en la corriente principal.

Según Gartner, se espera que las tecnologías como la inteligencia artificial conversacional, los chatbots y la inteligencia artificial de documentos brinden beneficios comerciales de altos a muy altos (transformadores), al tiempo que prometen convertirse en la corriente principal en menos de dos años. Compare esto con tecnologías como el resumen de texto que, según Gartner, probablemente traerá beneficios moderados y tardará entre 5 y 10 años en madurar. Por lo tanto, está claro que no todas las tecnologías de PNL subyacentes nacen iguales, y las inversiones requieren un escrutinio cuidadoso.

Recomendado:  Generación de datos sintéticos mediante una red generativa de adversarios (GAN) con PyTorch - Visual Studio Magazine

Otra consideración importante para los profesionales es la elección del lenguaje natural. La mayoría de los modelos son buenos en el idioma inglés, seguidos del chino, mientras que se desempeñan por debajo de la media en varios idiomas internacionales. De manera similar, estos modelos de lenguaje tienden a mostrar un sesgo cultural y regional, ya que muchos de ellos están capacitados en conjuntos de datos públicos que tienen una gran exposición al mundo occidental.

Por último, la adopción de la PNL varía ampliamente entre las industrias, donde la atención médica (descubrimiento de medicamentos, análisis de ensayos clínicos, EHR) se lleva la mayor parte del uso de la PNL, seguida de las industrias de papel pesado como los seguros y las hipotecas.

Lea también: El mejor software de automatización para la gestión de procesos de TI

El futuro de la PNL

La hoja de ruta de la PNL está marcada por dos trayectorias principales: la primera, impulsada por modelos de transformadores más grandes, como el GPT-3 y sus futuros primos. El segundo avance significativo será en los modelos de diálogo en los que Google, Facebook y otras empresas invierten millones de dólares en investigación y desarrollo. Primero, analicemos los modelos de transformadores.

GPT-3 fue desarrollado por Open AI, una empresa de investigación cofundada por Elon Musk y tiene varios nombres importantes como Sam Altman en su repertorio. GPT-3 es un sistema multitarea que puede hacer varias cosas, como traducir texto, extraer texto, conversar con un humano y, si estás aburrido, puede divertirte con sus poemas. Sin embargo, donde GPT-3 se ha vuelto inteligente (y prácticamente útil) es en el campo de la generación de código de software. Dadas las instrucciones básicas, GPT-3 puede desarrollar programas completos en Python, Java y varios otros lenguajes, allanando el camino para emocionantes oportunidades futuras. El futuro atrae a modelos de transformadores cada vez más grandes como el GPT-4 o la versión china llamada Wu Dao 2.0 (que es 10 veces mayor que la del GPT-3).

Recomendado:  Cómo usar la extracción de características en los datos tabulares para el aprendizaje de la máquina

La segunda gran tendencia en la PNL implica la investigación de Google y Facebook en torno a los modelos de diálogo y la inteligencia artificial conversacional. Google, por ejemplo, dio a conocer una demostración de un sistema de IA conversacional llamado LAMDA. El poder de LAMDA es que puede conectarse con humanos en una cantidad aparentemente interminable de temas, a diferencia de los chatbots modernos que están entrenados para conversaciones estrechas. Si tiene éxito, es muy probable que LAMDA interrumpa la mesa de ayuda, la atención al cliente y, como dice un blog de Google, marcará el comienzo de «categorías completamente nuevas de aplicaciones útiles».

Avances prometedores

Podemos argumentar que los desarrollos recientes en PNL lo hacen atractivo para las inversiones de profesionales y aficionados a la tecnología. El mercado de la PNL en sí está creciendo rápidamente con una mayor adopción en la atención médica, las finanzas y los seguros. La PNL es un conjunto de tecnologías, y los profesionales pueden hacer bien en discernir cuál de los sistemas subyacentes brindará el máximo beneficio comercial y para cuándo. El futuro de la PNL es muy prometedor, ya que más avances traerían una mejor experiencia de usuario, abriendo así mercados más nuevos.

Leer siguiente: Aprovechamiento de la IA conversacional para mejorar las operaciones de TI