Hasta hace poco, la sabiduría convencional era que, si bien la IA era mejor que los humanos en las tareas de toma de decisiones basadas en datos, seguía siendo inferior a los humanos en las tareas cognitivas y creativas. Pero en los últimos dos años, la IA basada en lenguaje ha avanzado a pasos agigantados, cambiando las nociones comunes de lo que esta tecnología puede hacer.
Los avances más visibles han sido en lo que se llama «procesamiento del lenguaje natural» (NLP), la rama de la IA centrada en cómo las computadoras pueden procesar el lenguaje como lo hacen los humanos. Se ha utilizado para escribir un artículo para The Guardian, y las publicaciones de blog creadas por IA se han vuelto virales, hazañas que no eran posibles hace unos años. AI incluso se destaca en tareas cognitivas como la programación, donde puede generar programas para videojuegos simples a partir de instrucciones humanas.
Sin embargo, si bien estos trucos pueden llamar la atención, ¿son realmente indicativos de lo que esta tecnología puede hacer por las empresas?
Qué puede hacer la PNL
La herramienta de procesamiento de lenguaje natural más conocida es GPT-3, de OpenAI, que utiliza inteligencia artificial y estadísticas para predecir la siguiente palabra en una oración en función de las palabras anteriores. Los practicantes de PNL llaman a herramientas como «modelos de lenguaje» y pueden usarse para tareas de análisis simples, como clasificar documentos y analizar el sentimiento en bloques de texto, así como tareas más avanzadas, como responder preguntas y resumir informes. Los modelos de lenguaje ya están remodelando el análisis de texto tradicional, pero GPT-3 fue un modelo de lenguaje especialmente fundamental porque, al ser 10 veces más grande que cualquier modelo anterior en el momento del lanzamiento, fue el primero modelo de lenguaje grande, lo que le permitió realizar tareas aún más avanzadas, como programar y resolver problemas matemáticos de nivel secundario. La última versión, llamada InstructGPT, ha sido perfeccionada por humanos para generar respuestas que están mucho mejor alineadas con los valores humanos y las intenciones del usuario, y el último modelo de Google muestra avances impresionantes en el lenguaje y el razonamiento.
Para las empresas, las tres áreas en las que GPT-3 parece más prometedoras son la escritura, la codificación y el razonamiento específico de la disciplina. OpenAI, el creador de GPT-3 financiado por Microsoft, ha desarrollado un modelo de lenguaje basado en GPT-3 destinado a actuar como asistente para los programadores mediante la generación de código a partir de la entrada de lenguaje natural. Esta herramienta, Codex, ya está impulsando productos como Copilot para la subsidiaria de Microsoft, GitHub, y es capaz de crear un videojuego básico simplemente escribiendo instrucciones. Ya se esperaba que esta capacidad transformadora cambiara la naturaleza de cómo los programadores hacen su trabajo, pero los modelos continúan mejorando: el último del laboratorio DeepMind AI de Google, por ejemplo, demuestra el pensamiento crítico y las habilidades lógicas necesarias para superar a la mayoría de los humanos en competencias de programación.
Los modelos como GPT-3 se consideran modelos básicos, un área emergente de investigación de IA, que también funcionan para otros tipos de datos, como imágenes y videos. Los modelos básicos incluso se pueden entrenar en múltiples formas de datos al mismo tiempo, como DALL·E 2 de OpenAI, que se entrena en lenguaje e imágenes para generar representaciones de alta resolución de escenas u objetos imaginarios simplemente a partir de indicaciones de texto. Debido a su potencial para transformar la naturaleza del trabajo cognitivo, los economistas esperan que los modelos básicos puedan afectar cada parte de la economía y podrían conducir a aumentos en el crecimiento económico similares a la revolución industrial.
Un asistente de investigación de IA basado en lenguaje
En mi propio trabajo, he estado analizando cómo las herramientas basadas en GPT-3 pueden ayudar a los investigadores en el proceso de investigación. Actualmente estoy trabajando con Ought, una empresa de San Francisco que desarrolla una herramienta de razonamiento abierta (llamada Elicit) que tiene como objetivo ayudar a los investigadores a responder preguntas en minutos u horas en lugar de semanas o meses. Elicit está diseñado para un número creciente de tareas específicas relevantes para la investigación, como resúmenes, etiquetado de datos, reformulación, lluvia de ideas y revisiones de literatura.
Descubrí, como era de esperar, que Elicit funciona mejor para algunas tareas que para otras. Las tareas como el etiquetado y el resumen de datos aún son difíciles, con resultados ruidosos y precisión irregular, pero la investigación de Ought y la investigación de OpenAI son prometedoras para el futuro.
Por ejemplo, la tarea de reformulación es útil para escribir, pero la falta de integración con las aplicaciones de procesamiento de textos la hace poco práctica por ahora. Las tareas de lluvia de ideas son excelentes para generar ideas o identificar temas pasados por alto y, a pesar de los resultados ruidosos y las barreras para la adopción, actualmente son valiosas para una variedad de situaciones. Sin embargo, de todas las tareas que ofrece Elicit, considero que la revisión de la literatura es la más útil. Debido a que Elicit es un asistente de investigación de IA, este es su pan y mantequilla, y cuando necesito comenzar a profundizar en un nuevo tema de investigación, se ha convertido en mi recurso de referencia.
Todo esto está cambiando mi forma de trabajar. Paso mucho menos tiempo tratando de encontrar contenido existente relevante para mis preguntas de investigación porque sus resultados son más aplicables que otras interfaces más tradicionales para la búsqueda académica como Google Scholar. También estoy empezando a integrar tareas de lluvia de ideas en mi trabajo, y mi experiencia con estas herramientas ha inspirado mi última investigación, que busca utilizar modelos básicos para respaldar la planificación estratégica.
¿Cómo pueden prepararse las organizaciones para el futuro?
Identifique sus activos de datos de texto y determine cómo se pueden aprovechar las últimas técnicas para agregar valor a su empresa.
Sin duda, es consciente del valor de los datos, pero aún puede estar pasando por alto algunos activos de datos esenciales si no está utilizando análisis de texto y NLP en toda su organización. Los datos de texto son ciertamente valiosos para la gestión de la experiencia del cliente y la comprensión de la voz del cliente, pero piense en otros activos de datos de texto en su organización: correos electrónicos, informes de analistas, contratos, comunicados de prensa, archivos; incluso se pueden transcribir reuniones y llamadas telefónicas.
Hay tantos datos de texto y no necesita modelos avanzados como GPT-3 para extraer su valor. Hugging Face, una startup de NLP, lanzó recientemente AutoNLP, una nueva herramienta que automatiza modelos de entrenamiento para tareas de análisis de texto estándar simplemente cargando sus datos en la plataforma. Los datos todavía necesitan etiquetas, pero muchas menos que en otras aplicaciones. Debido a que muchas empresas han hecho apuestas ambiciosas en la IA solo para luchar por generar valor en el negocio principal, manténgase cauteloso para no ser demasiado entusiasta. Este puede ser un buen primer paso que sus ingenieros de aprendizaje automático existentes, o incluso científicos de datos talentosos, pueden administrar.
Para dar el siguiente paso, nuevamente, identifique sus activos de datos. Muchos sectores, e incluso divisiones dentro de su organización, utilizan vocabularios altamente especializados. A través de una combinación de sus activos de datos y conjuntos de datos abiertos, entrene un modelo para las necesidades de sectores o divisiones específicos. Piense en las finanzas. No quieres un modelo especializado en finanzas. Desea un modelo personalizado para la banca comercial o para los mercados de capitales. Y los datos son fundamentales, pero ahora son datos sin etiquetar, y cuantos más, mejor. Los modelos especializados como este pueden desbloquear un valor incalculable para su empresa.
Comprenda cómo puede aprovechar las tecnologías de lenguaje basadas en IA para tomar mejores decisiones o reorganizar su mano de obra calificada.
La IA basada en el lenguaje no reemplazará los trabajos, pero automatizará muchas tareas, incluso para quienes toman las decisiones. Startups como Verneek están creando herramientas similares a Elicit para permitir que todos tomen decisiones basadas en datos. Estas nuevas herramientas trascenderán la inteligencia comercial tradicional y transformarán la naturaleza de muchos roles en las organizaciones: los programadores son solo el comienzo.
Debe comenzar a comprender cómo se pueden utilizar estas tecnologías para reorganizar su mano de obra calificada. La próxima generación de herramientas como Codex de OpenAI conducirá a programadores más productivos, lo que probablemente signifique menos programadores dedicados y más empleados con habilidades de programación modestas que los usarán para una cantidad cada vez mayor de tareas más complejas. Puede que esto no sea cierto para todos los desarrolladores de software, pero tiene implicaciones significativas para tareas como el procesamiento de datos y el desarrollo web.
Comience a incorporar nuevas herramientas de IA basadas en lenguaje para una variedad de tareas para comprender mejor sus capacidades.
En este momento, herramientas como Elicit apenas están surgiendo, pero ya pueden ser útiles de formas sorprendentes. De hecho, la sugerencia anterior se inspiró en una de las tareas de lluvia de ideas de Elicit condicionada a mis otras tres sugerencias. La sugerencia original en sí no era perfecta, pero me recordó algunos temas críticos que había pasado por alto y revisé el artículo en consecuencia. En las organizaciones, tareas como esta pueden ayudar a los ejercicios de pensamiento estratégico o planificación de escenarios. Aunque existe un tremendo potencial para tales aplicaciones, en este momento los resultados aún son relativamente crudos, pero ya pueden agregar valor en su estado actual.
La conclusión es que debe fomentar la adopción generalizada de herramientas de IA basadas en idiomas en toda su empresa. Es difícil anticipar cómo se pueden usar estas herramientas en diferentes niveles de su organización, pero la mejor manera de comprender esta tecnología puede ser que usted y otros líderes de su empresa la adopten. No apueste el bote porque es posible que parte de la tecnología no funcione, pero si su equipo obtiene una mejor comprensión de lo que es posible, entonces estará por delante de la competencia. Recuerde que si bien es posible que la IA actual no esté preparada para reemplazar a los gerentes, los gerentes que entienden la IA están preparados para reemplazar a los gerentes que no la conocen.
No subestimes el potencial transformador de la IA.
Los grandes modelos de base como GPT-3 exhiben habilidades para generalizar a una gran cantidad de tareas sin ningún entrenamiento específico de tareas. El progreso reciente en esta tecnología es un paso significativo hacia la generalización a nivel humano y la inteligencia artificial general, que son los objetivos finales de muchos investigadores de IA, incluidos los de OpenAI y DeepMind de Google. Dichos sistemas tienen un tremendo potencial disruptivo que podría conducir a un crecimiento económico explosivo impulsado por la IA, que transformaría radicalmente los negocios y la sociedad. Si bien aún puede ser escéptico de la IA radicalmente transformadora como la inteligencia artificial general, es prudente que los líderes de las organizaciones estén al tanto de los primeros signos de progreso debido a su tremendo potencial disruptivo.
Considere que el exjefe de Google, Eric Schmidt, espera una inteligencia artificial general en 10 a 20 años y que el Reino Unido recientemente tomó una posición oficial sobre los riesgos de la inteligencia artificial general. Si las organizaciones hubieran prestado atención a la advertencia de Anthony Fauci de 2017 sobre la importancia de la preparación para una pandemia, es posible que se hubieran evitado los efectos más graves de la pandemia y la consiguiente crisis de la cadena de suministro. Ignorar el potencial transformador de la IA también conlleva riesgos y, de manera similar a la crisis de la cadena de suministro, la inacción de las empresas o el uso irresponsable de la IA podría tener efectos generalizados y dañinos en la sociedad (p. ej., aumento de la desigualdad o riesgos específicos de dominio derivados de la automatización). Sin embargo, a diferencia de la crisis de la cadena de suministro, los cambios sociales de la IA transformadora probablemente serán irreversibles e incluso podrían continuar acelerándose. Las organizaciones deben comenzar a prepararse ahora no solo para capitalizar la IA transformadora, sino también para hacer su parte para evitar futuros indeseables y garantizar que la IA avanzada se utilice para beneficiar equitativamente a la sociedad.
Las herramientas de inteligencia artificial basadas en el lenguaje están aquí para quedarse
Las poderosas herramientas de inteligencia artificial generalizables basadas en el lenguaje como Elicit están aquí, y son solo la punta del iceberg; Las herramientas multimodales basadas en modelos básicos están preparadas para transformar el negocio de maneras que aún son difíciles de predecir. Para comenzar a prepararse ahora, comience a comprender sus activos de datos de texto y la variedad de tareas cognitivas involucradas en diferentes roles en su organización. Adoptar agresivamente nuevas tecnologías de IA basadas en lenguaje; algunos funcionarán bien y otros no, pero sus empleados se adaptarán más rápido cuando pase al siguiente. Y no olvide adoptar estas tecnologías usted mismo: esta es la mejor manera de comenzar a comprender sus funciones futuras en su organización.