Saltar al contenido

Qué pueden hacer las empresas para maximizar el impacto

7 de abril de 2023

Clément Stenac, Director de Tecnología, Datos.

getty

Tres meses después del lanzamiento de ChatGPT, OpenAI acaba de revelar la tercera actualización de la exitosa plataforma de IA: GPT-4. El rápido ritmo de cambio presenta a las organizaciones un desafío abrumador: quieren avanzar más rápido que su competencia e incorporar la última herramienta de IA, pero deben hacerlo de manera responsable, lo cual es muy importante cuando se implementa una tecnología que puede cambiar el mundo como la IA.

Escuché en conversaciones con docenas de líderes empresariales que están lidiando con una pregunta crítica para el negocio: ¿Cómo se puede integrar mejor GPT-4 y otras tecnologías emergentes comparables?

OpenAI afirma que GPT-4 es su «sistema más avanzado, que produce respuestas más seguras y útiles», lo que permite a los usuarios analizar imágenes e imitar el habla, diseñado para servir como el motor subyacente que impulsa los chatbots y otros sistemas. La compañía también anunció que el chatbot Bing AI de Microsoft ya había estado usando el nuevo software desde su lanzamiento en febrero.

Entonces, ¿qué pueden hacer las empresas para aprovechar GPT-4 y sus sucesores? Tres esfuerzos principales pagarán dividendos, independientemente de la funcionalidad específica de cualquier modelo:

Comprender la tecnología subyacente

La implementación efectiva de IA generativa comienza por comprender primero cómo funciona, sus capacidades y sus limitaciones. En el caso de los modelos de lenguaje extenso (LLM) utilizados en ChatGPT, su característica definitoria es su capacidad para producir contenido de texto a la par de lo que podría crear un ser humano. Sus limitaciones han sido ampliamente documentadas e incluyen la falta de explicabilidad (un LLM no puede citar sus fuentes) y una propensión a la inexactitud, las cuales limitarán sus aplicaciones empresariales. Esta generación de LLM también se ha capacitado en datos desconocidos y ampliamente genéricos, lo que significa que generalmente carecen de la experiencia en el dominio que es necesaria para una aplicación empresarial, como establecer una estrategia de precios en el mercado de la atención médica o mejorar la productividad de un banco. Y siempre existe un riesgo saludable de producir contenido inapropiado, que hemos visto en varios ejemplos de alto perfil en los medios y en línea.

Recomendado:  AI podría descifrar lagunas en textos griegos antiguos, dicen investigadores | Idioma

Preparándose para la gobernanza

Críticamente, ahora es el momento para que las empresas creen e implementen el gobierno de IA: una colección de prácticas y procesos para garantizar que una organización logre el equilibrio adecuado entre aprovechar rápidamente estas nuevas tecnologías mientras se enfoca en las necesidades comerciales y minimiza el riesgo. Las empresas pueden evaluar las aplicaciones comerciales útiles, como eliminar los gastos generales de TI o acelerar el análisis de datos, de acuerdo con su beneficio potencial para el negocio, los recursos necesarios para desarrollarlas y los riesgos asociados.

El riesgo es el elemento esencial de este análisis. Si bien las empresas de tecnología como Grammarly han creado negocios sólidos con la tecnología LLM, implementar estas tecnologías en una variedad de empresas antiguas y nuevas es una frontera completamente nueva. Cada organización deberá decidir por sí misma cuánto riesgo está dispuesta a asumir para obtener beneficios potenciales y liderazgo en el mercado.

Preparación de la infraestructura a escala

La mayoría no aprecia que los modelos LLM más poderosos sean realmente masivos. Los modelos que llamaron la atención recientemente (GPT-3 y el GPT-4 recientemente lanzado) son más grandes que los modelos tradicionales de aprendizaje automático y pueden continuar creciendo exponencialmente. Son prohibitivamente costosos de desarrollar y ejecutar para todas las empresas tecnológicas, excepto para las más grandes, y, en el caso de los modelos OpenAI, son de código cerrado y están disponibles solo a través de una API paga como un «modelo como servicio». Como muchos de los que construyeron su negocio en Facebook u otras plataformas han aprendido por las malas, construir capacidades comerciales centrales sobre una API pone a una organización a merced del propietario de la API y, por lo tanto, es un riesgo notable para una organización.

Recomendado:  Versátil robot-perro corre por la arena de la playa a 3 metros por segundo

Dado que la mayoría de las organizaciones no tienen los recursos para desarrollar estos modelos por sí mismas, y si acceder a un modelo de pago por uso de código cerrado representa demasiado riesgo, para muchas empresas, tendrá sentido trabajar con un modelo más pequeño y abierto. fuente modelo de lenguaje grande, como BERT, Flan, GPT-J u otras bibliotecas proporcionadas por empresas como Hugging Face. Mediante el «ajuste fino» (es decir, la adaptación) de estos modelos en datos internos específicos, las empresas podrían lograr un valor comercial impresionante, incluso si la plataforma no puede producir sonetos premiados al mismo tiempo. Algunas ventajas clave podrían incluir:

1. Salida que es más específica y relevante para la organización. Estos modelos son particularmente poderosos en lo que se denomina «aprendizaje de pocos disparos», lo que significa que el modelo solo necesita algunos ejemplos etiquetados para aprender un dominio.

2. Más control sobre la moderación para evitar salidas desagradables o inapropiadas, al tiempo que mejora la relevancia de la respuesta para el negocio.

3. Todos los datos permanecen dentro del firewall de la organización, lo que ayuda a cumplir con los requisitos de confidencialidad y residencia de datos.

4. Costos controlados para ejecutar el modelo, ya que la organización elimina la exposición a los cambios en los precios de API de un proveedor con fines de lucro.

Tal modelo no tendría las capacidades amplias de un modelo de lenguaje grande de uso general como GPT-4, pero muchas de esas capacidades son irrelevantes para las aplicaciones empresariales específicas. Por ejemplo, la mayoría de las mesas de servicio no necesitan emular la voz de Hemingway u ofrecer consejos sobre vacaciones en México; solo necesitan un resumen rápido de una transcripción más larga. Y si bien la configuración inicial del modelo requiere competencias especializadas, estos modelos luego se pueden implementar en toda la organización, sirviendo a casi todas las líneas de negocios. Poner en marcha la infraestructura para permitir dicha reutilización es una condición previa inteligente para la inversión inicial de establecer un modelo de este tipo.

Recomendado:  Hacia un modelo de aprendizaje automático que pueda razonar sobre las acciones cotidianas | Noticias del MIT

Las empresas tienen muchas opciones de infraestructura, desde modelos de código abierto que se ejecutan internamente hasta el uso exclusivo de modelos como servicio y todo lo demás. Los enfoques inteligentes permitirán que las organizaciones adapten la estrategia adecuada para sí mismas, dejando espacio para ajustarse ágilmente a medida que surjan nuevas tecnologías y cambien las condiciones del mercado.

Muchas empresas están salivando ante el poder de ChatGPT y están buscando una forma de catapultarlas al liderazgo del mercado. Desarrollar entendimiento, establecer gobernanza y preparar una infraestructura inteligente será esencial para capitalizar esta promesa embriagadora.

El lanzamiento de GPT-4 es un hito en la historia de la IA, pero para que tenga un impacto real en la empresa, las organizaciones deben prepararse para poder aprovechar al máximo sus impresionantes capacidades.


El Consejo de Tecnología de Forbes es una comunidad a la que solo se puede acceder por invitación para CIO, CTO y ejecutivos de tecnología de clase mundial. ¿Califico?