Para aquellas empresas que se preguntan cómo aplicar de manera segura los modelos de lenguaje grande (LLM) como ChatGPT a sus propios almacenes de documentos y otra información textual, el proveedor de trabajo en equipo de contenido Box presenta hoy una posible respuesta. El anuncio de Box AI promete la capacidad de interrogar y resumir archivos individuales almacenados en Box y generar automáticamente contenido nuevo en Box Notes, utilizando la misma tecnología OpenAI que impulsa ChatGPT. La versión beta anunciada hoy es solo el comienzo de mucho más por venir, según Aaron Levie, CEO de Box, con quien hablé antes del lanzamiento. Él dice:
Este será un viaje de muchos años, solo estamos al principio, pero los casos de uso son alucinantes…
Ahora, por primera vez, podemos sintetizar nuestros datos no estructurados, nuestro contenido, de una manera que nunca antes había sido posible. Podemos hacer preguntas sobre un documento: «¿Cuál es una de las ideas más importantes de este archivo?» O, ‘Resumir este contenido’. Puede hacer una pregunta a un gran conjunto de datos y puede devolver una respuesta en un lenguaje natural.
Estamos increíblemente emocionados acerca de dónde está este potencial, y estamos viendo casos de uso innovadores que nunca hubiéramos imaginado antes. Es por eso que Box AI es un anuncio tan importante para nosotros.
La tecnología LLM es particularmente poderosa porque se puede aplicar sin tener que estar capacitado para un caso de uso específico. El explica:
El gran avance en estos grandes modelos de lenguaje es que la naturaleza horizontal de la IA hoy en día es mucho más amplia. El hecho de que en un solo modelo, puede tener casos de uso para las ciencias de la vida y los servicios financieros y los medios y el entretenimiento: cada industria puede verse afectada por la IA ahora con el mismo modelo. Eso significa que obtiene un aumento significativo en la eficiencia de la creación de software, aprovechando la IA, que no era posible antes, cuando tenía que tener modelos de IA muy específicos para cada caso de uso que tenía.
Como plataforma de contenido empresarial, Box es particularmente adecuado para aprovechar ese poder. Él continúa:
Lo que siempre hemos creído es que lo que hay dentro de ese contenido es conocimiento. Es valor comercial. La energía de la empresa está dentro de esos datos. Es su información financiera. Son sus activos de marketing. Son los lanzamientos de sus productos. Con AI, es la primera vez que puede desbloquear esa información. Creemos que nos beneficiaremos más que la gran mayoría del software, porque puede desbloquear ese conocimiento e inteligencia de sus datos por primera vez. Por eso estamos tan entusiasmados con esto.
IA responsable
Los clientes seleccionados inicialmente tendrán acceso beta privado a Box AI, antes de la disponibilidad general que se espera más adelante en el año. Si bien OpenAI es el socio de lanzamiento, el plan es abrir conexiones a otros modelos de IA en el futuro. Levie dice:
Todo nuestro enfoque es, ¿cómo conectamos el contenido de Box y lo conectamos básicamente con cualquier modelo de IA con el que los clientes quieran poder trabajar? En este momento, estamos lanzando con OpenAI, pero en el futuro puede imaginarnos trabajando con una variedad de proveedores diferentes.
A diferencia de ChatGPT y otros casos de uso basados en información disponible públicamente, la oferta de Box aplicará el modelo GTP3.5 o GPT4 al almacén de contenido privado de una empresa sin el riesgo de que esté expuesto a otros usuarios. Levi explica:
El gran avance es cómo toma cualquier modelo de IA y lo conecta con la empresa de una manera muy segura que obviamente no filtra ningún dato. Mantiene todos los datos muy confidenciales y privados, pero puede aprovechar la comprensión que tiene el modelo de IA del lenguaje y ser capaz de razonar a través de preguntas sobre documentos, de una manera realmente profunda.
Además de aprovechar la infraestructura de Box existente para proteger el acceso al contenido empresarial, Box AI también se basa en las inversiones anteriores de la empresa en IA, al tiempo que agrega nuevas capacidades específicas para los LLM, dice Levie. La compañía también ha publicado hoy un conjunto de principios para el uso responsable de la IA.
Restringir el contenido con el que trabaja el modelo reduce el riesgo de introducir información falsa al responder una consulta, un fenómeno LLM común conocido como alucinación. Levi explica:
La forma en que enviamos los datos al modelo de IA, le indicamos que no responda nada fuera de lo que está en el contenido. Eso mejora drásticamente cualquier riesgo de alucinación. Ahora, todavía existe un riesgo, para ser claros: definitivamente hay algunos escenarios en los que eso puede suceder. Pero en su mayor parte, se redujo drásticamente este problema de alucinaciones, porque no le estás haciendo la pregunta al modelo de IA. Le está haciendo la pregunta a su documento, utilizando la comprensión que tiene el modelo de IA del lenguaje, como su capacidad para razonar a través de los datos. Eso reduce drásticamente algunos de los riesgos normales de alucinaciones.
Generando contenido
Los casos de uso iniciales serán la producción de resúmenes instantáneos de documentos, la extracción de información clave o puntos de información, o la reescritura del contenido en un estilo o tono diferente. El contenido también se puede generar desde cero en Box Notes, por ejemplo, convertir un conjunto de viñetas en un informe, una especificación, una publicación de blog o un comunicado de prensa, generar una agenda de reunión o una lluvia de ideas nuevas. Levie dice:
Podría solicitar un conjunto de documentos, ‘Ayúdenme a pensar en una forma de ahorrar dinero en la empresa’ o ‘Escriba un argumento de venta, utilizando la información de nuestro nuevo producto’. O podría mirar un contrato y decir: ‘¿Cuál es la cláusula más riesgosa del contrato?’ O podría estar mirando los datos de recursos humanos y decir: ‘Oye, ¿queremos mejorar nuestros beneficios de recursos humanos? ¿Cómo haríamos eso? Puede aprovechar toda su comprensión en el modelo de IA, conectarlo a su contenido y responder esa pregunta de una manera muy específica, solo para su negocio.
Ese es el gran avance, poder hacer preguntas de contenido que nunca antes fue posible. Eso es lo que Box AI podrá hacer: desbloquear realmente el valor total de la información en su empresa.
Inicialmente, sin embargo, la implementación está restringida a trabajar con documentos individuales a la vez. Otros casos de uso vendrán cuando el modelo pueda funcionar con colecciones de documentos o con toda la biblioteca de contenido de una empresa. Levie comenta:
Lo que está viendo inicialmente en este momento es solo la primera incursión de casos de uso. Creo que la categoría de avance real será hacer preguntas de un conjunto de datos arbitrariamente grande y luego obtener una respuesta en lenguaje natural…
Imagine el caso de uso de, va a un portal de recursos humanos o un portal de ventas, y hace una pregunta, ‘Está bien, necesito un precio particular para un producto’. Solo haces la pregunta y obtienes una respuesta. A diferencia de, voy a un archivo, abro el archivo, encuentro la parte correcta del archivo. Ese es el caso de uso probablemente realmente grande. Vamos a estar haciendo eso en un nivel de documento individual en este momento. Pero el gran potencial es cuando lo hace a través de un conjunto de documentos.
Casos de uso futuros
La primera iteración tampoco proporciona ninguna guía para los usuarios sobre cómo escribir avisos. Dependerá de los usuarios descubrir las mejores indicaciones para lograr los resultados que están buscando. En el futuro, es probable que la plataforma introduzca plantillas y filtros que ayuden a los usuarios a crear avisos. Tampoco hay opción para agregar un ciclo de retroalimentación de capacitación en la versión actual, que una empresa podría usar para ajustar los resultados que produce el modelo. «Con el tiempo, puedes imaginar que definitivamente tendría sentido», dice Levie.
Es probable que los casos de uso futuros incluyan la incorporación de acciones de Box AI en las automatizaciones de flujo de trabajo y la ayuda para crear automáticamente clasificaciones para conjuntos de información. Levie elabora:
Puede darle un documento y luego tiene un mensaje que dice: ‘Por favor, clasifique este documento y explique sus razones’. Hace un trabajo increíble con cualquier tipo de nivel granular de clasificación que desee…
Digamos que eres un estudio de cine, podrías hacer que clasifique guiones de películas, de este género, de esta duración, y clasificará eso. Eso nunca ha sido posible antes. Porque anteriormente, habría tenido que entrenar un modelo de IA solo en guiones de películas. Y luego tendrías que empezar con el motor de clasificación de guiones de películas. Y de nuevo, nadie nunca hizo eso. Simplemente tomó demasiado trabajo.
Lo que ahora puede hacer con estos modelos de IA es, básicamente, si se trata de un nivel intelectual de posgrado universitario, ahora aplíquelo a cualquier tipo de documento o proceso de contenido, ahora podemos resolver ese problema de manera automatizada.
Por lo tanto, el anuncio de hoy es un paso importante hacia la creación de IA en todo el conjunto de productos de Box. Él resume:
Puedes imaginar que la IA realmente está en el centro de toda nuestra arquitectura. Nuestro ciclo de vida de contenido es todo, desde ingerir datos hasta protegerlos, clasificarlos y colaborar en ellos, todo ese ciclo de vida. Creemos que la IA se infundirá en la forma en que trabajamos en todo lo que hacemos.
Mi toma
Box, como empresa, ya está bien versado en el uso de la IA para ayudar a las empresas a administrar y dar sentido a sus almacenes de contenido, pero agregar la tecnología LLM sin duda lleva esto a un nivel completamente nuevo, al mismo tiempo que construye barandillas importantes para proteger la integridad y la seguridad. de ese contenido. Es bueno ver que Box da un paso a la vez para garantizar que la tecnología produzca resultados significativos en un contexto empresarial mientras gestiona el riesgo de resultados no autorizados.