Saltar al contenido

Tendencias de 2023 en inteligencia artificial y aprendizaje automático: se revela la IA generativa

28 de noviembre de 2022

En la actualidad, el potencial de la Inteligencia Artificial generativa, la variedad de aprendizaje automático predominantemente avanzado que analiza el contenido para producir contenido nuevo sorprendentemente similar, es ilimitado.

Estas tecnologías han trascendido la generación de lenguaje natural, en la que lograron gran parte de su renombre inicial a través de paradigmas como representaciones de codificador bidireccional de transformadores (BERT), transformador generativo preentrenado 3 (GPT3) y redes neuronales profundas. Aunque todavía se utiliza para crear resúmenes verbales de documentos y resultados analíticos, la IA generativa ahora se emplea ampliamente para componer poesía, música, artes visuales y muchas otras cosas que antes se consideraban relegadas al ámbito del ingenio humano.

Un examen más detallado de los fundamentos tecnológicos que impulsan estas aplicaciones revela una serie de hallazgos conmovedores que impactan su influencia en la IA empresarial para el Año Nuevo:

  • Técnicas Estadísticas: La IA generativa se basa principalmente en la base estadística de la IA, no en su base de conocimiento. Se destaca en el aprendizaje automático, evita el razonamiento automático y en realidad no comprende los dominios subyacentes a los que se aplica.
  • Aprendizaje profundo: Los modelos de IA generativa se basan en la escala masiva y la computación requerida para el aprendizaje profundo. Por el contrario, son presa de las mismas advertencias expuestas sobre esta forma de IA durante años, en términos de aplicaciones para las que es y no es adecuado. Este último implica transparencia, explicabilidad e interpretabilidad.
  • Redes neuronales: Debido a su dependencia de las redes neuronales profundas, como las redes antagónicas generativas y otras, la IA generativa tiende a abandonar los modelos de aprendizaje automático más simples que aún son muy relevantes para casos comerciales como la detección de fraudes, la seguridad de la información y las recomendaciones.

Aún así, los beneficios de la automatización, el tiempo de acción y la escalabilidad de la IA generativa son las razones por las que las organizaciones confían en la IA en primer lugar. Las empresas prudentes adoptarán estas ventajas dentro de marcos más amplios para mitigar las deficiencias del aprendizaje automático avanzado para proporcionar un valor comercial tangible para el apoyo a la toma de decisiones, la satisfacción del cliente, la optimización de la carga de trabajo y la reducción de costos.


Recomendado: ¿Qué es el Big data?.


Al moderar el uso de redes neuronales profundas dentro de construcciones altamente confiables, como sistemas basados ​​en reglas, modelado de conjuntos, técnicas gráficas y otros, la IA generativa puede demostrar el gran salto adelante que sus campeones proclaman que es.

GPT3

Hay innumerables implementaciones de generación de lenguaje natural que se atribuyen directamente tanto a la IA generativa como a sus métodos avanzados de aprendizaje automático. «GPT3 a veces puede generar, dado un contexto y un escenario específico, un código repetitivo específico o un texto repetitivo que puede ser útil para… resúmenes», postuló Ignacio Segovia, Jefe de Ingeniería de Producto de Altimetrik. En consecuencia, hay un número cada vez mayor de casos de uso para implementar estos enfoques de aprendizaje profundo para ofrecer una sinopsis rápida de las interacciones entre los clientes y los bots, los representantes de la empresa y las interfaces del sistema. Por un lado, este enfoque beneficia a los segmentos de clientes porque “esta persona que está buscando un plan de jubilación podría ser en realidad un mejor candidato para estar en este otro tipo de plan de jubilación, solo porque ese resumen particular de una conversación lo indicó”, comentó Segovia. .

Por otro lado, cuando se trata de una arquitectura transformadora, es posible proporcionar resúmenes de cantidades impensables de datos que corresponden a los empleados de una organización. “Copilot toma todo el espacio de código conocido de GitHub, imagínate, y lo convierte muy rápidamente en un código repetitivo donde el desarrollador puede simplemente preocuparse por su validez, formularlo y ajustarlo”, comentó Segovia. Aunque este caso de uso particular no implica escribir código desde cero, la sinopsis del código de GPT3, a escala, es notable para los desarrolladores que fomentan aplicaciones innovadoras o simplemente mejoran las existentes.

Reglas algorítmicas

Como aludió Segovia, uno de los resultados más deseados de la IA generativa es la capacidad de producir código para los desarrolladores que escriben nuevas aplicaciones o diseñan páginas web. En la actualidad, sin embargo, existen métodos mediante los cuales la IA puede mejorar el código para reducir los costos y aumentar la eficiencia para las necesidades universales, como la computación en la nube. Al combinar la base de conocimiento de la IA y su base estadística (que Gartner ha denominado IA compuesta), los sistemas inteligentes pueden optimizar las cargas de trabajo en la nube, encontrar las consultas más costosas en herramientas populares como Snowflake y determinar cómo reducir sus costos. Según el director ejecutivo de Bluesky, Mingsheng Hong, existen «algoritmos informáticos [that] hacer lo que solían hacer los expertos humanos; pueden escalar y analizar no solo 10, 100 consultas, sino millones de consultas”.

Lo significativo de esta aplicación es que no se basa en el aprendizaje profundo, sino en lo que Hong describió como «algoritmos basados ​​en reglas». El empleo de reglas con enfoques de aprendizaje supervisado permite que el sistema refine las consultas creadas por humanos para optimizar su rentabilidad al proporcionar «recomendaciones de ajuste al cambiar el código de consulta y cambiar el diseño de datos», reveló Hong. Aunque la IA no se usa para crear el código para consultar las fuentes de la nube, aún lo modifica, según sea necesario, para aumentar su rentabilidad y optimización de la carga de trabajo. La aplicabilidad horizontal de este caso de uso es tan notable como el hecho de que el enfoque de IA compuesta en el que se basa no suele considerarse parte de la IA generativa. Sin embargo, sigue siendo de ayuda para escribir código, que es una de las implementaciones principales de la IA generativa para la utilidad comercial práctica.

Aprendizaje automático clásico

La omnipresencia del aprendizaje automático avanzado no ha dejado obsoleto, ni probablemente lo haga, el mérito del aprendizaje automático tradicional. No es raro proporcionar detección de fraude, medidas contra el lavado de dinero y seguridad cibernética a través del aprendizaje automático clásico, mientras se fortalece la explicabilidad muy necesaria en el proceso. Las técnicas de modelado de conjuntos, que combinan la destreza predictiva de múltiples modelos de aprendizaje automático para ampliarlos, son fundamentales para maximizar el valor de los algoritmos tradicionales de aprendizaje automático para casos de uso que involucran IA generativa. Con este enfoque, los modelos simples de aprendizaje automático analizan un aspecto de una transacción (como su dispositivo o cantidad). Fusionarlos preserva su trazabilidad mientras cubre un alcance cada vez mayor de actividad fraudulenta. Por lo tanto, las organizaciones pueden “tener fácilmente un resultado textual junto a un [fraud detection] puntaje que dice que el tamaño de esta transacción es demasiado alto para este sector económico”, mencionó Martin Rehak, CEO de Resistance AI.

En este caso de uso, NLG facilita la explicación de los modelos clásicos de aprendizaje automático que son inherentemente rastreables. Esos algoritmos son fundamentales para el éxito porque se explican fácilmente y no requieren tantos datos de ejemplo para un entrenamiento suficiente como el aprendizaje profundo sin técnicas de aprendizaje de representación. Lo fundamental de esta aplicación es que sugiere que el aprendizaje automático clásico y avanzado no se excluyen mutuamente. “Empiezas con modelos más simples y, a medida que desarrollas la experiencia, haces la transición en el… medio… en el conjunto a principios de aprendizaje profundo tan pronto como puedas”, señaló Rehak. “Podemos alternar entre modelos tradicionales y aprendizaje profundo, y alternar entre ellos en función de las necesidades del resto del conjunto”.

Análisis gráfico

Las técnicas de gráficos son particularmente influyentes para las aplicaciones de IA en las que “tienes relaciones y quieres explotar esas relaciones”, observó Suman Bera, ingeniero de software sénior en Katana Graph. Ya sea que evalúen aspectos de la originación de préstamos, tratamientos de atención médica, seguridad de la información o fraude, los gráficos pueden descubrir relaciones incluso mínimas entre los datos para mejorar el análisis. Según Rehak, no es raro que «en el conjunto, algunos de los algoritmos se basen en gráficos, y estos son algunos de los que obtienen el mayor peso». Las redes neuronales gráficas continuarán impactando la IA empresarial el próximo año al sobresalir en espacios de alta dimensionalidad para casos de uso que involucran predicciones sobre nodos y sus enlaces.

Los enfoques adicionales basados ​​en incrustaciones, que es similar a la palabra incrustaciones involucradas en métodos basados ​​en modelos para tecnologías de lenguaje natural, identifican relaciones en datos que los usuarios no verían de otro modo. Estas capacidades son ideales para acelerar ciertos aspectos de la detección de características para construir modelos de aprendizaje automático. Además, las redes neuronales gráficas están preparadas para dominar los rigores de los datos no estructurados, incluso para los casos de uso más difíciles. “Las redes neuronales gráficas funcionan en cosas que son estructuras gráficas”, explicó Bera. «Todavía tiene una estructura, pero no su estructura de cuadrícula convencional». Las estructuras de cuadrícula a las que Bera hace referencia son aplicables a las formas de visión por computadora. Las redes neuronales gráficas son de cierta utilidad para tales implementaciones, pero también para identificar estructuras irregulares que se encuentran en casos de uso de ciencias de la vida, por ejemplo, como impulsar la comercialización de nuevos productos farmacéuticos.

Puntos de referencia

En muchos sentidos, la IA generativa ya se ha convertido en un instrumento formidable en el conjunto de herramientas para aplicaciones empresariales de aprendizaje automático e inteligencia artificial. Su utilidad para NLG, que con frecuencia involucra aspectos de la comprensión del lenguaje natural, está bastante extendida. Sin embargo, es importante no secuestrar las capacidades de IA generativa de enfoques más consagrados que involucran el aprendizaje automático tradicional, la IA simbólica y las tecnologías gráficas. Templar las redes neuronales profundas de la IA generativa con estos otros métodos para la IA y el aprendizaje automático solo puede aumentar su productividad, lo que da como resultado aplicaciones más transparentes y responsables en casos de uso empresariales centrales.

“La forma en que los estándares establecen puntos de referencia para la precisión cambia constantemente”, reflexionó Segovia. “Cosas que eran relativamente precisas hace tres o cuatro años están completamente desactualizadas. La mayor parte de la industria, si va a cualquiera de los trabajos de investigación que existen, son esencialmente puntos de referencia obsoletos. Esa es un área que creo que debe mejorarse considerablemente: la estandarización para la evaluación comparativa”.

Sobre el Autor

Jelani Harper es una consultora editorial que presta servicios al mercado de la tecnología de la información. Se especializa en aplicaciones basadas en datos centradas en tecnologías semánticas, gobierno de datos y análisis.

Regístrese para recibir el boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: https://twitter.com/InsideBigData1

Únase a nosotros en LinkedIn: https://www.linkedin.com/company/insidebigdata/

Únase a nosotros en Facebook: https://www.facebook.com/insideBIGDATANOW