OpenAI GPT-5: fecha de lanzamiento, características, rumores de AGI, especulaciones y más

Han pasado poco más de dos meses desde el lanzamiento de GPT-4, pero los usuarios han comenzado a anticipar el lanzamiento de GPT-5. Ya hemos visto cuán capaz y poderoso es GPT-4 en varios tipos de pruebas y evaluaciones cualitativas. Con muchas funciones nuevas, como los complementos de ChatGPT y la capacidad de navegación por Internet, ha mejorado aún más. Ahora, los usuarios esperan obtener más información sobre el próximo modelo de OpenAI, GPT-5, la posibilidad de AGI y más. Entonces, para encontrar información detallada sobre la fecha de lanzamiento de GPT-5 y otras características esperadas, siga nuestro explicador a continuación.

Fecha de lanzamiento de GPT-5

Cuando se lanzó GPT-4 en marzo de 2023, se esperaba que OpenAI lanzaría su modelo de próxima generación en diciembre de 2023. Siqi Chen, director ejecutivo de Runway también tuiteó Diciendo que «gpt5 está programado para completar el entrenamiento este diciembre.” Sin embargo, hablando en un evento del MIT en abril, el director ejecutivo de OpenAI, Sam Altman, dijo: “No lo somos y no lo haremos por algún tiempo.” cuando se le preguntó si OpenAI está entrenando GPT-5. Entonces, el rumor de que GPT-5 se lanzará a fines de 2023 ya está anulado.

Dicho esto, los expertos sugieren que OpenAI podría presentar GPT-4.5, una versión intermedia entre GPT-4 y GPT-5 para octubre de 2023, al igual que GPT-3.5. se dice que GPT-4.5 finalmente traerá la capacidad multimodal, también conocida como la capacidad de analizar imágenes y textos. OpenAI ya anunció y demostró las capacidades multimodales de GPT-4 durante la transmisión en vivo de GPT-4 Developer en marzo de 2023.

Capacidad multimodal GPT-4

Aparte de eso, OpenAI actualmente tiene mucho que resolver en el modelo GPT-4 antes de que comience a trabajar en GPT-5. Actualmente, los GPT-4 el tiempo de inferencia es muy alto y es bastante caro de mantener. El acceso a la API GPT-4 sigue siendo difícil de conseguir. Además, OpenAI abrió recientemente el acceso a los complementos de ChatGPT y la capacidad de navegación por Internet, que aún se encuentran en versión beta. Todavía está por traer Code Interpreter para todos los usuarios que pagan, que nuevamente está en la fase Alfa.

Si bien GPT-4 es bastante poderoso, supongo que OpenAI se da cuenta de eso la eficiencia informática es uno de los elementos clave para ejecutar un modelo de manera sostenible. Y bueno, agregue nuevas funciones y capacidades a la mezcla, y tendrá una infraestructura más grande con la que lidiar mientras se asegura de que todos los puntos de control estén funcionando de manera confiable. Entonces, para aventurarme a adivinar, es probable que GPT-5 salga en 2024, justo alrededor del lanzamiento de Google Gemini, si asumimos que las agencias gubernamentales no ponen un obstáculo regulatorio.

Características y capacidades de GPT-5 (esperadas)

Alucinación reducida

La charla candente en la industria es que GPT-5 logrará AGI (Inteligencia General Artificial), pero eso lo veremos más adelante en detalle. Además de eso, se supone que GPT-5 reduce el tiempo de inferencia, mejora la eficiencia, reduce las alucinaciones y mucho más. Vamos Empezar con alucinacionesque es una de las razones clave por las que la mayoría de los usuarios no creen fácilmente en los modelos de IA.

Prueba de precisión GPT-4

Según OpenAI, GPT-4 anotó 40% más alto que GPT-3.5 en evaluaciones fácticas internas diseñadas contradictoriamente en las nueve categorías. Ahora, GPT-4 tiene un 82 % menos de probabilidades de responder a contenido inexacto y no permitido. Está muy cerca de tocar la marca del 80 % en las pruebas de precisión en todas las categorías. Eso es un gran salto en la lucha contra la alucinación.

Ahora, se espera que OpenAI reduzca la alucinación a menos de 10% en GPT-5, que sería enorme para hacer que los modelos LLM sean confiables. He estado usando el modelo GPT-4 para muchas tareas últimamente, y hasta ahora solo ha dado respuestas fácticas. Por lo tanto, es muy probable que GPT-5 alucine incluso menos que GPT-4.

Modelo computacionalmente eficiente

A continuación, ya sabemos que GPT-4 es costoso de ejecutar ($0.03 por 1K tokens) y el tiempo de inferencia también es más alto. Mientras que el modelo GPT-3.5-turbo más antiguo es 15 veces más barato ($0.002 por tokens 1K) que GPT-4. Eso es porque GPT-4 está entrenado en un masivo 1 billón de parámetros, que requiere una infraestructura informática costosa. En nuestra explicación reciente sobre el modelo PaLM 2 de Google, encontramos que PaLM 2 es bastante más pequeño y eso da como resultado un rendimiento rápido.

Un informe reciente de CNBC confirmó que PaLM 2 está entrenado en 340 mil millones de parámetros, que es mucho menos que el gran tamaño de parámetro de GPT-4. Google incluso llegó a decir que más grande no siempre es mejor y investigación creatividad es la clave para hacer grandes modelos. Entonces, si OpenAI quiere que sus próximos modelos sean computacionales óptimos, debe encontrar nuevas formas creativas de reducir el tamaño del modelo mientras mantiene la calidad de salida.

Volví a un proyecto en el que estaba trabajando con la API OpenAI GPT-4 y noté que los tiempos de respuesta de la API eran bastante lentos.

Respuesta promedio probada en un contexto nuevo para «¿Puedes mostrarme un ejemplo básico de matplotlib de dispersión?»

GPT-3.5: 13,4 segundos

GPT-4: 44,7 segundos.

⏱️🦥🐢— Harrison Kinsley (@Sentdex) 10 de mayo de 2023

Una gran parte de los ingresos de OpenAI proviene de empresas y negocios, por lo que sí, GPT-5 no solo debe ser más barato sino también más rápido para generar resultados. Los desarrolladores ya están criticando el hecho de que las llamadas a la API de GPT-4 dejan de responder con frecuencia y son obligado a usar el modelo GPT-3.5 en producción. Debe estar en la lista de deseos de OpenAI para mejorar el rendimiento en el próximo modelo GPT-5, especialmente después del lanzamiento del modelo PaLM 2 mucho más rápido de Google, que puede probar ahora mismo.

Modelo de IA multisensorial

Si bien GPT-4 se ha anunciado como un modelo de IA multimodal, se ocupa solo de dos tipos de datos, es decir, imágenes y textos. Claro, la capacidad aún no se ha agregado a GPT-4, pero es posible que OpenAI lance la función en unos meses. Sin embargo, con GPT-5, OpenAI puede dar un gran salto en haciéndolo verdaderamente multimodal. También puede tratar con texto, audio, imágenes, videos, datos de profundidad y temperatura. Sería capaz de interconectar flujos de datos de diferentes modalidades para crear un espacio de incrustación.

Fuente: Meta

Recientemente, Meta lanzó ImageBind, un modelo de IA que combina datos de seis modalidades diferentes y los abre para fines de investigación. En este espacio, OpenAI no ha revelado mucho, pero la empresa tiene algunos modelos básicos sólidos para el análisis de visión y la generación de imágenes. OpenAI también ha desarrollado CLIP (Contrastive Language–Image Pretraining) para analizar imágenes y DALL-E, una alternativa popular de Midjourney que puede generar imágenes a partir de descripciones textuales.

Es un área de investigación en curso y sus aplicaciones aún no están claras. Según Meta, se puede utilizar para diseñar y crear contenido inmersivo para la realidad virtual. Tenemos que esperar y ver qué hace OpenAI en este espacio y si veremos más aplicaciones de IA en varias modalidades múltiples con el lanzamiento de GPT-5.

Memoria a largo plazo

Con el lanzamiento de GPT-4, OpenAI trajo un máximo longitud de contexto de tokens 32K, que cuesta $0.06 por token de 1K. Hemos visto rápidamente la transformación de los tokens estándar de 4K a 32K en unos pocos meses. Recientemente, Anthropic aumentó la ventana de contexto de 9K a 100K tokens en su chatbot Claude AI. Se espera que GPT-5 brinde soporte de memoria a largo plazo a través de una longitud de contexto mucho mayor.

Esto puede ayudar a hacer Personajes y amigos de IA que recuerdan tu persona y recuerdos que pueden durar años. Aparte de eso, puede cargar bibliotecas de libros y documentos de texto en una sola ventana de contexto. Puede haber varias aplicaciones nuevas de IA debido al soporte de memoria a largo plazo y GPT-5 puede hacerlo posible.

Lanzamiento de GPT-5: ¿Miedo a AGI?

En febrero de 2023, Sam Altman escribió un blog sobre AGI y cómo puede beneficiar a toda la humanidad. AGI (Inteligencia General Artificial), como sugiere el nombre, es la próxima generación de sistemas de IA que está generalmente más inteligente que los humanos. Se dice que el próximo modelo GPT-5 de OpenAI logrará AGI, y parece que hay algo de verdad en eso.

Ya tenemos varios agentes de IA autónomos como Auto-GPT y BabyAGI, que se basan en GPT-4 y pueden tomar decisiones por sí mismos y llegar a conclusiones razonables. Es muy posible que alguna versión de AGI se implemente con GPT-5.

En el blog, Altman dice que “Creemos que tenemos que aprender y adaptarnos continuamente mediante la implementación de versiones menos potentes de la tecnología para minimizar los escenarios de «una oportunidad para hacerlo bien».mientras que también reconociendo “riesgos masivos” en la navegación de sistemas muy poderosos como AGI. Antes de la reciente audiencia en el Senado, Sam Altman también instó a los legisladores estadounidenses a que reglamentasen los sistemas de inteligencia artificial más nuevos.

En la audiencia, Altman dijo: “Creo que si esta tecnología sale mal, puede salir bastante mal. Y queremos expresarnos al respecto..” Además, agregó, “Queremos trabajar con el gobierno para evitar que eso suceda.“Durante algún tiempo, OpenAI se ha vuelto bastante elocuente acerca de las regulaciones sobre los sistemas de IA más nuevos que serían muy poderosos e inteligentes. Tenga en cuenta que Altman está buscando seguridad. regulación en torno a sistemas de IA increíblemente poderosos y no modelos de código abierto o modelos de IA desarrollados por pequeñas empresas emergentes.

la regulación debería surtir efecto por encima de un umbral de capacidad.

La seguridad de AGI es realmente importante y los modelos fronterizos deben ser regulados.

la captura regulatoria es mala, y no deberíamos jugar con modelos por debajo del umbral. Los modelos de código abierto y las pequeñas empresas emergentes son obviamente importantes. https://t.co/qdWHHFjX4s— Sam Altman (@sama) 18 de mayo de 2023

Cabe señalar que Elon Musk y otras personalidades prominentes, incluidos Steve Wozniak, Andrew Yang y Yuval Noah Harari, et al. pidieron una pausa en los experimentos de IA gigantes, en marzo de 2023. Desde entonces, ha habido un gran rechazo contra AGI y los sistemas de IA más nuevos: más potente que GPT-4.

Si OpenAI realmente traerá la capacidad AGI a GPT-5, espere más demoras en su lanzamiento público. La regulación definitivamente entraría en acción y el trabajo en torno a la seguridad y la alineación se examinaría minuciosamente. Lo bueno es que OpenAI ya tiene un poderoso modelo GPT-4 y continuamente agrega nuevas características y capacidades. No hay otro modelo de IA que se le acerque, ni siquiera el Google Bard basado en PaLM 2.

OpenAI GPT-5: postura futura

Después del lanzamiento de GPT-4, OpenAI ha cada vez más reservado sobre sus operaciones. Ya no comparte la investigación sobre el conjunto de datos de entrenamiento, la arquitectura, el hardware, el cálculo de entrenamiento y el método de entrenamiento con la comunidad de código abierto. Ha sido un giro extraño para una empresa que se fundó como una organización sin fines de lucro (ahora tiene un límite de ganancias) basada en los principios de la colaboración libre.

En marzo de 2023, hablando con el borde, Ilya Sutskeverel científico jefe de OpenAI dijo: “Estuvimos equivocados. De plano, nos equivocamos. Si cree, como nosotros, que en algún momento, AI (AGI) va a ser extremadamente, increíblemente potente, entonces simplemente no tiene sentido para el código abierto. Es una mala idea… Espero que en unos pocos años, será completamente obvio para todos que la IA de código abierto no es inteligente.“

Ahora, ha quedado claro que ni GPT-4 ni el próximo GPT-5 serían de código abierto para poder mantenerse competitivo en la carrera de IA. Sin embargo, otra corporación gigante, Meta, ha estado abordando el desarrollo de IA de manera diferente. Meta ha estado lanzando múltiples modelos de IA bajo la licencia CC BY-NC 4.0 (solo para investigación, no comercial) y ganando terreno entre la comunidad de código abierto.

Al ver la gran adopción de LLaMA de Meta y otros modelos de IA, OpenAI también ha cambiado su postura sobre el código abierto. Según informes recientes, OpenAI está trabajando en un nuevo modelo de IA de código abierto que se dará a conocer al público pronto. No hay información sobre sus capacidades y qué tan competitivo será frente a GPT-3 .5 o GPT-4, pero de hecho es un cambio bienvenido.

En resumen, GPT-5 va a ser un modelo de frontera que empujará el límite de lo que es posible con la IA. Parece probable que alguna forma de AGI se lance con GPT-5. Y si ese fuera el caso, OpenAI debe prepararse para una regulación estricta (y posibles prohibiciones) en todo el mundo. En cuanto a la fecha de lanzamiento de GPT-5, la apuesta segura sería en algún momento de 2024.