LLM Wars: PaLM 2 VS GPT-4

En el evento Google I/O, la empresa presentó PaLM 2, un modelo de lenguaje de próxima generación. PaLM 2 representa una mejora significativa con respecto a su predecesor, PaLM, e introduce varias capacidades nuevas que lo diferencian de GPT-4 de OpenAI.

Una de las principales ventajas de PaLM 2 es su disponibilidad en tamaños más pequeños, como Gecko, Otter, Bison y Unicorn, que están específicamente optimizados para aplicaciones con capacidad de procesamiento limitada. Estos modelos más pequeños permiten que PaLM 2 se adapte a una gama más amplia de dispositivos y productos, incluidos dispositivos móviles que pueden ejecutar el modelo ligero Gecko incluso sin conexión. Esta flexibilidad en los tamaños de los modelos le da a PaLM 2 una ventaja en términos de accesibilidad e implementación.

Google afirma que PaLM 2 demuestra capacidades de razonamiento mejoradas en comparación con GPT-4, particularmente en tareas como WinoGrande y DROP, con una ligera ventaja en ARC-C también. Sin embargo, es importante tener en cuenta que las comparaciones directas entre los dos modelos pueden resultar complicadas debido a las diferencias en la presentación de los resultados de las pruebas. Además, Google optó por omitir algunas comparaciones en las que PaLM 2 se desempeñó de manera menos favorable, lo que genera dudas sobre la integridad de la evaluación.

En términos de habilidades matemáticas, PaLM 2 muestra mejoras según el trabajo de investigación de Google. Si bien el tamaño exacto del modelo más grande de PaLM 2, PaLM 2-L, sigue sin revelarse, Google ha declarado que es significativamente más pequeño que los 540 mil millones de parámetros de PaLM. Esto sugiere que PaLM 2-L es probablemente más pequeño que GPT-3.5, pero aún así compite bien con GPT-4 y ofrece un rendimiento impresionante en varias tareas.

Las nuevas funciones de Bard también lo convierten en la mejor opción para la investigación. Proporciona resúmenes más concisos y fuentes mejoradas. Los usuarios ahora pueden acceder rápidamente a la información central de un tema e identificar fácilmente qué partes de la respuesta coinciden con fuentes específicas haciendo clic en las etiquetas de números de las secciones correspondientes en las fuentes vinculadas. Esto ayuda cuando se realizan investigaciones o se escriben ensayos que requieren conocimientos específicos y citas detalladas. Estas actualizaciones abordan las limitaciones de las herramientas de IA para verificar información del mundo real y mejoran las capacidades de investigación de Bard.

Sin divulgación

Si bien Google no revela el tamaño exacto del conjunto de datos de capacitación de PaLM 2, la compañía enfatiza un enfoque en las matemáticas, la lógica, el razonamiento y la ciencia. El corpus de pre-entrenamiento de PaLM 2 consta de una amplia gama de fuentes, incluidos documentos web, libros, código, matemáticas y datos conversacionales. Además, PaLM 2 se ha capacitado en más de 100 idiomas, lo que mejora su comprensión contextual y sus capacidades de traducción.

Por el contrario, OpenAI ha entrenado a GPT-4 utilizando datos disponibles públicamente y datos con licencia. GPT-4 tiene como objetivo generar una amplia gama de respuestas y se ha perfeccionado mediante el aprendizaje por refuerzo con comentarios humanos, alineando su comportamiento con la intención del usuario.

Se puede acceder a PaLM 2 y GPT-4 a través de sus respectivos chatbots, Bard y ChatGPT. Bard está disponible gratuitamente en todo el mundo, mientras que ChatGPT Plus, con GPT-4, está detrás de un muro de pago. Sin embargo, también se puede acceder a GPT-4 de forma gratuita a través de Bing AI Chat de Microsoft, que utiliza el modelo. Esta accesibilidad juega un papel en la posible adopción de PaLM 2, ya que es un modelo de código abierto.

Google ha integrado PaLM 2 en más de 25 de sus productos, incluidos Android y YouTube, mientras que Microsoft también ha incorporado funciones de inteligencia artificial en su paquete de Office y varios servicios. Aunque GPT-4 ha ganado terreno entre los desarrolladores y las empresas emergentes debido a su lanzamiento y refinamiento anticipados, la naturaleza de código abierto de PaLM 2 puede atraer a una gama más amplia de usuarios.

Dado que PaLM 2 es un modelo relativamente nuevo, aún se está evaluando su capacidad para competir con GPT-4. Los ambiciosos planes de Google y las capacidades únicas de PaLM 2 sugieren que podría presentar un desafío formidable para GPT-4. Sin embargo, GPT-4 sigue siendo un modelo capaz, superando a PaLM 2 en varias comparaciones. Sin embargo, los modelos más pequeños de PaLM 2, especialmente las opciones livianas como Gecko, le dan una ventaja, particularmente para dispositivos móviles.

Con la introducción de PaLM 2 y el desarrollo continuo de Google del modelo de IA multimodal Gemini, la competencia por el dominio de la IA se ha intensificado. El compromiso de Google con el avance de las tecnologías de IA indica un impulso continuo para innovar y desafiar a jugadores establecidos como GPT-4. El futuro revelará cómo evolucionan estos modelos de lenguaje y cómo dan forma al panorama del procesamiento del lenguaje natural y la IA en su conjunto.