Saltar al contenido

Las diferencias entre las respuestas de IA de OpenAI, Microsoft y Google

17 de abril de 2023

Sarah Yáñez-Richards

Nueva York, 16 de abril. Los chatbots pueden impulsarse por IA generar respuestas similares a las humanas sobre cualquier tema en cuestión de segundos. Los más populares en este momento son Bard de Google, Bing de Microsoft y ChatGPT de OpenAI. Efe compara los tres modelos con una variedad de preguntas, acertijos y solicitudes para ver la diferencia entre sus respuestas.

Para este experimento, EFE utiliza GPT-4, de OpenAI, al que se puede acceder pagando una suscripción de 20 dólares al mes -OpenAI ofrece servicios gratuitos, como ChatGPT, pero es una tecnología inferior y el chatbot solo tiene acceso a internet hasta 2021 – .

También utiliza Bing de Microsoft, impulsado por la tecnología GPT-4 de OpenAI, y la primera versión experimental de Google, Bard, a la que solo tiene acceso un grupo selecto de personas.

CHATBOT: “NO SIEMPRE LO HARE BIEN”

Las tres herramientas tienen mensajes que advierten que sus respuestas pueden ser incorrectas. “Tengo limitaciones y no siempre acertaré”, dice el servicio de Google.

GPT-4 también enfatiza que su chatbot “no está destinado a dar consejos”.

Mientras que el mensaje de Bing dice que “las sorpresas y los errores son posibles”. “¡Asegúrese de verificar los hechos y compartir sus comentarios para que podamos aprender y mejorar!” él añade.

NO TODOS HABLAN ESPAÑOL

A la pregunta: “¿Puedo preguntarte cosas en español?”, Bing y ChatGPT responden: “Sí”.

Si bien Bard responde en inglés que no pudo “brindar asistencia con eso” ya que es “capaz de comprender y responder solo a un subconjunto de idiomas en este momento”, lo que implica que el español no es uno de esos idiomas.

Recomendado:  Proyección de crecimiento del mercado de inteligencia artificial de aprendizaje automático de 2021 a 2027

Mientras tanto, las preguntas y respuestas de este experimento serán en español, en el caso de Bing y ChatGPT, y en inglés en el caso de Bard.

UNA RECETA

“Dame una receta vegetariana barata”, pide EFE. GPT-4 recomienda “lentejas vegetarianas”, Bing “arroz de lentejas con verduras” y Bard “revuelto de tofu”.

Los tres chatbots siguieron el mismo sistema, enumerando primero los ingredientes y luego dando las instrucciones de preparación.

Tanto GPT-4 como Bard fueron un paso más allá y dieron información adicional a la receta misma.

“Puedes adaptarlo a tus preferencias añadiendo más verduras, especias o añadiendo espinacas o kale al final de la cocción para aumentar incluso su contenido de nutrientes”, comenta al final de su mensaje GPT-4.

Mientras que Bard enfatizó al final de su mensaje que su receta es “una buena fuente de proteína y fibra”.

¿DE DÓNDE VIENE LA INFORMACIÓN?

Microsoft y Google tienen sus propios motores de búsqueda y les beneficia redirigir a los usuarios a otros sitios web.

En la parte inferior de cada respuesta de Bard hay un botón que dice “Google it”, mientras que en Bing hay una etiqueta de “aprender más”, donde proporciona una lista de enlaces.

En este caso de la receta, la herramienta de Microsoft proporciona enlaces a: recetasderechupete.com, tendencias.com, kiwilimon.com y clara.es.

Por su parte, OpenAI no da ningún enlace externo ni opción para conocer la fuente de la información.

UNA RESEÑA DE LA LITERATURA Y LA CULTURA ESPAÑOLAS

La siguiente prueba es una pregunta sobre un examen de Literatura y Cultura Española de Colocación Avanzada (AP), exámenes que los estudiantes estadounidenses de secundaria pueden tomar para obtener créditos universitarios.

Recomendado:  Escáneres cerebrales tomados durante tenis de mesa revelan diferencias en cómo respondemos a oponentes humanos versus máquinas

A los tres chatbots se les entrega un fragmento de un texto y se les pide que identifiquen al autor, así como que expliquen “el desarrollo del tema de la relación entre el tiempo y el espacio dentro de la obra a la que pertenece”.

Se recomienda a los estudiantes que dediquen 15 minutos a responder a esta respuesta, pero los chatbots dan su respuesta en menos de un minuto.

Según la filóloga, profesora de español y estudios sociales en EE.UU., Ana García Alonso, la única respuesta que aprobaría es la de Bard, pero como estaba en inglés y no en español, tiene que reprobarla también.

En su respuesta de 355 palabras en inglés, la herramienta de Google reconoce que el extracto de “My Wizard Horse” fue escrito por Sabine R. Ulibarrí y luego analiza el texto en varios párrafos.

“Está muy bien, pero le falta sensibilidad lectora, no capta los mecanismos que crean la belleza, el arte y la sensibilidad literaria”, señala García Alonso.

La respuesta de Bing es la más corta, con 123 palabras. Este chat también identifica al autor, dice que el texto “es considerado una de las obras más importantes de la literatura chicana” y explica el resto en un párrafo.

“Es muy conciso y carece de análisis”, apunta la filóloga, quien agrega que no aprobaría el ejercicio de esta charla.

OpenAI dio la respuesta más larga, 360 palabras, pero fue la peor respuesta, según García Alonso.

A pesar de que la pregunta indica que el texto se titula “Mi Caballo Mágico”, GPT-4 responde que el fragmento pertenece al cuento “El Sur” del autor argentino Jorge Luis Borges.

Recomendado:  La IA ahora puede diseñar nuevos antibióticos en días. También puede ayudar con Covid-19.

ACERTIJOS

“¿Qué día del año hablan menos los charlatanes?” EFE pregunta a los chats de la IA, sin precisar que se trata de una adivinanza.

Bing es el único que resuelve el acertijo: “Es ese día en el que se adelanta la hora de la primavera”.

Mientras que Bard y Chat-4 dicen que no hay un día específico y ofrecemos información adicional sobre los charlatanes.

LOS CHATS ESCRIBEN LAS CONCLUSIONES

En la última prueba, EFE pide a los chats que escriban el último párrafo (máximo 40) de este artículo, pero todas las respuestas eran más largas, por lo que han sido palabras editadas.

“En última instancia, el éxito de cada empresa obtuvo su capacidad para innovar y adaptarse a medida que evoluciona el campo de la IA”, responde Bing.

“En conclusión, ChatGPT de OpenAI es conocido por su capacidad para generar texto atractivo y creativo, mientras que 365 Copilot de Microsoft, del cual Bing forma parte, está diseñado para ser más útil y productivo. Bard de Google todavía está en desarrollo, pero tiene el potencial de ser la respuesta de IA más completa e informativa de todas”, señala Bard.

“En conclusión, para sacar el máximo partido a estas herramientas es fundamental entender sus particularidades y seleccionar la más adecuada según las necesidades específicas del usuario”, concluye GPT-4. EFE

señor/ie