Saltar al contenido

DSC Weekly 6 de junio de 2023: la parte que falta en LLM y sistemas similares a GPT

6 de junio de 2023

Anuncios

  • Los atacantes tienen muchas oportunidades para atacar aplicaciones empresariales en el sitio y basadas en la nube desde el principio del proceso de desarrollo. Pero muchas soluciones y herramientas, como el marco DevSecOps emergente, están disponibles para proteger mejor las aplicaciones y garantizar que se priorice la seguridad dentro de DevOps y las herramientas de prueba de seguridad de aplicaciones. Sintonice la cumbre de seguridad de aplicaciones efectivas para escuchar a los principales expertos analizar cómo proteger las aplicaciones en la infraestructura de su empresa con estrategias como DevSecOps junto con la combinación correcta de herramientas y pruebas.
  • Las empresas de servicios financieros están experimentando cambios de imagen completos a medida que modifican su visión, recursos y estrategia de liderazgo para seguir siendo competitivas en el mundo digital. Únase a la cumbre de Transformación digital para servicios financieros para aprender a transformarse estratégicamente, creando una primera estrategia digital que combina tecnologías emergentes como IA, análisis, blockchain y más con el talento y las formas de trabajo adecuados para optimizar la eficiencia, reforzar la resiliencia y conducir a largo plazo. -éxito a largo plazo.

La parte que falta en LLM y sistemas similares a GPT

En estos días, todo lo que se habla de IA es sobre GPT (Transformador preentrenado generativo), LLM (Modelos de lenguaje grande), IA generativa, ingeniería rápida y tecnologías relacionadas. Debes vivir solo en una pequeña isla si nunca has escuchado estas palabras.

LLM se originó a partir de NLP (procesamiento de lenguaje natural) que dio lugar a NLG (generación de lenguaje natural) antes de convertirse en lo que es hoy. Las redes neuronales profundas como GAN (red antagónica generativa) son uno de los componentes. Otro es recopilar grandes cantidades de datos de texto no estructurados y categorizarlos. Esto se logra rastreando sitios web como Wikipedia, ArXiv (preprints e investigación científica), comunidades de foros de Stack Exchange, GitHub, contenido de LinkedIn, noticias en línea, otros repositorios grandes e incluso conversaciones de Facebook o páginas de resultados de búsqueda de Google. Comenzando con 1,000 palabras clave iniciales, observando lo que devuelve Google y rastreando recursivamente todos los enlaces encontrados, en un par de meses se creará una base de datos con miles de millones de páginas web, cubriendo el 95% del tráfico de Internet.

Recomendado:  Huelga de escritores de WGA por IA, ChatGPT tiene más en juego de lo que piensas

Existen técnicas para categorizar estos datos no estructurados: he desarrollado la mía propia e implementado esos rastreadores inteligentes, algunos discutidos en mis libros. Al final, puede crear fácilmente un motor de búsqueda mejor que los más populares del mercado. Debido a su monopolio, su incentivo para innovar es pequeño y son manipulados por spammers y otros actores que encuentran formas de llevar su contenido a la cima.

El siguiente paso fue desarrollar una interfaz más amigable. En lugar de devolver enlaces con un pequeño resumen, redacta respuestas completas a sus preguntas. Esto es lo que hacen herramientas como ChatGPT. También será manipulado de la misma manera que Google, al final.

Existe una técnica que podría mejorar mucho estos sistemas: puntuar las fuentes de entrada. Ya sea un editor, un canal específico, un sitio web, un usuario de Facebook, un periodista o un autor. El puntaje adjunto a una fuente, más específicamente un conjunto de puntajes, cada uno de los cuales mide un atributo específico, le indica qué tan confiable es una información. Es probable que una cuenta de LinkedIn nueva con pocas conexiones, con una imagen que muestre a una mujer joven atractiva y ligeramente vestida que solo tiene contactos con hombres viejos y adinerados, desencadene una puntuación baja, en comparación con alguien que recibe constantemente buenos comentarios y reseñas (a menos que la buena retroalimentación es creada por un anillo de cuentas falsas, que es fácil de detectar).

No se trata solo de clasificar la información como confiable o no. Puede asignar etiquetas como «exagerado», «políticamente sesgado» (conservador, liberal, etc.), «no verificado», y la lista continúa. Cada fuente podría asignarse a varias etiquetas, cada una con una probabilidad determinada por el algoritmo de puntuación. Por ejemplo, una fuente podría clasificarse como exagerada y real. Y estos puntajes se actualizarían diariamente.

Recomendado:  Un estudio sugiere un marco para garantizar que los bots cumplan con los estándares de seguridad

Un beneficio, además de advertir al usuario, es evitar la incoherencia cuando GPT responde una pregunta. Si una respuesta se basa en una combinación de fuentes (algunas liberales, otras conservadoras), puede decir una cosa en un párrafo y lo contrario en el párrafo siguiente. Utilizando las puntuaciones, la respuesta podría incluir los dos argumentos contradictorios y explicar fácilmente por qué es así. Los usuarios también pueden optar por recibir la respuesta que quieren escuchar (independientemente de la veracidad), eligiendo parámetros asociados con el motor de puntuación. El sistema de puntuación podría ser bastante sofisticado, y no clasificar automáticamente las declaraciones como «información errónea» solo porque el Joe promedio e incluso los científicos de renombre lo digan, sino como «controvertidas». A veces, es porque la información en cuestión aún no ha pasado la prueba del tiempo.

Finalmente, también puede calificar la salida (las respuestas), no solo las fuentes de entrada. Esta es un área en la que actualmente participo activamente, con patentes ya otorgadas y tecnología que comencé a desarrollar hace años.

Vicente Granville, Colaborador

Comuníquese con el equipo de DSC si está interesado en contribuir.


Artículos destacados de DSC

  • 10 formas de simplificar la calidad de los datos y los esfuerzos para compartir
    5 de junio de 2023
    por Alan Morrison
  • ¿Pueden quedarse atrás aquellos con experiencia en IA?
    5 de junio de 2023
    por ajitjaokar
  • La IA como catalizador del éxito financiero en los ASC: liberando el potencial de ingresos
    5 de junio de 2023
    por John Lee
  • El futuro de ChatGPT en el cuidado de la salud: aplicaciones potenciales
    5 de junio de 2023
    por Alexandra Whitt
  • Inteligencia artificial: un desafío de la junta directiva – Parte I
    5 de junio de 2023
    por Bill Schmarzo
  • Desarrollo web de pila completa .NET vs. Desarrollo web Java Full Stack: ¿cuál es mejor?
    2 de junio de 2023
    por Ankit Dixit
  • Reglas humanas para la singularidad de la IA
    1 de junio de 2023
    por dan allen
  • Cómo los medios aprovechan la aritmética para crear clickbait
    1 de junio de 2023
    por Vicente Granville
  • Las razones para llevar a cabo el desmantelamiento del centro de datos
    31 de mayo de 2023
    por Karen Antonio
  • Enfoque moderno de calidad de datos
    31 de mayo de 2023
    por Vanitha
  • Las 4 principales certificaciones de ciberseguridad que harán que te contraten
    31 de mayo de 2023
    por Aileen Scott
  • Sistemas de calificación automatizados: cómo la IA está revolucionando la evaluación de exámenes
    31 de mayo de 2023
    por Erika Balla

Recomendado:  Enso Connect integra GPT-4 para simplificar las operaciones de alquiler a corto plazo

Imagen de la semana

DSC Weekly 6 de junio de 2023: la parte que falta en LLM y sistemas similares a GPT