DSC Weekly 6 de junio de 2023: la parte que falta en LLM y sistemas similares a GPT

Anuncios

Los atacantes tienen muchas oportunidades para atacar aplicaciones empresariales en el sitio y basadas en la nube desde el principio del proceso de desarrollo. Pero muchas soluciones y herramientas, como el marco DevSecOps emergente, están disponibles para proteger mejor las aplicaciones y garantizar que se priorice la seguridad dentro de DevOps y las herramientas de prueba de seguridad de aplicaciones. Sintonice la cumbre de seguridad de aplicaciones efectivas para escuchar a los principales expertos analizar cómo proteger las aplicaciones en la infraestructura de su empresa con estrategias como DevSecOps junto con la combinación correcta de herramientas y pruebas.

Las empresas de servicios financieros están experimentando cambios de imagen completos a medida que modifican su visión, recursos y estrategia de liderazgo para seguir siendo competitivas en el mundo digital. Únase a la cumbre de Transformación digital para servicios financieros para aprender a transformarse estratégicamente, creando una primera estrategia digital que combina tecnologías emergentes como IA, análisis, blockchain y más con el talento y las formas de trabajo adecuados para optimizar la eficiencia, reforzar la resiliencia y conducir a largo plazo. -éxito a largo plazo.

La parte que falta en LLM y sistemas similares a GPT

En estos días, todo lo que se habla de IA es sobre GPT (Transformador preentrenado generativo), LLM (Modelos de lenguaje grande), IA generativa, ingeniería rápida y tecnologías relacionadas. Debes vivir solo en una pequeña isla si nunca has escuchado estas palabras.

LLM se originó a partir de NLP (procesamiento de lenguaje natural) que dio lugar a NLG (generación de lenguaje natural) antes de convertirse en lo que es hoy. Las redes neuronales profundas como GAN (red antagónica generativa) son uno de los componentes. Otro es recopilar grandes cantidades de datos de texto no estructurados y categorizarlos. Esto se logra rastreando sitios web como Wikipedia, ArXiv (preprints e investigación científica), comunidades de foros de Stack Exchange, GitHub, contenido de LinkedIn, noticias en línea, otros repositorios grandes e incluso conversaciones de Facebook o páginas de resultados de búsqueda de Google. Comenzando con 1,000 palabras clave iniciales, observando lo que devuelve Google y rastreando recursivamente todos los enlaces encontrados, en un par de meses se creará una base de datos con miles de millones de páginas web, cubriendo el 95% del tráfico de Internet.

Existen técnicas para categorizar estos datos no estructurados: he desarrollado la mía propia e implementado esos rastreadores inteligentes, algunos discutidos en mis libros. Al final, puede crear fácilmente un motor de búsqueda mejor que los más populares del mercado. Debido a su monopolio, su incentivo para innovar es pequeño y son manipulados por spammers y otros actores que encuentran formas de llevar su contenido a la cima.

El siguiente paso fue desarrollar una interfaz más amigable. En lugar de devolver enlaces con un pequeño resumen, redacta respuestas completas a sus preguntas. Esto es lo que hacen herramientas como ChatGPT. También será manipulado de la misma manera que Google, al final.

Existe una técnica que podría mejorar mucho estos sistemas: puntuar las fuentes de entrada. Ya sea un editor, un canal específico, un sitio web, un usuario de Facebook, un periodista o un autor. El puntaje adjunto a una fuente, más específicamente un conjunto de puntajes, cada uno de los cuales mide un atributo específico, le indica qué tan confiable es una información. Es probable que una cuenta de LinkedIn nueva con pocas conexiones, con una imagen que muestre a una mujer joven atractiva y ligeramente vestida que solo tiene contactos con hombres viejos y adinerados, desencadene una puntuación baja, en comparación con alguien que recibe constantemente buenos comentarios y reseñas (a menos que la buena retroalimentación es creada por un anillo de cuentas falsas, que es fácil de detectar).

No se trata solo de clasificar la información como confiable o no. Puede asignar etiquetas como «exagerado», «políticamente sesgado» (conservador, liberal, etc.), «no verificado», y la lista continúa. Cada fuente podría asignarse a varias etiquetas, cada una con una probabilidad determinada por el algoritmo de puntuación. Por ejemplo, una fuente podría clasificarse como exagerada y real. Y estos puntajes se actualizarían diariamente.

Un beneficio, además de advertir al usuario, es evitar la incoherencia cuando GPT responde una pregunta. Si una respuesta se basa en una combinación de fuentes (algunas liberales, otras conservadoras), puede decir una cosa en un párrafo y lo contrario en el párrafo siguiente. Utilizando las puntuaciones, la respuesta podría incluir los dos argumentos contradictorios y explicar fácilmente por qué es así. Los usuarios también pueden optar por recibir la respuesta que quieren escuchar (independientemente de la veracidad), eligiendo parámetros asociados con el motor de puntuación. El sistema de puntuación podría ser bastante sofisticado, y no clasificar automáticamente las declaraciones como «información errónea» solo porque el Joe promedio e incluso los científicos de renombre lo digan, sino como «controvertidas». A veces, es porque la información en cuestión aún no ha pasado la prueba del tiempo.

Finalmente, también puede calificar la salida (las respuestas), no solo las fuentes de entrada. Esta es un área en la que actualmente participo activamente, con patentes ya otorgadas y tecnología que comencé a desarrollar hace años.

Vicente Granville, Colaborador

Comuníquese con el equipo de DSC si está interesado en contribuir.

Artículos destacados de DSC

10 formas de simplificar la calidad de los datos y los esfuerzos para compartir
5 de junio de 2023
por Alan Morrison
¿Pueden quedarse atrás aquellos con experiencia en IA?
5 de junio de 2023
por ajitjaokar
La IA como catalizador del éxito financiero en los ASC: liberando el potencial de ingresos
5 de junio de 2023
por John Lee

El futuro de ChatGPT en el cuidado de la salud: aplicaciones potenciales
5 de junio de 2023
por Alexandra Whitt
Inteligencia artificial: un desafío de la junta directiva – Parte I
5 de junio de 2023
por Bill Schmarzo
Desarrollo web de pila completa .NET vs. Desarrollo web Java Full Stack: ¿cuál es mejor?
2 de junio de 2023
por Ankit Dixit

Reglas humanas para la singularidad de la IA
1 de junio de 2023
por dan allen
Cómo los medios aprovechan la aritmética para crear clickbait
1 de junio de 2023
por Vicente Granville
Las razones para llevar a cabo el desmantelamiento del centro de datos
31 de mayo de 2023
por Karen Antonio

Enfoque moderno de calidad de datos
31 de mayo de 2023
por Vanitha
Las 4 principales certificaciones de ciberseguridad que harán que te contraten
31 de mayo de 2023
por Aileen Scott
Sistemas de calificación automatizados: cómo la IA está revolucionando la evaluación de exámenes
31 de mayo de 2023
por Erika Balla

Imagen de la semana

DSC Weekly 6 de junio de 2023: la parte que falta en LLM y sistemas similares a GPT