Saltar al contenido

El nuevo teorema demuestra que las redes neuronales convolucionales siempre se pueden entrenar en computadoras cuánticas, superando la amenaza de ‘mesetas estériles’ en los problemas de optimización

29 de octubre de 2021

Las redes neuronales convolucionales que se ejecutan en computadoras cuánticas han generado un gran revuelo por su potencial para analizar datos cuánticos mejor que las computadoras clásicas. Si bien un problema de resolución fundamental conocido como «mesetas estériles» ha limitado la aplicación de estas redes neuronales para grandes conjuntos de datos, una nueva investigación supera ese talón de Aquiles con una prueba rigurosa que garantiza la escalabilidad.

«La forma en que se construye una red neuronal cuántica puede conducir a una meseta estéril, o no», dijo Marco Cerezo, coautor del artículo titulado «Ausencia de mesetas estériles en redes neuronales convolucionales cuánticas», publicado hoy por un Laboratorio Nacional de Los Alamos. equipo en Revisión física X. Cerezo es un físico especializado en computación cuántica, aprendizaje de máquina cuántica e información cuántica en Los Alamos. «Demostramos la ausencia de mesetas estériles para un tipo especial de red neuronal cuántica. Nuestro trabajo proporciona garantías de capacidad de entrenamiento para esta arquitectura, lo que significa que uno puede entrenar genéricamente sus parámetros».

Como metodología de inteligencia artificial (IA), las redes neuronales convolucionales cuánticas se inspiran en la corteza visual. Como tales, involucran una serie de capas convolucionales, o filtros, intercalados con capas de agrupación que reducen la dimensión de los datos mientras mantienen características importantes de un conjunto de datos.

Estas redes neuronales se pueden utilizar para resolver una variedad de problemas, desde el reconocimiento de imágenes hasta el descubrimiento de materiales. Superar mesetas estériles es clave para extraer todo el potencial de las computadoras cuánticas en aplicaciones de inteligencia artificial y demostrar su superioridad sobre las computadoras clásicas.

Recomendado:  Zone7 recauda $ 8 millones en la serie A para expandir la plataforma de inteligencia artificial para predecir riesgos de lesiones deportivas

Hasta ahora, dijo Cerezo, los investigadores en aprendizaje automático cuántico analizaron cómo mitigar los efectos de las mesetas estériles, pero carecían de una base teórica para evitarlo por completo. El trabajo de Los Alamos muestra cómo algunas redes neuronales cuánticas son, de hecho, inmunes a las mesetas estériles.

«Con esta garantía en la mano, los investigadores ahora podrán examinar datos de computadoras cuánticas sobre sistemas cuánticos y usar esa información para estudiar las propiedades de los materiales o descubrir nuevos materiales, entre otras aplicaciones», dijo Patrick Coles, físico cuántico en Los Alamos. y coautor del artículo.

Surgirán muchas más aplicaciones para los algoritmos de IA cuántica, piensa Coles, a medida que los investigadores utilicen computadoras cuánticas a corto plazo con más frecuencia y generen más y más datos: todos los programas de aprendizaje automático están hambrientos de datos.

Evitando el degradado que se desvanece

«Toda esperanza de una aceleración o ventaja cuántica se pierde si se tiene una meseta estéril», dijo Cerezo.

El meollo del problema es un «gradiente que desaparece» en el panorama de la optimización. El paisaje está compuesto por colinas y valles, y el objetivo es entrenar los parámetros del modelo para encontrar la solución explorando la geografía del paisaje. La solución generalmente se encuentra en el fondo del valle más bajo, por así decirlo. Pero en un paisaje plano no se pueden entrenar los parámetros porque es difícil determinar qué dirección tomar.

Ese problema se vuelve particularmente relevante cuando aumenta el número de características de datos. De hecho, el paisaje se vuelve exponencialmente plano con el tamaño de la característica. Por lo tanto, en presencia de una meseta estéril, la red neuronal cuántica no se puede ampliar.

Recomendado:  agente invisible | febrero 2022

El equipo de Los Alamos desarrolló un enfoque gráfico novedoso para analizar la escala dentro de una red neuronal cuántica y demostrar su capacidad de entrenamiento.

Durante más de 40 años, los físicos han pensado que las computadoras cuánticas resultarían útiles para simular y comprender los sistemas cuánticos de partículas, que ahogan las computadoras clásicas convencionales. Se espera que el tipo de red neuronal convolucional cuántica que la investigación de Los Alamos ha demostrado ser sólida tenga aplicaciones útiles en el análisis de datos de simulaciones cuánticas.

«El campo del aprendizaje automático cuántico es todavía joven», dijo Coles. «Hay una cita famosa sobre los láseres, cuando se descubrieron por primera vez, que decía que eran una solución en la búsqueda de un problema. Ahora los láseres se usan en todas partes. De manera similar, algunos de nosotros sospechamos que los datos cuánticos estarán altamente disponibles, y luego los cuánticos. el aprendizaje automático despegará «.

Por ejemplo, la investigación se centra en materiales cerámicos como superconductores de alta temperatura, dijo Coles, lo que podría mejorar el transporte sin fricción, como los trenes de levitación magnética. Pero analizar datos sobre la gran cantidad de fases del material, que están influenciadas por la temperatura, la presión y las impurezas en estos materiales, y clasificar las fases es una tarea enorme que va más allá de las capacidades de las computadoras clásicas.

Usando una red neuronal cuántica escalable, una computadora cuántica podría examinar un vasto conjunto de datos sobre los diversos estados de un material dado y correlacionar esos estados con fases para identificar el estado óptimo para la superconducción de alta temperatura.

Recomendado:  Perspectivas sobre el mercado global de inteligencia artificial en contabilidad hasta 2027: la creciente demanda de procesos de contabilidad inteligentes presenta oportunidades - ResearchAndMarkets.com