El Centro para la Comprensión de Sistemas Avanzados y los Laboratorios Nacionales Sandia han desarrollado los Algoritmos de Aprendizaje de Materiales (MALA), un método de simulación basado en el aprendizaje automático para la predicción de estructuras electrónicas. MALA supera a los métodos tradicionales al integrar el aprendizaje automático con algoritmos físicos, proporcionando una aceleración de más de 1000 veces para sistemas más pequeños y la capacidad de simular con precisión sistemas a gran escala de más de 100 000 átomos. Esta innovación está destinada a revolucionar la investigación aplicada y es altamente compatible con los sistemas informáticos de alto rendimiento.
El enfoque de aprendizaje profundo permite cálculos precisos de estructuras electrónicas a gran escala.
La disposición de los electrones en la materia, conocida como estructura electrónica, juega un papel crucial en la investigación fundamental pero también aplicada, como el diseño de fármacos y el almacenamiento de energía. Sin embargo, la falta de una técnica de simulación que ofrezca alta fidelidad y escalabilidad en diferentes escalas de tiempo y duración ha sido durante mucho tiempo un obstáculo para el progreso de estas tecnologías. Investigadores del Centro de Comprensión de Sistemas Avanzados (CASUS) de la Helmholtz-Zentrum Dresden-Rossendorf (HZDR) en Görlitz, Alemania, y Sandia National Laboratories en Albuquerque, Nuevo México, EE. UU., ahora han sido pioneros en un aprendizaje automáticobasado en un método de simulación (npj Computational Materials, DOI: 10.1038/s41524-023-01070-z) que reemplaza las técnicas tradicionales de simulación de estructuras electrónicas. Su pila de software de algoritmos de aprendizaje de materiales (MALA) permite el acceso a escalas de longitud previamente inalcanzables.
Los electrones son partículas elementales de fundamental importancia. Sus interacciones mecánicas cuánticas entre sí y con los núcleos atómicos dan lugar a una multitud de fenómenos observados en química y ciencia de los materiales. Comprender y controlar la estructura electrónica de la materia proporciona información sobre la reactividad de las moléculas, la estructura y el transporte de energía dentro de los planetas y los mecanismos de falla del material.
Instantánea de una simulación de aprendizaje profundo de más de 10 000 átomos de berilio. La distribución de electrones en este material se visualiza como nubes de puntos rojas (electrones deslocalizados) y azules (electrones ubicados cerca de los núcleos atómicos). Esta simulación no es factible utilizando el cálculo DFT convencional. Gracias a MALA, se logró en unos 5 minutos empleando solo 150 unidades centrales de procesamiento. Se han utilizado filtros gráficos para aumentar la inteligibilidad de la simulación. Las áreas blancas en los flecos también se deben a los filtros. El esquema en segundo plano sugiere cómo funciona el aprendizaje profundo. Crédito: HZDR / CASUS
Enfoque híbrido basado en el aprendizaje profundo
El equipo de investigadores presentó ahora un método de simulación novedoso llamado pila de software de algoritmos de aprendizaje de materiales (MALA). En informática, una pila de software es una colección de algoritmos y componentes de software que se combinan para crear una aplicación de software para resolver un problema en particular.
Lenz Fiedler, un Ph.D. estudiante y desarrollador clave de MALA en CASUS, explica: “MALA integra el aprendizaje automático con enfoques basados en la física para predecir la estructura electrónica de los materiales. Emplea un enfoque híbrido, utilizando un método de aprendizaje automático establecido llamado aprendizaje profundo para predecir con precisión cantidades locales, complementado con algoritmos físicos para calcular cantidades globales de interés”.
La pila de software MALA toma como entrada la disposición de los átomos en el espacio y genera huellas dactilares conocidas como componentes biespectro, que codifican la disposición espacial de los átomos alrededor de un punto de cuadrícula cartesiano. El modelo de aprendizaje automático en MALA está entrenado para predecir la estructura electrónica basada en este vecindario atómico. Una ventaja significativa de MALA es la capacidad de su modelo de aprendizaje automático de ser independiente del tamaño del sistema, lo que le permite entrenarse con datos de sistemas pequeños e implementarse a cualquier escala.
En su publicación, el equipo de investigadores mostró la notable eficacia de esta estrategia. Lograron una aceleración de más de 1000 veces para sistemas de menor tamaño, que constan de unos pocos miles de átomos, en comparación con los algoritmos convencionales. Además, el equipo demostró la capacidad de MALA para realizar con precisión cálculos de estructuras electrónicas a gran escala, con más de 100 000 átomos. En particular, este logro se logró con un esfuerzo computacional modesto, lo que revela las limitaciones de los códigos DFT convencionales.
Attila Cangi, jefe interino del Departamento de Materia en Condiciones Extremas de CASUS, explica: “A medida que aumenta el tamaño del sistema y hay más átomos involucrados, los cálculos DFT se vuelven poco prácticos, mientras que la ventaja de velocidad de MALA continúa creciendo. El avance clave de MALA radica en su capacidad para operar en entornos atómicos locales, lo que permite predicciones numéricas precisas que se ven mínimamente afectadas por el tamaño del sistema. Este logro innovador abre posibilidades computacionales que antes se consideraban inalcanzables”.
Se espera impulso a la investigación aplicada
Cangi tiene como objetivo ampliar los límites de los cálculos de estructuras electrónicas aprovechando el aprendizaje automático: “Anticipamos que MALA provocará una transformación en los cálculos de estructuras electrónicas, ya que ahora tenemos un método para simular sistemas significativamente más grandes a una velocidad sin precedentes. En el futuro, los investigadores podrán abordar una amplia gama de desafíos sociales basados en una línea de base significativamente mejorada, incluido el desarrollo de nuevas vacunas y materiales novedosos para el almacenamiento de energía, la realización de simulaciones a gran escala de dispositivos semiconductores, el estudio de defectos materiales y la exploración química. reacciones para convertir el dióxido de carbono del gas de efecto invernadero atmosférico en minerales amigables con el clima”.
Además, el enfoque de MALA es especialmente adecuado para la computación de alto rendimiento (HPC). A medida que crece el tamaño del sistema, MALA permite el procesamiento independiente en la cuadrícula computacional que utiliza, aprovechando de manera efectiva los recursos de HPC, en particular las unidades de procesamiento gráfico.
Siva Rajamanickam, científica del personal y experta en computación paralela en los Laboratorios Nacionales de Sandia, explica: “El algoritmo de MALA para cálculos de estructuras electrónicas se corresponde bien con los sistemas HPC modernos con aceleradores distribuidos. La capacidad de descomponer el trabajo y ejecutar en paralelo diferentes puntos de cuadrícula a través de diferentes aceleradores hace que MALA sea una combinación ideal para el aprendizaje automático escalable en los recursos de HPC, lo que lleva a una velocidad y eficiencia sin precedentes en los cálculos de estructuras electrónicas”.
Referencia: «Predicción de estructuras electrónicas a cualquier escala de longitud con aprendizaje automático» por Lenz Fiedler, Normand A. Modine, Steve Schmerler, Dayton J. Vogel, Gabriel A. Popoola, Aidan P. Thompson, Sivasankaran Rajamanickam y Attila Cangi, 27 de junio de 2023 , Materiales computacionales npj.
DOI: 10.1038/s41524-023-01070-z
Además de los socios en desarrollo HZDR y Sandia National Laboratories, MALA ya está empleada por instituciones y empresas como el Instituto de Tecnología de Georgia, la Universidad Estatal A&T de Carolina del Norte, Sambanova Systems Inc. y Nvidia Corp.