Acelerar el aprendizaje automático para la física de partículas

Actualización: 9 de diciembre de 2023

El aprendizaje automático está en todas partes. Por ejemplo, es la forma en que Spotify te da sugerencias sobre qué escuchar a continuación o cómo Siri responde tus preguntas. Y también se utiliza en física de partículas, desde cálculos teóricos hasta análisis de datos. Ahora, un equipo que incluye investigadores del CERN y Google ha ideado un nuevo método para acelerar las redes neuronales profundas, una forma de algoritmos de aprendizaje automático, para seleccionar colisiones protón-protón en el Gran Colisionador de Hadrones (LHC) para un análisis más detallado.

Los detectores de partículas alrededor del anillo del LHC utilizan un sistema de “activación” de hardware electrónico para seleccionar colisiones de partículas potencialmente interesantes para un análisis más detallado. Con la tasa actual de colisiones protón-protón en el LHC, hasta mil millones de colisiones por segundo, el software actualmente en uso en los sistemas de disparo de los detectores elige si seleccionar o no una colisión en el tiempo requerido, que es un mero microsegundo. . Pero con la tasa de colisión configurada para aumentar en un factor de cinco a siete con el futuro LHC actualizado, el HL-LHC, los investigadores están explorando software alternativo, incluidos algoritmos de aprendizaje automático, que podrían acelerar esta elección.

Ingrese al nuevo estudio realizado por investigadores y colaboradores del CERN, que se basa en trabajos anteriores que introdujeron una herramienta de software para implementar redes neuronales profundas en un tipo de hardware, llamado arreglos de puertas programables en campo (FPGA), que se pueden programar para realizar diferentes tareas, incluida la selección de colisiones de partículas de interés. Los investigadores del CERN y sus colegas desarrollaron una técnica que reduce el tamaño de una red neuronal profunda en un factor de 50 y logra un tiempo de procesamiento de red de decenas de nanosegundos, muy por debajo del tiempo disponible para elegir si guardar o descartar una colisión.

“La técnica se reduce a comprimir la red neuronal profunda reduciendo la precisión numérica de los parámetros que la describen”, dice el coautor del estudio e investigador del CERN Vladimir Loncar. “Esto se hace durante la formación, o aprendizaje, de la red, permitiendo que la red se adapte al cambio. De esta manera, puede reducir el tamaño de la red y el tiempo de procesamiento, sin perder el rendimiento de la red ".

Además, la técnica puede encontrar qué precisión numérica es mejor usar dadas ciertas restricciones de hardware, como la cantidad de recursos de hardware disponibles.

Si eso no fuera suficiente, la técnica tiene la ventaja de que es fácil de usar para los no expertos y se puede usar en FPGA en detectores de partículas y en otros dispositivos que requieren redes con tiempos de procesamiento rápidos y tamaños pequeños.

De cara al futuro, los investigadores quieren usar su técnica para diseñar un nuevo tipo de sistema de disparo para detectar colisiones que normalmente serían descartadas por un disparador convencional. te pero eso podría esconder nuevos fenómenos. “El objetivo final es poder capturar colisiones que podrían apuntar a una nueva física más allá del Modelo Estándar de física de partículas”, dice otro coautor del estudio e investigador del CERN, Thea Aarrestad.