Ускорение машинного обучения для физики элементарных частиц

Обновление: 9 декабря 2023 г.

Машинное обучение повсюду. Например, таким образом Spotify подсказывает, что слушать дальше или как Siri отвечает на ваши вопросы. И это тоже используется в физике элементарных частиц, от теоретических расчетов до анализа данных. Теперь команда, в которую входят исследователи из CERN и Google, разработала новый метод ускорения глубоких нейронных сетей - разновидность алгоритмов машинного обучения - для выбора протон-протонных столкновений на Большом адронном коллайдере (LHC) для дальнейшего анализа.

Детекторы частиц вокруг кольца LHC используют электронную аппаратную «триггерную» систему для выбора потенциально интересных столкновений частиц для дальнейшего анализа. При текущей скорости протон-протонных столкновений на LHC, до 1 миллиарда столкновений в секунду, программное обеспечение, используемое в настоящее время в триггерных системах детекторов, выбирает, выбирать ли столкновение в требуемое время, которое составляет всего микросекунду. . Но с учетом того, что частота столкновений увеличится в пять-семь раз с будущим модернизированным LHC, HL-LHC, исследователи изучают альтернативное программное обеспечение, включая алгоритмы машинного обучения, которые могли бы сделать этот выбор быстрее.

Примите участие в новом исследовании исследователей и сотрудников ЦЕРН, которое основано на предыдущей работе, в которой был представлен программный инструмент для развертывания глубоких нейронных сетей на типе оборудования, называемом программируемыми вентильными матрицами (ПЛИС), которые можно запрограммировать для выполнения различных задач. задачи, включая выбор интересующих столкновений частиц. Исследователи CERN и их коллеги разработали методику, которая уменьшает размер глубокой нейронной сети в 50 раз и обеспечивает время обработки сети в десятки наносекунд, что намного меньше времени, доступного для выбора, сохранить или отменить коллизию.

«Методика сводится к сжатию глубинной нейронной сети за счет снижения числовой точности параметров, которые ее описывают», - говорит соавтор исследования и исследователь ЦЕРН Владимир Лончар. «Это делается во время обучения или обучения сети, что позволяет сети адаптироваться к изменениям. Таким образом, вы можете уменьшить размер сети и время обработки без потери производительности сети ».

Кроме того, этот метод может найти, какая числовая точность лучше всего использовать с учетом определенных аппаратных ограничений, таких как количество доступных аппаратных ресурсов.

Если этого было недостаточно, то преимущество метода состоит в том, что его легко использовать для неспециалистов, и его можно использовать на ПЛИС в детекторах частиц и в других устройствах, которым требуются сети с быстрым временем обработки и небольшими размерами.

Заглядывая вперед, исследователи хотят использовать свою технику для разработки нового типа триггерной системы для обнаружения столкновений, которые обычно игнорируются обычным триггером. система но это могло скрыть новые явления. «Конечная цель - иметь возможность фиксировать столкновения, которые могут указывать на новую физику, выходящую за рамки Стандартной модели физики элементарных частиц», - говорит другой соавтор исследования и исследователь ЦЕРН Тея Ааррестад.