Machine learning voor deeltjesfysica versnellen

Update: 9 december 2023

Machine learning is overal. Het is bijvoorbeeld hoe Spotify je suggesties geeft waar je nu naar kunt luisteren of hoe Siri je vragen beantwoordt. En het wordt ook gebruikt in de deeltjesfysica, van theoretische berekeningen tot data-analyse. Nu heeft een team met onderzoekers van CERN en Google een nieuwe methode bedacht om diepe neurale netwerken - een vorm van algoritmen voor het leren van machines - te versnellen voor het selecteren van proton-protonbotsingen bij de Large Hadron Collider (LHC) voor verdere analyse.

De deeltjesdetectoren rond de LHC-ring gebruiken een elektronisch hardware-triggersysteem om potentieel interessante deeltjesbotsingen te selecteren voor verdere analyse. Met de huidige snelheid van proton-protonbotsingen bij de LHC, tot wel 1 miljard botsingen per seconde, kiest de software die momenteel wordt gebruikt op de triggersystemen van de detectoren om al dan niet een botsing te selecteren binnen de vereiste tijd, wat slechts een microseconde is . Maar nu de botsingssnelheid met een factor vijf tot zeven zal toenemen met de toekomstige verbeterde LHC, de HL-LHC, onderzoeken onderzoekers alternatieve software, waaronder algoritmen voor machine learning, die deze keuze sneller zouden kunnen maken.

Doe mee aan de nieuwe studie van CERN-onderzoekers en collega's, die voortbouwt op eerder werk dat een softwaretool introduceerde om diepe neurale netwerken in te zetten op een type hardware, field-programmable gate arrays (FPGA's) genaamd, die kunnen worden geprogrammeerd om verschillende taken, waaronder het selecteren van interessante deeltjesbotsingen. De CERN-onderzoekers en hun collega's ontwikkelden een techniek die de omvang van een diep neuraal netwerk met een factor 50 verkleint en een netwerkverwerkingstijd van tientallen nanoseconden behaalt - ruim onder de beschikbare tijd om te kiezen of een botsing moet worden opgeslagen of verwijderd.

"De techniek komt neer op het comprimeren van het diepe neurale netwerk door de numerieke precisie van de parameters die het beschrijven te verminderen", zegt co-auteur van de studie en CERN-onderzoeker Vladimir Loncar. “Dit gebeurt tijdens het trainen, of leren, van het netwerk, waardoor het netwerk zich kan aanpassen aan de verandering. Op deze manier kunt u de netwerkomvang en verwerkingstijd verminderen, zonder verlies van netwerkprestaties.”

Bovendien kan de techniek bepalen welke numerieke precisie het beste kan worden gebruikt, gegeven bepaalde hardwarebeperkingen, zoals de hoeveelheid beschikbare hardwarebronnen.

Alsof dat nog niet genoeg was, heeft de techniek het voordeel dat ze gemakkelijk te gebruiken is voor niet-experts en kan worden gebruikt op FPGA's in deeltjesdetectoren en in andere apparaten die netwerken vereisen met snelle verwerkingstijden en kleine afmetingen.

Vooruitkijkend willen de onderzoekers hun techniek gebruiken om een ​​nieuw soort triggersysteem te ontwerpen voor het opsporen van botsingen die normaal gesproken zouden worden weggegooid door een conventionele trigger system maar dat zou nieuwe verschijnselen kunnen verbergen. "Het uiteindelijke doel is om botsingen vast te leggen die zouden kunnen wijzen op nieuwe fysica die verder gaat dan het standaardmodel van de deeltjesfysica", zegt een andere co-auteur van de studie en CERN-onderzoeker Thea Aarrestad.