Machine learning zou kunnen helpen onontdekte deeltjes te onthullen in gegevens van de Large Hadron Collider

Verdelingen van de anomaliescore van de AE voor gegevens en vijf benchmark-BSM-modellen. Credit: *Physical Review Letters* (2024). DOI: 10.1103/PhysRevLett.132.081801

Wetenschappers gebruikten een neuraal netwerk, een soort op de hersenen geïnspireerd machine learning-algoritme, om grote hoeveelheden deeltjesbotsingsgegevens te doorzoeken. Deeltjesfysici hebben de taak om deze enorme en groeiende opslagplaats van botsingsgegevens te ontginnen op zoek naar bewijs van onontdekte deeltjes. In het bijzonder zoeken ze naar deeltjes die niet zijn opgenomen in het Standaardmodel van de deeltjesfysica; ons huidige begrip van de samenstelling van het universum waarvan wetenschappers vermoeden dat het onvolledig is.

Als onderdeel van de ATLAS-samenwerking hebben wetenschappers van het Argonne National Laboratory van het Amerikaanse Department of Energy (DOE) en hun collega's onlangs een machine learning-aanpak gebruikt, genaamd anomaliedetectie, om grote hoeveelheden ATLAS-gegevens te analyseren. De methode is nog nooit eerder toegepast op gegevens uit een botsingsexperiment. Het heeft het potentieel om de efficiëntie van de zoektocht van de samenwerking naar iets nieuws te verbeteren. Bij de samenwerking zijn wetenschappers van 172 onderzoeksorganisaties betrokken.

Het team maakte gebruik van een op de hersenen geïnspireerd type machine learning-algoritme, een neuraal netwerk genaamd, om de gegevens te doorzoeken op abnormale kenmerken of afwijkingen. De techniek breekt met meer traditionele methoden om naar nieuwe natuurkunde te zoeken. Het is onafhankelijk van – en daarom niet beperkt door – de vooroordelen van wetenschappers.

Traditioneel vertrouwden ATLAS-wetenschappers op theoretische modellen om hun experimenten en analyses te begeleiden in de richtingen die het meest veelbelovend waren voor ontdekking. Vaak gaat het hierbij om het uitvoeren van complexe computersimulaties om te bepalen hoe bepaalde aspecten van botsingsgegevens er volgens het Standaardmodel uit zouden zien.

Wetenschappers vergelijken deze voorspellingen van het standaardmodel met echte gegevens van ATLAS. Ze vergelijken ze ook met voorspellingen van nieuwe natuurkundige modellen, zoals modellen die donkere materie en andere verschijnselen proberen te verklaren die niet in het standaardmodel worden verklaard.

Maar tot nu toe zijn er bij de miljarden botsingen die bij ATLAS zijn geregistreerd geen afwijkingen van het standaardmodel waargenomen. En sinds de ontdekking van het Higgsdeeltje in 2012 heeft het ATLAS-experiment nog geen nieuwe deeltjes gevonden.

"Anomaliedetectie is een heel andere manier om deze zoektocht te benaderen", zegt Sergei Chekanov, natuurkundige bij de afdeling Hoge Energie Fysica van Argonne en hoofdauteur van het onderzoek. “In plaats van te zoeken naar zeer specifieke afwijkingen, is het doel ongebruikelijke kenmerken in de gegevens te vinden die volledig onontgonnen zijn, en die er anders uit kunnen zien dan wat onze theorieën voorspellen.”

Om dit soort analyses uit te voeren, vertegenwoordigden de wetenschappers elke deeltjesinteractie in de gegevens als een afbeelding die op een QR-code lijkt. Vervolgens trainde het team hun neurale netwerk door het bloot te stellen aan 1% van de beelden.

ATLAS-gebeurtenisweergave voor een van de acht gebeurtenissen die bijdragen aan de grootste afwijking van de voorspellingen van het standaardmodel die het neurale netwerk in dit onderzoek heeft gevonden. Krediet: CERN

Het netwerk bestaat uit ongeveer 2 miljoen onderling verbonden knooppunten, die analoog zijn aan neuronen in de hersenen. Zonder menselijke begeleiding of tussenkomst identificeerde en herinnerde het de correlaties tussen pixels in de afbeeldingen die karakteristiek zijn voor standaardmodelinteracties. Met andere woorden, het leerde typische gebeurtenissen herkennen die passen binnen de voorspellingen van het Standaardmodel.

Na de training voerden de wetenschappers de overige 99% van de beelden door het neurale netwerk om eventuele afwijkingen op te sporen. Wanneer een afbeelding als invoer wordt gegeven, wordt het neurale netwerk belast met het opnieuw creëren van de afbeelding met behulp van zijn begrip van de gegevens als geheel.

“Als het neurale netwerk iets nieuws of ongewoons tegenkomt, raakt het in de war en heeft het moeite om het beeld te reconstrueren”, zegt Tsjekanov. “Als er een groot verschil is tussen het invoerbeeld en de uitvoer die het produceert, laat het ons weten dat er misschien iets interessants te onderzoeken valt in die richting.”

Met behulp van computerbronnen in het Laboratory Computing Resource Center van Argonne analyseerde het neurale netwerk ongeveer 160 miljoen gebeurtenissen binnen LHC Run-2-gegevens verzameld tussen 2015 en 2018.

Hoewel het neurale netwerk geen opvallende tekenen van nieuwe natuurkunde in deze dataset heeft gevonden, heeft het wel één anomalie ontdekt die volgens de wetenschappers verder onderzoek waard is. Het verval van een exotisch deeltje met een energie van ongeveer 4.8 tera-elektronvolt resulteert in een muon (een soort fundamenteel deeltje) en een straal andere deeltjes op een manier die niet past bij het begrip van het neurale netwerk van standaardmodelinteracties.

'We zullen meer onderzoek moeten doen', zei Tsjekanov. “Het is waarschijnlijk een statistische fluctuatie, maar er is een kans dat dit verval zou kunnen duiden op het bestaan van een onontdekt deeltje.”

Het team is van plan deze techniek toe te passen op gegevens die zijn verzameld tijdens de LHC Run-3-periode, die in 2022 begon. ATLAS-wetenschappers zullen het potentieel van machinaal leren en anomaliedetectie blijven onderzoeken als hulpmiddelen voor het in kaart brengen van onbekend terrein in de deeltjesfysica.

Het artikel wordt gepubliceerd in het tijdschrift Physical Review Letters.