Beschleunigung des maschinellen Lernens für die Teilchenphysik

Update: 9. Dezember 2023

Maschinelles Lernen ist überall. So gibt dir Spotify beispielsweise Vorschläge, was du als nächstes hören solltest oder wie Siri deine Fragen beantwortet. Und es wird auch in der Teilchenphysik verwendet, von theoretischen Berechnungen bis hin zur Datenanalyse. Nun hat ein Team aus Forschern von CERN und Google eine neue Methode entwickelt, um tiefe neuronale Netze – eine Form von maschinellen Lernalgorithmen – zu beschleunigen, um Proton-Proton-Kollisionen am Large Hadron Collider (LHC) für die weitere Analyse auszuwählen.

Die Partikeldetektoren rund um den LHC-Ring verwenden ein elektronisches Hardware-„Trigger“-System, um potenziell interessante Partikelkollisionen für die weitere Analyse auszuwählen. Bei der aktuellen Rate der Proton-Proton-Kollisionen am LHC von bis zu 1 Milliarde Kollisionen pro Sekunde entscheidet die Software, die derzeit auf den Triggersystemen der Detektoren verwendet wird, ob eine Kollision in der erforderlichen Zeit, die nur eine Mikrosekunde beträgt, ausgewählt wird oder nicht . Da sich die Kollisionsrate jedoch mit dem zukünftigen aktualisierten LHC, dem HL-LHC, um den Faktor fünf bis sieben erhöhen wird, untersuchen die Forscher alternative Software, einschließlich Algorithmen für maschinelles Lernen, die diese Wahl schneller machen könnten.

Nehmen Sie an der neuen Studie von CERN-Forschern und -Mitarbeitern teil, die auf früheren Arbeiten aufbaut, die ein Software-Tool zur Bereitstellung tiefer neuronaler Netze auf einer Art von Hardware namens Field Programmable Gate Arrays (FPGAs) vorstellten, die für verschiedene Funktionen programmiert werden können Aufgaben, einschließlich der Auswahl von Teilchenkollisionen von Interesse. Die CERN-Forscher und ihre Kollegen entwickelten eine Technik, die die Größe eines tiefen neuronalen Netzwerks um den Faktor 50 reduziert und eine Netzwerkverarbeitungszeit von mehreren zehn Nanosekunden erreicht – weit unter der Zeit, die zur Verfügung steht, um eine Kollision zu speichern oder zu verwerfen.

„Die Technik läuft darauf hinaus, das tiefe neuronale Netzwerk zu komprimieren, indem die numerische Präzision der Parameter, die es beschreiben, reduziert wird“, sagt Mitautor der Studie und CERN-Forscher Vladimir Loncar. „Dies geschieht während des Trainings oder Lernens des Netzwerks, sodass sich das Netzwerk an die Veränderung anpassen kann. Auf diese Weise können Sie die Netzwerkgröße und die Verarbeitungszeit reduzieren, ohne die Netzwerkleistung einzubüßen.“

Darüber hinaus kann die Technik ermitteln, welche numerische Genauigkeit bei bestimmten Hardwarebeschränkungen, wie beispielsweise der Menge der verfügbaren Hardwareressourcen, am besten zu verwenden ist.

Als ob das nicht genug wäre, hat die Technik den Vorteil, dass sie für Nicht-Experten einfach zu handhaben ist und auf FPGAs in Partikeldetektoren und anderen Geräten verwendet werden kann, die Netzwerke mit schnellen Verarbeitungszeiten und kleinen Größen erfordern.

Mit Blick auf die Zukunft wollen die Forscher mit ihrer Technik ein neuartiges Triggersystem entwickeln, um Kollisionen zu erkennen, die normalerweise von einem herkömmlichen Trigger verworfen würden System aber das könnte neue Phänomene verbergen. „Das ultimative Ziel ist es, Kollisionen zu erfassen, die auf eine neue Physik jenseits des Standardmodells der Teilchenphysik hinweisen könnten“, sagt eine weitere Mitautorin der Studie und CERN-Forscherin Thea Aarrestad.