Pembelajaran mesin boleh membantu mendedahkan zarah yang belum ditemui dalam data daripada Large Hadron Collider

Taburan skor anomali daripada AE untuk data dan lima penanda aras model BSM. Kredit: *Kajian Surat fizikal* (2024). DOI: 10.1103/PhysRevLett.132.081801

Para saintis menggunakan rangkaian saraf, sejenis algoritma pembelajaran mesin yang diilhamkan oleh otak, untuk menapis data perlanggaran zarah dalam jumlah besar. Ahli fizik zarah ditugaskan untuk melombong stor data perlanggaran yang besar dan berkembang ini untuk bukti zarah yang belum ditemui. Khususnya, mereka sedang mencari zarah yang tidak termasuk dalam Model Standard fizik zarah, pemahaman semasa kami tentang solekan alam semesta yang disyaki saintis adalah tidak lengkap.

Sebagai sebahagian daripada kerjasama ATLAS, saintis di Makmal Kebangsaan Argonne Jabatan Tenaga (JAS) AS dan rakan sekerja mereka baru-baru ini menggunakan pendekatan pembelajaran mesin yang dipanggil pengesanan anomali untuk menganalisis sejumlah besar data ATLAS. Kaedah ini tidak pernah digunakan sebelum ini pada data daripada eksperimen collider. Ia berpotensi untuk meningkatkan kecekapan pencarian kerjasama untuk sesuatu yang baharu. Kerjasama itu melibatkan saintis daripada 172 organisasi penyelidikan.

Pasukan itu memanfaatkan jenis algoritma pembelajaran mesin yang diilhamkan oleh otak yang dipanggil rangkaian saraf untuk mencari data untuk ciri atau anomali yang tidak normal. Teknik ini memecah daripada kaedah yang lebih tradisional untuk mencari fizik baharu. Ia bebas daripada—dan oleh itu tidak dihalang oleh—prasangka saintis.

Secara tradisinya, saintis ATLAS telah bergantung pada model teori untuk membantu membimbing percubaan dan analisis mereka ke arah yang paling menjanjikan untuk penemuan. Ini selalunya melibatkan pelaksanaan simulasi komputer yang kompleks untuk menentukan bagaimana aspek tertentu data perlanggaran akan kelihatan mengikut Model Standard.

Para saintis membandingkan ramalan Model Standard ini dengan data sebenar daripada ATLAS. Mereka juga membandingkannya dengan ramalan yang dibuat oleh model fizik baharu, seperti yang cuba menerangkan jirim gelap dan fenomena lain yang tidak diketahui oleh Model Standard.

Tetapi setakat ini, tiada penyelewengan daripada Model Standard telah diperhatikan dalam berbilion bilion perlanggaran yang direkodkan di ATLAS. Dan sejak penemuan boson Higgs pada 2012, percubaan ATLAS masih belum menemui sebarang zarah baharu.

"Pengesanan anomali adalah cara yang sangat berbeza untuk mendekati carian ini," kata Sergei Chekanov, seorang ahli fizik di bahagian Fizik Tenaga Tinggi Argonne dan pengarang utama dalam kajian itu. "Daripada mencari penyimpangan yang sangat spesifik, matlamatnya adalah untuk mencari tandatangan luar biasa dalam data yang belum diterokai sepenuhnya, dan itu mungkin kelihatan berbeza daripada apa yang diramalkan oleh teori kami."

Untuk melakukan analisis jenis ini, saintis mewakili setiap interaksi zarah dalam data sebagai imej yang menyerupai kod QR. Kemudian, pasukan itu melatih rangkaian saraf mereka dengan mendedahkannya kepada 1% daripada imej.

Paparan acara ATLAS untuk salah satu daripada lapan peristiwa yang menyumbang kepada sisihan terbesar daripada ramalan Model Standard yang ditemui oleh rangkaian saraf dalam kajian ini. Kredit: CERN

Rangkaian ini terdiri daripada kira-kira 2 juta nod yang saling berkaitan, yang serupa dengan neuron di otak. Tanpa bimbingan atau campur tangan manusia, ia mengenal pasti dan mengingati korelasi antara piksel dalam imej yang mencirikan interaksi Model Standard. Dalam erti kata lain, ia belajar untuk mengenali peristiwa biasa yang sesuai dalam ramalan Model Standard.

Selepas latihan, saintis memberi makan 99% imej yang lain melalui rangkaian saraf untuk mengesan sebarang anomali. Apabila diberikan imej sebagai input, rangkaian saraf ditugaskan untuk mencipta semula imej menggunakan pemahamannya tentang data secara keseluruhan.

"Jika rangkaian saraf menemui sesuatu yang baru atau luar biasa, ia menjadi keliru dan sukar untuk membina semula imej itu," kata Chekanov. "Jika terdapat perbezaan besar antara imej input dan output yang dihasilkannya, ia memberitahu kami bahawa mungkin ada sesuatu yang menarik untuk diterokai ke arah itu."

Menggunakan sumber pengiraan di Pusat Sumber Pengkomputeran Makmal Argonne, rangkaian saraf menganalisis sekitar 160 juta peristiwa dalam data LHC Run-2 yang dikumpul dari 2015 hingga 2018.

Walaupun rangkaian saraf tidak menemui sebarang tanda fizik baharu yang jelas dalam set data ini, ia telah mengesan satu anomali yang difikirkan oleh saintis patut dikaji lebih lanjut. Pereputan zarah eksotik pada tenaga sekitar 4.8 teraelektronvolt menghasilkan muon (sejenis zarah asas) dan pancutan zarah lain dalam cara yang tidak sesuai dengan pemahaman rangkaian saraf tentang interaksi Model Standard.

"Kami perlu melakukan lebih banyak siasatan," kata Chekanov. "Ia berkemungkinan turun naik statistik, tetapi ada kemungkinan pereputan ini boleh menunjukkan kewujudan zarah yang belum ditemui."

Pasukan merancang untuk menggunakan teknik ini pada data yang dikumpul semasa tempoh LHC Run-3, yang bermula pada 2022. Para saintis ATLAS akan terus meneroka potensi pembelajaran mesin dan pengesanan anomali sebagai alat untuk mencartakan wilayah yang tidak diketahui dalam fizik zarah.

Kertas itu diterbitkan dalam jurnal Kajian Surat fizikal.