Học máy có thể giúp tiết lộ các hạt chưa được khám phá trong dữ liệu từ Máy Va chạm Hadron Lớn

Học máy có thể giúp tiết lộ các hạt chưa được khám phá trong dữ liệu từ Máy Va chạm Hadron Lớn
Phân phối điểm bất thường từ AE cho dữ liệu và năm mô hình BSM chuẩn. Tín dụng: Physical Review Letters (2024). DOI: 10.1103/PhysRevLett.132.081801

Các nhà khoa học đã sử dụng mạng lưới thần kinh, một loại thuật toán học máy lấy cảm hứng từ não, để sàng lọc khối lượng lớn dữ liệu va chạm hạt. Các nhà vật lý hạt được giao nhiệm vụ khai thác kho dữ liệu va chạm khổng lồ và ngày càng tăng này để tìm bằng chứng về các hạt chưa được khám phá. Đặc biệt, họ đang tìm kiếm các hạt không có trong Mô hình Chuẩn của vật lý hạt, sự hiểu biết hiện tại của chúng ta về cấu tạo của vũ trụ mà các nhà khoa học nghi ngờ là chưa đầy đủ.


Là một phần của sự hợp tác ATLAS, các nhà khoa học tại Phòng thí nghiệm quốc gia Argonne của Bộ Năng lượng Hoa Kỳ (DOE) và các đồng nghiệp của họ gần đây đã sử dụng phương pháp học máy gọi là phát hiện bất thường để phân tích khối lượng lớn dữ liệu ATLAS. Phương pháp này trước đây chưa bao giờ được áp dụng cho dữ liệu từ thí nghiệm máy va chạm. Nó có khả năng nâng cao hiệu quả của việc cộng tác tìm kiếm điều gì đó mới mẻ. Sự hợp tác có sự tham gia của các nhà khoa học từ 172 tổ chức nghiên cứu.

Nhóm đã tận dụng một loại thuật toán học máy lấy cảm hứng từ não gọi là mạng lưới thần kinh để tìm kiếm dữ liệu về các đặc điểm bất thường hoặc bất thường. Kỹ thuật này phá vỡ các phương pháp tìm kiếm vật lý mới truyền thống hơn. Nó độc lập với—và do đó không bị ràng buộc bởi—các định kiến ​​của các nhà khoa học.

Theo truyền thống, các nhà khoa học ATLAS dựa vào các mô hình lý thuyết để giúp hướng dẫn thí nghiệm và phân tích của họ theo những hướng hứa hẹn nhất cho khám phá. Điều này thường liên quan đến việc thực hiện các mô phỏng máy tính phức tạp để xác định các khía cạnh nhất định của dữ liệu va chạm sẽ trông như thế nào theo Mô hình Chuẩn.

Các nhà khoa học so sánh những dự đoán của Mô hình Chuẩn này với dữ liệu thực từ ATLAS. Họ cũng so sánh chúng với những dự đoán được đưa ra bởi các mô hình vật lý mới, giống như những dự đoán đang cố gắng giải thích vật chất tối và các hiện tượng khác mà Mô hình Chuẩn không tính đến.

Nhưng cho đến nay, không có sai lệch nào so với Mô hình Chuẩn được quan sát thấy trong hàng tỷ tỷ vụ va chạm được ghi nhận tại ATLAS. Và kể từ khi phát hiện ra boson Higgs vào năm 2012, thí nghiệm ATLAS vẫn chưa tìm thấy hạt mới nào.

Sergei Chekanov, nhà vật lý thuộc bộ phận Vật lý Năng lượng Cao của Argonne và là tác giả chính của nghiên cứu cho biết: “Phát hiện sự bất thường là một cách rất khác để tiếp cận cuộc tìm kiếm này”. “Thay vì tìm kiếm những sai lệch rất cụ thể, mục tiêu là tìm ra những dấu hiệu bất thường trong dữ liệu hoàn toàn chưa được khám phá và dữ liệu đó có thể trông khác với những gì lý thuyết của chúng tôi dự đoán.”

Để thực hiện kiểu phân tích này, các nhà khoa học đã biểu diễn từng tương tác hạt trong dữ liệu dưới dạng hình ảnh giống với mã QR. Sau đó, nhóm đã huấn luyện mạng lưới thần kinh của mình bằng cách hiển thị nó trước 1% số hình ảnh.

Hiển thị sự kiện ATLAS cho một trong tám sự kiện góp phần tạo ra sai lệch lớn nhất so với các dự đoán của Mô hình Chuẩn mà mạng lưới thần kinh tìm thấy trong nghiên cứu này. Tín dụng: CERN

Mạng bao gồm khoảng 2 triệu nút được kết nối với nhau, tương tự như các tế bào thần kinh trong não. Không có sự hướng dẫn hay can thiệp của con người, nó đã xác định và ghi nhớ mối tương quan giữa các pixel trong hình ảnh đặc trưng cho các tương tác của Mô hình Chuẩn. Nói cách khác, nó đã học cách nhận biết các sự kiện điển hình phù hợp với các dự đoán của Mô hình Chuẩn.

Sau khi đào tạo, các nhà khoa học đã đưa 99% hình ảnh còn lại vào mạng lưới thần kinh để phát hiện bất kỳ điểm bất thường nào. Khi đưa một hình ảnh làm đầu vào, mạng lưới thần kinh có nhiệm vụ tái tạo hình ảnh bằng cách sử dụng sự hiểu biết về toàn bộ dữ liệu.

Chekanov cho biết: “Nếu mạng lưới thần kinh gặp phải điều gì đó mới hoặc bất thường, nó sẽ bị nhầm lẫn và gặp khó khăn trong việc tái tạo lại hình ảnh”. “Nếu có sự khác biệt lớn giữa hình ảnh đầu vào và đầu ra mà nó tạo ra, nó cho chúng tôi biết rằng có thể có điều gì đó thú vị để khám phá theo hướng đó.”

Sử dụng tài nguyên tính toán tại Trung tâm tài nguyên máy tính trong phòng thí nghiệm của Argonne, mạng nơ-ron đã phân tích khoảng 160 triệu sự kiện trong dữ liệu LHC Run-2 được thu thập từ năm 2015 đến năm 2018.

Mặc dù mạng lưới thần kinh không tìm thấy bất kỳ dấu hiệu rõ ràng nào về vật lý mới trong bộ dữ liệu này, nhưng nó đã phát hiện ra một điểm bất thường mà các nhà khoa học cho rằng đáng để nghiên cứu thêm. Một phân rã hạt kỳ lạ ở năng lượng khoảng 4.8 teraelectronvolt sẽ tạo ra muon (một loại hạt cơ bản) và một dòng hạt khác theo cách không phù hợp với sự hiểu biết của mạng lưới thần kinh về tương tác Mô hình Chuẩn.

Chekanov nói: “Chúng tôi sẽ phải điều tra thêm. “Nó có thể là một dao động thống kê, nhưng có khả năng sự phân rã này có thể chỉ ra sự tồn tại của một hạt chưa được khám phá.”

Nhóm dự định áp dụng kỹ thuật này cho dữ liệu được thu thập trong giai đoạn LHC Run-3, bắt đầu vào năm 2022. Các nhà khoa học ATLAS sẽ tiếp tục khám phá tiềm năng của học máy và phát hiện dị thường như những công cụ để lập biểu đồ lãnh thổ chưa biết trong vật lý hạt.

Bài báo được xuất bản trên tạp chí Physical Review Letters.