banner

블로그

Sep 02, 2023

ALICE, 지속 가능한 컴퓨팅을 위한 역량 강화

완전히 새로운 컴퓨팅 모델인 O2 프로젝트의 설계 및 배포를 통해 ALICE 협업은 온라인 및 오프라인 데이터 처리를 단일 소프트웨어 프레임워크로 병합하여 Run 3 이상의 요구 사항에 대처할 수 있습니다. 볼커 린덴스트루스(Volker Lindenstruth)가 무대 뒤에서 움직입니다.

대형 강입자 충돌기(LHC)는 2022년 7월 5일 13.6 TeV의 기록적인 질량 중심 에너지에서 양성자-양성자 충돌이 실행 3에서 재개되면서 다시 살아났습니다. ALICE 협력이 증가된 순간 광도의 혜택을 누릴 수 있도록 하기 위해 이번 및 향후 LHC 실행 중 ALICE 실험은 Long Shutdown 2(2019~2022) 동안 대대적인 업그레이드를 거쳤으며, 이는 특히 낮은 운동량 입자에 대한 공간 정밀도 및 추적 효율성 측면에서 트랙 재구성을 크게 향상시킬 것입니다. 또한 업그레이드를 통해 연속 판독 모드에서 납-납(PbPb) 충돌에 대해 최대 50kHz의 상호 작용 속도가 향상되어 ALICE가 결합된 Run 1 및 Run 2 샘플보다 10배 이상 큰 데이터 샘플을 수집할 수 있습니다. .

ALICE는 극한 핵물질 연구에 전념하는 LHC의 독특한 실험입니다. 이는 중앙 배럴(가장 큰 데이터 생성자)과 전방 뮤온 "암"으로 구성됩니다. 중앙 배럴은 입자 추적을 위해 주로 4개의 하위 탐지기에 의존합니다. 7층, 12.5기가픽셀 모놀리식 실리콘 추적기인 새로운 내부 추적 시스템(ITS)(CERN Courier 2021년 7월/8월 p29); 지속적인 작동을 위해 GEM 기반 판독 기능을 갖춘 업그레이드된 시간 투영 챔버(TPC); 전이 방사선 검출기; 그리고 비행 시간 탐지기. 뮤온 팔은 새로 설치된 뮤온 전방 추적기(모놀리식 활성 픽셀 센서를 기반으로 한 실리콘 추적기), 개선된 뮤온 챔버 및 뮤온 식별자의 세 가지 추적 장치로 구성됩니다.

업그레이드된 ALICE 검출기의 데이터 용량 증가로 인해 Run 3에서 생성된 원시 데이터를 모두 저장하는 것은 불가능합니다. 따라서 최신 실행을 준비하기 위한 주요 ALICE 업그레이드 중 하나는 완전히 새로운 컴퓨팅 모델, 즉 온라인(동기) 및 오프라인(비동기) 데이터 처리를 단일 소프트웨어 프레임워크로 병합하는 O2 프로젝트의 설계 및 배포였습니다. 데이터 판독 및 처리를 위해 실험의 컴퓨팅 팜을 업그레이드하는 것 외에도 효율적인 온라인 압축과 처리 속도를 높이기 위한 그래픽 처리 장치(GPU)가 필요합니다.

이름에서 알 수 있듯이 GPU는 원래 특히 3D 게임에서 컴퓨터 그래픽 렌더링을 가속화하도록 설계되었습니다. GPU는 이러한 워크로드에 계속 활용되면서 다양한 설정에서 사용할 수 있는 범용 벡터 프로세서가 되었습니다. 여러 작업을 동시에 수행하는 본질적인 능력은 기존 CPU보다 훨씬 더 높은 컴퓨팅 처리량을 제공하고 데이터 캐싱이 아닌 데이터 처리에 최적화될 수 있도록 해줍니다. 따라서 GPU는 관련 컴퓨팅 팜의 비용과 에너지 소비를 줄입니다. GPU가 없으면 50kHz 상호 작용 속도로 PbPb 충돌 데이터의 ALICE TPC 온라인 처리를 처리하는 데 동일한 유형 및 기타 리소스의 약 8배 많은 서버가 필요합니다.

고급 트리거 온라인 컴퓨터 팜(HLT)이 가동된 2010년부터 ALICE 검출기는 고에너지 물리학의 데이터 압축 및 처리를 위해 GPU 사용을 개척했습니다. HLT는 검출기 판독 하드웨어에 직접 접근할 수 있었으며 중이온 충돌에서 얻은 데이터를 압축하는 데 중요했습니다. 또한 HLT 소프트웨어 프레임워크는 온라인 데이터 재구성을 수행할 수 있을 만큼 충분히 발전했습니다. LHC Run 1 및 2에서 운영하면서 얻은 경험은 현재 O2 소프트웨어 및 하드웨어 시스템의 설계 및 개발에 필수적이었습니다.

실행 3 중 데이터 판독 및 처리를 위해 ALICE 감지기 프런트 엔드 전자 장치는 내방사선 기가비트 트랜시버 링크를 통해 맞춤형 현장 프로그래밍 가능 게이트 어레이에 연결됩니다("데이터 흐름" 그림 참조). 후자는 첫 번째 수준 프로세서(FLP) 팜 노드에서 호스팅되며 지속적인 판독 및 제로 억제(물리적 신호 없이 데이터 제거)를 수행합니다. ALICE TPC의 경우 제로 억제는 50kHz 최소 바이어스 PbPb 작동을 위해 프런트 엔드의 3.3TB/s에서 900GB/s로 데이터 속도를 줄입니다. 그런 다음 이 데이터 스트림은 두 팜에서 실행되는 데이터 배포 소프트웨어를 사용하여 FLP 판독 팜에서 이벤트 처리 노드(EPN)로 푸시됩니다.

 0.1 GeV/c. Here the fake-track rate is rather negligible, however the clone rate increases significantly for low-pT primary tracks due to incomplete track merging of very low-momentum particles that curl in the ALICE solenoidal field and leave and enter the TPC multiple times./p>
공유하다