study on performance of jet finder algorithms at the lhc energy

72
Study on performance of jet finder algorithms at the LHC energy LHC 2012 2

Upload: trinhlien

Post on 29-Jan-2017

223 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Study on performance of jet finder algorithms at the LHC energy

이학 석사 학위논문

Study onperformance of jetfinder algorithms at the LHC

energy

LHC에너지에서의제트알고리즘성능에관한연구

2012년 2월

서울시립대학교대학원

물 리 학 과

류건모

Page 2: Study on performance of jet finder algorithms at the LHC energy

Study onperformance of jetfinder algorithms at the LHC

energy

LHC에너지에서의제트알고리즘성능에관한연구

지도교수 박인규

이논문을이학석사학위논문으로제출함

2011년 12월

서울시립대학교대학원

물리학과

류건모

Page 3: Study on performance of jet finder algorithms at the LHC energy

류건모의이학석사학위논문을인준함.

심 사 위 원 장 민현수 (인)

심 사 위 원 박동수 (인)

심 사 위 원 박인규 (인)

2011년 12월

서울시립대학교대학원

Page 4: Study on performance of jet finder algorithms at the LHC energy

국문초록

고에너지 물리학에서 매우 중요하게 다루는 부분으로 입자 가속기를 이용한 실험

을 들 수 있다. 현재 가장 높은 에너지를 낼 수 있는 스위스 제네바 CERN에 있

는 LHC가속기는 양성자-양성자 충돌을 바탕으로 힉스 입자 탐색을 통한 표준모

형의 완성을 위해 가동되고 있으며 동시에 납핵입자들을 이용한 중이온 충돌 실험

도 함께 진행되고 있다. 중이온 충돌실험은 핵이 고온고압 상태에서 핵자들의 집

합체로 존재하는지 쿼크와 글루온들이 플라즈마의 형태의 존재역할을 밝혀 내려고

한다. 이 연구에서는 중이온 충돌에서의 타원 흐름 (Elliptic flow)과 젯 소멸 (Jet

quenching)에 대한 연구를 진행하였으며, 또한 양성자-양성자 충돌시의 제트 알

고리즘의 결과물을 분석하여 이를 중이온 연구에 이용할수 있도록 진행되었다.

주요어휘 : LHC, CMS, 중이온, 제트, fastjet, 제트 알고리즘

i

Page 5: Study on performance of jet finder algorithms at the LHC energy

이학 석사 학위논문

Study onperformance of jetfinder algorithms at the LHC

energy

LHC에너지에서의제트알고리즘성능에관한연구

2012년 2월

서울시립대학교대학원

물 리 학 과

류건모

Page 6: Study on performance of jet finder algorithms at the LHC energy

차례

Abstract (in Korean) i

제 1 장 서론 1

제 1 절 중이온 충돌과 QGP이론 . . . . . . . . . . . . . . . . . . . . . . 1

1.1 타원흐름 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 제트 소멸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

제 2 장 하드웨어 12

제 1 절 LHC머신 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

제 2 절 CMS검출기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.1 자석 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

제 3 장 소프트웨어 21

제 1 절 PYTHIA에 대하여 . . . . . . . . . . . . . . . . . . . . . . . . . 21

제 2 절 ROOT 프레임워크 . . . . . . . . . . . . . . . . . . . . . . . . . . 23

iii

Page 7: Study on performance of jet finder algorithms at the LHC energy

차 례

제 3 절 컴퓨터 기술 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1 GRID 컴퓨팅 . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2 CMSSW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.3 CMS 검출기 Event 자료 구조 . . . . . . . . . . . . . . . . . . 31

3.4 Event 데이터의 흐름과 Tier 거점 . . . . . . . . . . . . . . . . 33

제 4 절 제트 (Jet) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1 FastJet에 대하여 . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.2 제트 검색 알고리즘의 종류 . . . . . . . . . . . . . . . . . . . 40

제 4 장 실험 설계 및 결과 47

제 1 절 제트 검색 능력 비교 . . . . . . . . . . . . . . . . . . . . . . . . . 47

1.1 Infrared Safety Test . . . . . . . . . . . . . . . . . . . . . . . 47

1.2 Collinear Test . . . . . . . . . . . . . . . . . . . . . . . . . . 48

1.3 Parton jet과 Reconstruction Jet의 에너지 비교 . . . . . . . 49

1.4 제트 알고리즘간 속도비교 . . . . . . . . . . . . . . . . . . . . 51

1.5 제트 알고리즘 검색 결과 비교 . . . . . . . . . . . . . . . . . 54

제 5 장 결론 58

Abstract 62

Acknowledgement (in Korean) 63

iv

Page 8: Study on performance of jet finder algorithms at the LHC energy

그림차례

1.1 중이온 충돌은 pp충돌과는 달리 매우 많은 입자들이 생겨난다. . . 2

1.2 PP충돌로 찾고자 하는 힉스 보존 (H0 = 190GeV 일때)의 전산모사

데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 충돌시의 단면적 및 충돌 후의 입자들의 운동량의 비등방성 . . . . 4

1.4 여러 가속기들에서의 v2의 값의 변화 . . . . . . . . . . . . . . . . . 5

1.5 충돌 수직평면 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.6 Acceptance correction . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.7 Resolution correction . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.8 elliptic flow의 값을 충돌도에 따라 전개한 히스토그램 . . . . . . . 9

2.1 CMS Detector는 Inner tracking system, ECAL, HCAL, Muon sys-

tem으로 구분된다. . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Pixel Detector는 3개의 층과 2개의 디스크로 이루어져 있다. . . . 16

2.3 Muon System은 DT, CSC, RPC로 구성되어있다. . . . . . . . . . 18

v

Page 9: Study on performance of jet finder algorithms at the LHC energy

그림 차례

2.4 DT디텍터의 모습 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.5 CSC디텍터의 모습 . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1 데이터 처리 과정 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 CMSSW의 문제점을 해결하도록 지원 . . . . . . . . . . . . . . . . . 28

3.3 CMSSW의 복잡성 때문에 통합제작 (Integation Build)과정이 매우

중요하다. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.4 작동 뿐만 아니라 CMSSW의 성능도 매우 중요한 부분이다. . . . . 29

3.5 Offline 데이터의 흐름 . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1 Jet의 MinPt 10GeV일 때의 에너지 비율 . . . . . . . . . . . . . . . 50

4.2 Seed Pt 1GeV일 때의 속도 비교 . . . . . . . . . . . . . . . . . . . . 52

4.3 Seed Pt 2GeV일 떄의 속도 비교 . . . . . . . . . . . . . . . . . . . . 53

4.4 CMS Iterative 알고리즘을 이용한 제트 검색 결과 . . . . . . . . . . 55

4.5 Seedless Infrared-safety(SIS) Cone 알고리즘을 이용한 제트 검색 결과 55

4.6 KT 알고리즘을 이용한 제트 검색 결과 . . . . . . . . . . . . . . . . . 56

4.7 AK 알고리즘을 이용한 제트 검색 결과 . . . . . . . . . . . . . . . . . 56

4.8 물귀신 알고리즘을 이용한 제트 검색 결과 . . . . . . . . . . . . . . . 57

vi

Page 10: Study on performance of jet finder algorithms at the LHC energy

제 1장

서론

제 1 절 중이온 충돌과 QGP이론

20세기에 들어 고에너지 물리학에서 가장 큰 핫이슈는 입자가속기를 통하여 생성

해낸 정보를 이용하여 기존에 주장되어왔던 물리학 가설을 증명하는 것이다. 현존

하는 최고 에너지로 작동하는 가속기인 LHC는 계획상 10개월은 양성자-양성자

충돌을 하며 1개월은 중이온 충돌을, 마지막 한달은 휴식기를 가진다. 중이온 충

돌의 중요한 목표 중 하나가 QGP(Quark Gluon Plasma) 존재 여부를 밝히는

것이다. 쿼크와 글루온간의 상호작용인 강한 상호작용은 쿼크들이 주고 받는 힘이

커지면 커질수록 작아지기 때문에 만약 매우 높은 온도를 가지게 될 경우 강력이 0

으로 수렴하게 되어 강입자 속의 쿼크와 글루온이 속박되지 않고 자유롭게 움직이

게 되는데 이를 QGP현상이라고 한다. QGP현상이 일어날 때에는 파이 중간자로

이루어진 계일 경우 약 2조도 (180MeV/km) 정도인데 이정도 에너지가 전 우주에

1

Page 11: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.1: 중이온 충돌은 pp충돌과는 달리 매우 많은 입자들이 생겨난다.

가득할 때는 빅뱅 직후 매우 짧은 시간이다. 따라서, 이러한 중이온 충돌을 미니 빅

뱅실험이라고 말할 수 있다. [14] 쿼크-글루온 플라즈마 현상의 성질을 알기 위해서

는 충돌 직후의 매우 짧은 시간 동안 외부의 탐침을 할 수가 없으므로 충돌시 생겨

난 입자들 중 잘 알고 있는 부분을 이용하여 잘 알지 못하는 부분을 설명해야 한다.

QGP를 유체역학적으로 모델링한다면 QGP의 성질은 연구한다는 것은 QGP의

상태 방정식을 알아낸다는 것과 같다. 상태 방정식을 알아보기 위한 연구는 매우

많은 주제들이 있으나, 이 연구에서 사용된 방법은 Elliptic flow와 제트 소멸현상

이다.

1.1 타원흐름

2

Page 12: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.2: PP충돌로 찾고자 하는 힉스 보존 (H0 = 190GeV 일때)의 전산모사 데

이터

3

Page 13: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.3: 충돌시의 단면적 및 충돌 후의 입자들의 운동량의 비등방성

4

Page 14: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.4: 여러 가속기들에서의 v2의 값의 변화

5

Page 15: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

elliptic flow(타원흐름)란 중이온-중이온 충돌시 Impact parameter(b)에 따라

충돌단면이 원형이 아닌 아몬드 모양으로 나타난다. 이러한 초기상태는 비등방적이

여서 발생되는 입자들의 각분포가 초기상태의 모양에 따라 변하게 되는데, 이러한

현상을 타원흐름이라고 한다. 즉, 충돌시 발생한 파톤들이 고온고압의 충돌초기물질

을 빠져나갈 때에 적은 쪽으로 나간 입자들의 양과 장애물이 많은 쪽으로 빠져나간

양이 다를 것이고, 이 때의 입자들의 양을 가지고 QGP가 입자들과 얼마의 세기로

상호작용을 하는지 알아내는 것이다. [13] 타원흐름 계수 (v2)는 이러한 타원흐름을

나타내는 하나의 값으로 정의되는데, 이 값이 양수라면 타원의 충돌면 방향으로 많

은 입자들이 생겨났다는 것을 의미하며, 음수라면 타원의 충돌면의 수직된 면으로

입자들이 많이 발생하는 것을 의미한다.

그림 1.5: 충돌 수직평면

6

Page 16: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

타원흐름을 계산하기 위한 방법으로는 (1) Reaction Plane method, (2) Cu-

mulant method 두 가지 방식이 있는데 이 중에 가장 일반적인 방법은 충돌 평면

(Reaction plane)을 정의하여 이를 이용하여 타원흐름 계수 (v2)를 측정하는 Re-

action Plane method를 이용하여 계산을 해보았다. Reaction Plane(Ψrp)은 실

제 충돌평면의 방향각으로 실제 충돌 사건만으로는 이를 재구성하는 것이 불가능하

기 때문에 발생된 입자들의 φ방향으로의 비등방향성을 이용하여 사건평면 (Event

Plane,Ψn)을 계산하여 사용한다. 이를 계산하는 방법은 다음과 같다.

tan(nΨn) =

∑iwisinnφi∑iwicosnφi

위 식에서 wi는 각 입자에 관한 가중치를 의미하며, Ψ1은 Direct flow, Ψ2는 el-

liptic flow를 의미한다.

v2는 아래와 같은 식에서 전개를 하게 되면[8],

dwN

d(φ−Ψm)=

< wN >

2π(1 +

∞∑k=1

2vobskmcos2[km(φ−Ψm)])

vobs2 =< cos2(φ−Ψ2) >, v2 =vobs2

Res

이 되며, 위의 k와 m은 n의 공약수이며 (n = km) vobskm는 v2의 사건 평면을 의미

한다. 사건 평면의 resolution을 이용하여 원래의 값을 계산할 수 있다. 이 계산

을 할 때 가장 문제가 되는 것은 flow에서 오지 않은 영향이 데이터에 영향을 주어

ellitic flow 측정이 부정확해지는 것이다.

7

Page 17: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.6: Acceptance correction

Acceptance correction은 검출기의 비효율성에 따라 나타나는 비등방성을 수정

해주기 위한 방법이다. 그러므로, 많은 양의 데이터를 축적하여 보았을 때 입자들의

분포는 φ방향으로 등방향성을 가져야 하므로 검출기 비효율성에 의한 비등방성이

타원흐름 계수에 영향을 주기 떄문에 이를 제거하는 것이다. 제거하는 방법은 여러

가지 방식이 존재하지만, 이 연구에 사용된 방법은 사용 가능한 모든 이벤트들에서

나오는 입자들의 방향각을 막대 그래프에 투영한 후, 거기서 얻어지는 방향각의 분

포의 역을 가중치로 주어 규격화하는 방식이다.

Resolution correction은 실제 Reaction Plane(Ψrp)과 측정한 Event Plane(Ψ2)

간의 차이를 수학적인 방법으로 비교하여 계산해낸 수식으로 원래 값으로 규격화하

8

Page 18: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

그림 1.7: Resolution correction

그림 1.8: elliptic flow의 값을 충돌도에 따라 전개한 히스토그램

9

Page 19: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

기 위한 수정방법이다.[8][12]

< cos[2(Ψsub12 −Ψrp)] >=

√< cos[2(Ψsub1

2 −Ψsub22 )] >

1.2 제트 소멸

RHIC의 중이온 충돌실험에서 최초로 중이온 제트 소멸현상이 발견한 이후로 많

은 연구가 진행되고 있다. 중이온 충돌에서의 제트는 양성자 충돌의 제트와 마찬가

지로 높은 횡단면 운동량을 갖는 파톤들에 의해서 생성된 다량의 입자들의 다발을

의미한다. 이때 생성되는 제트는 충돌의 위치와 진행방향의 QGP 두께에 따라 고

온고압의 물질에 의하여 저지되어 제트가 소멸하는 현상이 나타난다. 중이온 충돌

시 에너지가 높은 입자들을 경성 모드 (hard mode), 에너지가 낮은 입자들을 연성

모드 (soft mode)라고 하면 일반적으로 중이온 충돌시 쿼크들이 경성 모드를, 글

루온이 연성 모드이다. 이 때 QGP를 알아보기 위한 탐침으로 중요하게 생각하는

것으로 제트를 들 수 있다. 왜냐하면 제트는 강성모드의 충돌로 생겨나는 입자들

인데 이러한 강성 모드의 충돌현상은 중이온 충돌 뿐만 아니라 양성자-양성자 충돌

실험에서도 생겨나기 때문에 QGP에 비해 자세히 알고 있는 현상이기 때문이다.

따라서, 중이온 충돌에서 제트 현상에 대한 연구를 하는 것은 매우 중요한 부분 중

하나이다. 이 연구에서는 중이온 충돌실험의 QGP의 성질을 파악하기 위한 방법

으로 제트 소멸을 연구할 때에 적절하게 사용할만한 여러가지 제트 알고리즘을 PP

10

Page 20: Study on performance of jet finder algorithms at the LHC energy

제 1 장. 서론

충돌에서의 성질을 비교하여 실제 중이온 충돌 사건에서 사용할 기초 자료로 삼기

위하여 연구를 진행하였다.

11

Page 21: Study on performance of jet finder algorithms at the LHC energy

제 2장

하드웨어

제 1 절 LHC머신

표 2.1: LHC 가속기의 machine parameters

pp HI

핵자당 에너지 E 7 2.76 TeV

7TeV일 때의 다이폴 필드 B 8.33 8.33 T

설계 밝기 L 1034 1027 cm−2s−1

번치간 시간 25 100 ns

번치의 수 kB 2808 592

번치당 입자의 수 Np 1.15× 1011 7.0× 107

충돌

충돌지점에서의 β값 β∗ 0.55 0.5 m

충돌지점에서의 빔의 반지름의 RMS σ∗ 16.7 15.9 µm

밝기 라이프타임 τL 15 6 hr

충돌 수 nc ≈20 -

12

Page 22: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

LHC는 제네바에 있는 CERN연구소 (European Organization for Nuclear

Research)에 있는 인류최대의 입자가속기이다. 이 입자가속기는 둘레27km의 엄

청난 크기를 자랑하고 있으며, 1232개의 쌍극자 자석을 이용하여 양성자들을 가속

시킨 후 이를 충돌시켜 발생한 입자들을 분석하여 현재까지 알지 못했던 현상들을

알아내는 장치이다.

L =γfkbN

2p

4πϵnβ∗ F

LHC 머신의 밝기 (Luminosity)는 위 식을 이용하여 계산할 수 있는데, 이중 γ는

로렌츠 펙터, f는 회전 주파수, kB는 빔 번치의 수, Np는 번치당 양성자의 수, ϵn

은 normalize된 수직방향 방출계수 (LHC에서는 3.75µm), β∗는 충돌지점에서의

베타트론 함수, 마지막으로 F 는 충돌각도에 따른 감소계수이다. 디자인된 자세한

값들은 표2.1를 참고하면 확인할 수 있으며, 계획되었던 밝기 L = 1034cm−2s−1이

다.[6] LHC에는 여러 검출기에 기반한 국제 공동팀들이 있다. 그 중 ATLAS,CMS

는 주로 양성자-양성자 충돌을 통한 힉스 입자 발견을 중점을 두고 있고, ALICE

연구팀은 중이온 충돌을 중점적으로 연구하고 있다.

많은 과학자들이 LHC머신을 활용하여 여러 물리 이론을 검증하기 위해 노력하고

있다. 그 중에 가장 대표적인 주제는 다음과 같다.

• 힉스 입자의 탐색을 통한 표준모형의 약전자기 대칭성 깨짐의 증명

• 표준 모형의 입자들의 질량 정밀 측정

• 초대칭의 존재유무 증명

13

Page 23: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

• 물질과 반물질 사이의 CP 위반이 존재하는 이유

• 끈 이론, 여분차원의 가능성

• 암흑물질과 암흑 에너지에 대한 연구

• 초중력 연구

제 2 절 CMS검출기

그림 2.1: CMS Detector는 Inner tracking system, ECAL, HCAL, Muon system

으로 구분된다.

14

Page 24: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

CMS검출기는 Compact Muon Solenoid 검출기의 약자로 그 이름에서도 알 수

있다시피 뮤온을 검출하기 위한 가장 최적의 시스템을 갖추기 위해 제작된 검출기

이다. 이 검출기의 크기는 가로 13m 지름 5.9m의 원통형으로 구성되어 있고, 내

부에는 입자들의 측정을 위한 3.8T의 초전도 전자석이 들어있다.

2.1 자석

표 2.2: CMS검출기의 초전도 솔레노이드의 parameter

Field 3.8T

Inner Bore 5.9m

Length 12.9m

Number of Turns 2168

Current 19.5kA

Stored energy 2.7GJ

Hoop stress 54 atm

뮤온을 검출을 명확하게 하기 위한 조건으로 뮤온 시스템이 요구하는 운동량의 해

상도는 1TeV 의 Pt를 가지고 있는 뮤온 검출시 대략 10%정도 (∆p/p ≈ 0.1)이다.

CMS는 거대한 초전도 솔레노이드를 이용하였으며, 초전도 솔레노이드의 머신 파

라미터는 아래 표와 같다.

CMS검출기의 가장 안쪽은 Inner tracking system이 자리잡고 있다. 이 시스

템은 입자들의 궤적을 추적하기 위한 시스템으로 Strip tracker와 Pixel tracker

로 구성되어 있다.

15

Page 25: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

그림 2.2: Pixel Detector는 3개의 층과 2개의 디스크로 이루어져 있다.

Strip tracker의 barrel쪽 트래커는 TIB(Tracker Inner Barrel)과 TOB

(Tracker Outer Barrel)로 구성되어 있으며, TIB의 경우 4개의 층으로 이루

어진 실리콘 센서로 구성되어 |z| < 50cm TOB는 6개의 실리콘 센서로 구성되어

|z| < 110cm를 다루고 있다. strip tracker의 endcap영역은 TEC(Tracker End

Cap)과 TID(Tracker Inner Disks)로 나눠지며, 각 TEC는 9개의 디스크로 이

루어져 있으며, 120cm < |z| < 280cm영역을 다룬다. TID는 3개의 작은 디스크로

이루어져 있고 TIB와 TEC사이의 빈 공간을 다룬다. Pixel tracker는 Barrel

영역의 3개의 층으로 이루어져 있으며, 각 endcap면마다 2개의 디스크로 이루어

져있다.

16

Page 26: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

Inner tracker의 바깥은 Calorimeter로 구성되어 있다. 이는 입자들의 에너지

를 측정하기 위하여 설치되었다. Electromagnetic calorimeter(ECAL)은 bar-

rel 영역에는 61200개의 납-텅스텐 (PbWO4) 크리스탈이 장착되어 있고, endcap

영역에는 7324개의 크리스탈이 각각 장착되어 있다. ECAL의 배럴영역 (EB)는

129 cm의 내부 반지름을 가지며, pseudorapidity 0 < |η| < 1.479영역을 다

룬다. 또한, 광자를 측정하기 위하여 Silicon avalnche photodiodes(APDs)를

사용한다. ECAL의 앤드캡영역 (EE)는 중심으로부터 314cm만큼 떨어져 설치되

어 있고, 1.479 < |η| < 3.0의 영역을 다루고 있으며, 광자 측정을 위해 vaccum

phototriodes(VPTs)를 사용한다. Multi-gain preamplifier로부터 증폭된 신

호들은 50ns 후에 측정되고 40MHz의 속도로 각 채널당 배속된 3개의 12-bit

Analog-to-Digital Converter(ADC) 중 하나로 보내져 디지털화 된다.

ECAL을 둘러싸고 있는 Hadron calorimerter(HCAL)은 에너지 분해능의 비-

가우시안 꼬리를 최소화하고 EmissT 의 측정을 위하여 장착되었다. 그러므로, HCAL

은 자석코일 안쪽을 최대한 꽉 채우도록 디자인 되었다. Hadron barrel(HB)는

32개의 caloritmeter tower로 구성되었으며, |η| < 1.4영역을 다루고 있다. 총

2304개의 조각으로 나누었을 때, 한 조각들은 ∆η×∆φ = 0.087× 0.087 영역을 다

룬다. Hadron outer(HO)는 10mm두께의 섬광체를 이용하여 코일의 바깥 진공

탱크의 바깥쪽에 배치되어 있다. HO는 |η| < −1.26 범위를 다루고 있다. Hadron

endcap(HE)는 1.3 < |η| < 3.0범위를 14개의 η타워를 5◦ − φ 조각들로 구성되어

있다. Hadron foward(HF)는 3.0 < |η| < 5.0 구간을 다루는 디텍터이다.

17

Page 27: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

그림 2.3: Muon System은 DT, CSC, RPC로 구성되어있다.

HCAL의 외부는 뮤온 검출을 위한 Muon system을 구축하였으며, 이를 3가지

타입의 가스 디텍터를 이용하여 측정하게 된다. Barrel지역 (|η| < 1.2)지역은 중

성자로 인한 백그라운드와 뮤온의 검출율이 작으므로 drift tube(DT) 챔버를 이

용하여 측정을 하게 되며, 2개의 endcap지역 (2.4 > |η| > 1.2)은 그 반대의 현상

으로 인하여 Cathode stip chambers(CSC)를 이용하여 측정하게된다. 위 두개

의 디텍터와 더불어 보완적인 의미로 Resistive plate chambers(RPC)디텍터가

|η| < 1.6 범위를 다루고 있다.

18

Page 28: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

그림 2.4: DT디텍터의 모습

19

Page 29: Study on performance of jet finder algorithms at the LHC energy

제 2 장. 하드웨어

그림 2.5: CSC디텍터의 모습

20

Page 30: Study on performance of jet finder algorithms at the LHC energy

제 3장

소프트웨어

제 1 절 PYTHIA에 대하여

PYTHIA는 고에너지 물리학에서 사용되는 충돌사건 전산모사 프로그램이다.[11]

입자물리 실험을 하고 있는 물리학자들이 실제 데이터와 비교분석을 위해 자주 사

용되고 있으며, 비슷한 범용 입자충돌사건 전산모사 프로그램인 HERWIG와는 비

섭동 문제들의 풀이방식에서 차이점을 가지는데, 특히 광자스펙트럼 생성과정이나

fragmentation에 사용되는 알고리즘이 다른 것으로 알려져있다. PYTHIA는 입

자충돌사건 전사모사를 3가지의 과정을 복합적으로 고려하여 진행한다.

첫번째로 Hard Process는 그 충돌사건의 주요 현상을 의미하는 것으로 Hard QCD,

Soft QCD, Higgs생성 등을 의미하며, 이 과정에서 힉스의 질량 등을 새로 정의

하여 그에 맞는 초기현상 사건을 재현할 수도 있다. 또한, 이 과정에서 short-lived

resonance decay현상을 계산하여 극히 짧은 시간 존재하는 W 보존 등의 붕괴도

21

Page 31: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

계산하게 된다.

두번째로 Parton Level은 생성된 입자간의 상호작용인 Multiple interaction,

충돌사건과 직접적인 관련이 없는 입자들인 Beam Remnant의 처리, 충돌 전에

방사되는 initial-state radiation, 충돌 후에 방사되는 final-state radiation을

계산하게 되는데, 이 떄에는 Feynman 다이어그램을 자세하게 계산하는 matrix-

element 라는 방법과 역학, 간섭, 헬리시티 구조 등을 고려하여 1차 근사에 맞게

끔 입자들을 생성하는 parton shower라는 방법을 사용한다. 대개의 경우 par-

ton shower를 기본으로 사용하고, αs(강한 상호작용에서의 fine structure 상수)

결정문제, 제트의 각운동량 분포, 삼중-글루온 버텍스 공부 등의 특수한 경우에는

matrix-element 방식을 사용한다.

마지막 과정인 Hadron level은 현실에서는 존재 할 수 없는 입자들의 hadroniza-

tion 과정과 설정한 붕괴모드에 따라 붕괴시키는 decay과정을 포함한다.

Hadronizaion은 PYTHIA의 경우 String Fragmentation이라는 방식으로 끈

이론을 기반으로 한 하드론화 과정을 진행시키는데 이것이 HERWIG 전산모사 프

로그램이 Cluster Fragmentation 방식으로 하드론화 하는 것과 비교하여 가장

다른 차이점이다. 우리는 이번 실험을 위해 Hard QCD 충돌현상 중 Pt > 50GeV

이상 사건들을 PYTHIA를 통하여 전산모사한 결과를 이용하였다.

22

Page 32: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

제 2 절 ROOT 프레임워크

ROOT는 고에너지 물리학계에서 논문 작성을 위한 플롯 생성, 함수의 피팅, 간단

한 전산모사, 데이터의 입출력 및 저장 등에 주로 사용되는 C++기반 프레임워크

이다. ROOT 자체만으로 대형 연구과제를 진행하는 데 있어서 문제가 없을 정도로

포함되어 있는 라이브러리 및 모듈들이 매우 포괄적이며, 특히나 물리 함수 그래프

를 보는데 있어서는 무료 오픈소스 프로그램 중에서는 비교할만한 프로그램이 없을

정도로 매우 뛰어난 프로그램이다.

고에너지 물리학계에서 ROOT가 잘 사용되는 것은 그 파일 저장 구조 때문이기도

하다. ROOT는 MS오피스, 한글 등과 같은 복합문서 형식으로 파일을 저장하기

때문에 파일 그 자체만으로도 그 안에 들어있는 데이터의 라벨에 관한 정보를 포함

하고 있기 때문에 파일만 가지고도 구조 자체를 이해할 수 있도록 구성되어 있다.

따라서, 데이터를 접근할 때 모든 데이터를 읽어내는 것이 아니라 라벨이 지시하고

있는 데이터만 선택적으로 얻어낼 수 있는 장점을 가지고 있다. 또한, 복합문서 파

일시스템의 장점은 파일의 일부를 압축할 수 있다는 점이다. 따라서, 데이터의 전

체 구조를 변경시키지 않으면서 데이터의 양을 줄일 수 있는 장점을 가지게 되었다.

이는 그리드 컴퓨팅을 기반으로 하여 연구를 진행하는 CMS 연구에 있어서 매우

중요한 요소이기 때문에 다른 여타의 상용 플롯 프로그램들을 제치고 주 데이터 처

리 프레임워크로 확정되었다.

ROOT의 단점은 사용자들보다는 보다 고급 기술을 사용하려는 개발자들에게 있는

데 기본적으로 제공되는 클래스들 말고 개인이 직접 개발한 클래스를 이용하여 연

23

Page 33: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

구를 하려고 한다며 매우 복잡한 과정을 거쳐서 제작해야 한다는 점이다. 이러한 문

제를 극복하기 위하여 CMSSW는 ROOT 라이브러리를 자동으로 만들어주는 시

스템을 제작하였기 때문에 CMSSW를 이용한다면 이러한 ROOT의 단점을 쉽게

피해갈 수 있다. 하지만, 이 연구에서는 CMSSW를 사용하지 않기 때문에 각각의

별도로 구성되어 있는 PYTHIA와 FastJet을 ROOT의 모듈로 작성하는 것을

목표로 진행되었다.

제 3 절 컴퓨터 기술

CMS 검출기에서 나온 데이터의 양은 1년에 축적되는 양만으로도 5페타바이트

로서 이러한 방대한 정보를 처리할 경우에는 컴퓨터를 이용하는 것이 필수적이다.

[7] 현재 LHC의 CMS검출기 실험을 위해 사용되는 컴퓨터 기술은 현재 인류가

가지고 있는 컴퓨팅 최고 기술들로 이루어져 있으며, 이러한 데이터의 구조와 처리

방식을 배워야지만 CMS 검출기를 이용하여 물리 연구를 진행할 수 있다.

3.1 GRID 컴퓨팅

CMS 검출기에서 나오는 데이터량은 1년에 수Peta Byte정도로 매우 방대한 양

을 가지고 있다. 이를 하나의 저장장소에서 저장한다면 화재 및 파손에 의한 위험

성이 증가하게 되고, 각 국가의 연구자들이 데이터에 접근을 할 때에 이에 대한 부

하를 감당하기 위하여 매우 고밀도의 네트워크 시스템이 필요하게 된다. 따라서,

이를 극복하기 위해서는 데이터 저장 시스템과 이를 분석하는 연구 시스템을 하나

24

Page 34: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

의 연구기관이 아닌 여러 연구기관들이 나누어서 관리하도록 해야한다. 이를 위해

사용된 시스템이 GRID 컴퓨팅이다. 현재 LHC의 그리드 컴퓨팅은 LCG(LHC

Computing Grid)라는 프로젝트를 구성하여 현재까지 존재한 수많은 기반 프로그

램 (미들웨어)를 혼합하여 작성되었다. 실제로 가장 많이 차용된 미들웨어는 gLite

라고 하는 미들웨어로 이 프레임워크 프로그램은 각 노드들에 필요한 설정을 자동

적으로 적용할 수 있도록 도와주는 작업을 하여 그리드 컴퓨터 노드들간의 통일성을

제공하는 한편, 관리자들의 어려움을 해결하도록 도와주고 있다. 예를 들면 gLite-

CE는 그리드 노드들 중에서 계산 자원을 관리하기 위한 노드로 사용하게 되는데,

gLite에서 제공하는 패키지와 설정 스크립트인 YAIM을 사용하게 되면, 각각의

프로그램들을 별도로 깔아야하는 수고를 하지 않고도 PBS Torque(작업 관리 프

로그램), Resource BDII(자원상태 보고 시스템), 각 노드들간의 통신 유지 프로

그램들이 자동으로 설치되면서 이에 대한 설정파일이 자동으로 세팅된다.

3.2 CMSSW

그림 3.1: 데이터 처리 과정

25

Page 35: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

3.2.1 CMSSW의 데이터 처리과정

CMSSW는 CMS검출기를 이용한 실험을 수행하기 위하여 연구자들이 협력하여

만들어낸 오픈소스 프로그램이다. 이 CMSSW는 크게 전산모사 수행을 위한 시

뮬레이션 부분과 실제 데이터를 처리할 때 사용되는 분석 부분이 같이 프로그램 되

었다. 전산모사를 수행하기 위하여 CMS에서는 각 실행단계상의 논리적인 의미를

설정하였다.

첫번째 과정은 GEN(Generation) 과정으로, 입자 충돌사건을 전산모사하는 PY-

HIA나 HERWIG 등의 프로그램을 이용하여 입자정보를 얻어낸 후, 이 정보를

공용으로 사용되는 고에너지 몬테카를로 데이터형식인 HepMC포맷으로 변환하는

과정이다.

두번째 과정은 SIM(Simulation)과정으로 GEN과정에서 만들어진 입자 데이터

들이 실제로 가속기와 상호작용을 할 때에 얼마나 에너지를 검출기에 남기는지를

알아내는 작업이다. 이 때에 사용되는 검출기 시뮬레이션 프로그램으로 GEANT4

가 사용된다.

세번째 과정은 DIGI(digitization)이다. DIGI과정에서는 각 검출기에 남겨진 에

너지를 실제 검출기에서 측정할 때 왜곡되는 에너지를 전산모사 데이터에서 감안하

도록 하는 과정이다. 크게 검출기의 전자기기상의 한계로 인하여 오차가 발생하는

부분과 검출기가 측정할 수 있는 최소거리에 의한 오차로 인하여 이러한 왜곡 현상

이 나타나게 된다.

이 논문에서 사용된 전산모사 프로그램도 CMSSW의 전산모사 과정과 유사하게

26

Page 36: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

진행하도록 제작되었는데, GEN과정은 PYTHIA 최신버전인 PYTHIA8로 충

돌사건을 전산모사한 후에 입자 정보를 HepMC가 아닌 독자적인 방식으로 만들

어진 ROOT 포맷에 통합시켰다. 두번째 SIM과정은 검출기와 무관한 제트 검색

알고리즘의 성능 분석을 위하여 특별한 조치를 취하지 않았으나, 세번째 DIGI과정

에서 각 입자들을 특정 거리단위로 전체 검출기 범위를 격자화하여 합쳤으며 입자의

모멘텀 혹은 에너지들 역시 총량의 10%의 표준편차인 가우시안 분포를 이용하여

모호성을 삽입하여, 검출기상에 있을 현상들을 흉내내고자 하였다. DIGI과정을 거

친 후의 데이터들을 전산모사를 통한 RAW파일이라고 하는데 이는 실제 검출기에

서 측정된 데이터들과 구조 및 의미적으로 같은 데이터이다.

네번째 과정은 RECO(Reconstruction)과정이다. 이 과정부터는 전산모사 데이

터와 실제 데이터의 구분이 없어지며, RAW는 모든 검출기에 관한 정보들을 가지

고 있다. 따라서, 각 연구자들은 RAW파일을 이용하여 자신들이 원하는 Physics

Object(Letopn, Hardron, meson, jet, MET 등)를 생성하여야 한다. 이 과

정을 RECO라고 하는데 초창기부터 시작된 연구와 개발을 통하여 거의 대부분의

object에 관한 재구성 알고리즘들이 CMSSW에 존재하여 실제 데이터를 처리할

때 진행되고 있다. RECO 과정은 관리팀에 의해 공식 RECO모듈들을 이용하여

재구성되고 있기 때문에 이 과정을 변경하기 위해서는 공식적인 과정을 거친 후 승

인을 받아야한다.

다섯번째 과정은 AOD(Add on data)과정이다. 이 과정은 공식적인 재구성 알고

리즘을 사용하지 않고 각 사용자들이 만들어낸 재구성 알고리즘을 이용할 때 필요한

27

Page 37: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

과정이다. RECO과정은 공식적인 재구성 알고리즘이기 때문에 이를 변경할 수 없

을 때에는 반드시 AOD과정에서 데이터에 추가를 해주는 과정이 필요하다. 또한,

이 과정은 다른 과정들과는 달리 Tier2이하에서 사용된다는 점이 가장 큰 차이점

이다.

3.2.2 CMSSW의 설계 구조

그림 3.2: CMSSW의 문제점을 해결하도록 지원

CMSSW는 모듈이라고 불리는 그룹들로 이루어져 있으며, 실제 사용자들은 이 모

듈을 순서에 맞게 불러들이는 실행명령 코드를 작성하여 자신이 원하는 연구를 진

행한다. 각 모듈들은 C++언어를 이용하여 제작되었으며 PYTHON 언어로 만들

어진 지시명령 및 설정파일 (Command and configure file,cfg)을 이용하여 작

업을 진행하게 된다. CMSSW는 ROOT의 복잡한 클래스 생성 방식을 벗어나

기 위해 ROOT 위에서 작동하지 않고 ROOT 클래스들을 외부 프로그램으로 등

록하여 구성되었다. 각 모듈들은 사용자들의 편리한 연구를 위하여 모든 모듈들이

Producer, Analyzer, Filter와 같은 구조만을 가지게 하여 실제 연구 코드를 제

28

Page 38: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

그림 3.3: CMSSW의 복잡성 때문에 통합제작 (Integation Build)과정이 매우 중요

하다.

그림 3.4: 작동 뿐만 아니라 CMSSW의 성능도 매우 중요한 부분이다.

29

Page 39: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

외한 나머지는 신경 쓰지 않도록 제작하는데 많은 역량을 기울였다. 모듈의 개발자

는 모두 Producer의 구조에 맞쳐서 프로그램을 하도록 강제되어 있기 때문에 통

일성을 갖추게 되었으며 Analyzer 또한 Producer와 구조적으로는 거의 동일하게

구성되어 프로그램의 진입장벽을 낮추었다.

CMSSW는 그리드 컴퓨팅을 이용한 소프트웨어이기 때문에 실제 그리드 상에 동

작할 프로그램은 자신이 사용할 모든 프로그램 소스들을 전부 이용하여 라이브러리

로 묶여져 있어야 한다. 하지만, 실제 작업 디렉토리에 자신이 사용하지 않는 소스

들을 가지고 있다면 코드 작성시 매우 혼란스럽기 때문에 리눅스의 환경변수를 이용

하여 작업디렉토리 밑에 존재하지 않는 필요 소스코드들이 실제로 존재하는 것처럼

링크를 시켜 컴파일을 해주게 된다. 이러한 구조 때문에 자신이 직접 생성하지 않은

모듈들을 이용한 프로그램 코드들은 다루지 않게 되고 만약 변수를 지정할 필요가

있을 때에는 PYTHON을 이용한 cfg파일만을 이용하여 처리할 수 있다. 따라서,

CMSSW의 버전에만 유의한다면 어려움 없이 분석코드를 작성 할 수 있다.

미리 제작되어 있는 모듈 코드들을 이용하기 때문에 CMSSW의 버전에 따른 각 모

듈들의 버전 관리가 여타 다른 프로그램들과는 달리 철저히 유지가 되어야 한다. 왜

냐하면 각 모듈의 버전이 모호하면 CMSSW가 다른 사이트에서 작동할 때 같은 버

전의 CMSSW를 사용하더라도 다른 모듈이 사용될 수 있기 때문이다. 따라서, 각

모듈들의 버전들은 CMS SDT(Software distribute team)에 의해 통합관리되고

있으며, 각 모듈들이 정상 작동하는지를 체크하기 위하여 Integration Build 과정

을 거치게 된다. Integration Build(IB) 작업은 Tag Collector, Nightly build,

30

Page 40: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

QA의 세 가지 진행순서를 가진다. Tag Collector는 각 모듈의 개발자들이 새로

운 모듈의 버전을 지정한 후 각 버전들이 CMSSW의 해당 버전에 매치되는 것을

알리기 위한 시스템이며, Nightly Build는 업로드된 프로그램 소스들을 매일밤마

다 다시 다운로드 받아서 컴파일 과정을 진행하여 제대로 컴파일이 되는지와 제대

로 작동을 하는지에 대한 간이 테스트를 수행하는 진행과정이다. 마지막으로 QA

과정은 이러한 순서를 거친 후에 나온 결과 정보를 이용하여 각 개발자들에게 보다

편리하게 정보를 제공하기 위한 순서이다. 석사1학기 과정동안 SDT팀과 협력하

여 QA과정을 진행, CMS 서비스워크를 수행하였다.

3.3 CMS 검출기 Event 자료 구조

CMS검출기 연구팀에서는 파일포맷을 설정할 때에 기본적인 틀을 설정하였는데,

이를 RAW, RECO, AOD로 구분하여 사용토록 권장하고 있다. RAW 영역은

실제 가속기에서 측정된 데이터를 기록한 부분으로 검출기의 상태, 빔의 상태, 사용

된 자기장의 크기, 검출된 영역의 좌표 및 에너지 정보 등의 하드웨어 정보를 가지고

있다. 이렇게 CMS검출기에 저레벨 수준의 값들을 가지고 있기 때문에 RAW는

CMS 데이터 시뮬레이션 및 분석 프로그램인 CMSSW와는 독립적으로 존재하게

되는 장점을 가지게 된다. 하지만, 대부분의 연구에서 RAW를 직접적으로 사용하

는 경우는 극히 드문데 이는 실제 우리가 연구하고자 하는 물리 모델들과는 별로

상관 없는 정보들이기 때문에 이 정보들로부터 물리 모델들을 재구성한 이후에 물

리적인 연구를 진행할 수 있기 때문이다.

31

Page 41: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

RECO(Reconstuction data) 영역은 RAW정보를 이용하여 실제 물리 모델들

을 재구성한 정보들이다. 즉, 이 정보에는 실제 검출기에서 나타난 입자에 대한 재

구성 정보들이 기록되어 있다. 예를 들면, 입자들의 종류, 입자들의 궤적, 입자들의

에너지 및 운동량에 관한 정보 등이 있다. 만약 RAW데이터에서 RECO데이터를

재구성하는 재구성 알고리즘을 개인 연구자들이 각자 만들어서 사용하게 된다면, 이

를 재구현하기 매우 어렵기 때문에 도출된 물리 결과의 검증이 매우 복잡해지게 된

다. 또한, 프로그램 실력이 부족한 연구자들은 입자의 재구성만으로도 매우 벅찬 사

항을 맞이할 수 있다. 이를 방지하기 위하여 각 그룹에서는 재구성 알고리즘의 신

뢰성과 정확성을 높이기 위하여 강도 높은 검증을 거치고 있으며, 공식적인 재구성

알고리즘과 연구내용을 발표하여 많은 과학자들이 단순한 입자의 재구성 부분을 별

도로 구현할 필요가 없이 공통적으로 사용할 수 있도록 도와주고 있다. CMS 연구

초기에는 많은 재구성 알고리즘들이 더 나은 알고리즘들로 대체되고, 프로그램의 효

율성을 높이기 위한 코드들이 개발되는 과정을 거쳤기 때문에 최근 몇년간 굉장히

빠른 속도로 CMSSW의 코드들이 수정되었기 때문에 재구성된 RECO파일이 다

른 버전의 CMSSW에서는 사용이 불가능한 문제점이 나타나게 되었고, 이전 데이

터를 최신 CMSSW에서 사용하기 위해서는 RAW데이터에서 다시 RECO과정

을 거치는 reReco 과정을 거쳐야하는 문제점들이 나타났다. 하지만, CMSSW의

안정성이 높아짐에 따라 추후에는 버전간 비호환성이 극복될 것으로 예상되고 있다.

데이터 파일의 AOD(Analysis object data) 영역은 실제로 공식적으로 제공되지

않는 정보를 입력하기 위한 영역으로 볼 수 있다. 다른 연구자들에게 의미가 없는

32

Page 42: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

데이터들을 RECO 영역에 추가하면 RECO과정의 소요시간이 증가하고 파일 크

기가 증가하는 단점이 있다. 따라서, 연구 분야에 특성화된 자료들은 AOD과정을

각 연구자들이 수행하여 별도의 데이터로 저장할 필요성이 있다. 이 때에 CMSSW

의 데이터 모델 도구인 EDMProducer를 이용하여 이벤트 파일에 새로운 데이터

라벨을 추가할 수 있다. 이러한 AOD정보는 이벤트 별로 기록된다는 특징 때문에

최종 결과파일인 히스토그램, 데이터베이스 등과는 구별된다. 이 AOD가 중요한

점은 CMS의 데이터가 매우 큰 용량을 가지기 때문에 GRID컴퓨팅을 사용할 수

밖에 없고, 이러한 GRID컴퓨팅에서 이벤트 정보에 추가가 필요할 경우 AOD를

사용하여야만 원하는 과정을 모듈별로 처리할 수 있기 때문이다. CMSSW의 데

이터 흐름을 잘 이해하지 못한다면 AOD에 대한 이해가 부족하기 때문에 프로그

램을 모듈형식이 아닌 하나의 분석 코드에서 모든 정보를 처리하는 방식으로 프로

그램을 작성하게 되는데, 이렇게 되면 문제가 발생했을 때 모듈의 크기가 매우 커

이를 수정하기가 매우 어렵게 된다. 따라서, AOD를 사용하는 것은 그리드 컴퓨팅

환경에서의 복잡한 알고리즘을 연구할 때에 매우 중요하게 작용하게 된다.

3.4 Event 데이터의 흐름과 Tier 거점

충돌사건 데이터들은 당연히 하드웨어 레벨인 CMS검출기에서 전기신호 방식으로

측정된다. 이 CMS검출기의 위치를 ”Point5(P5)”라고 부른다. P5에서 직접적

으로 데이터를 수집하는 DAQ(Data Acquisition) 과정을 거친 데이터들은 전용

광채널을 이용하여 CMS T0 컴퓨팅 센터로 데이터를 전송하게 된다. 이 때, P5

에서는 매우 저수준의 필터를 이용하여 전송할 데이터를 결정하는데, 전기회로를 이

33

Page 43: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

용한 하드웨어 방식의 필터를 구현하는 L1(Level1) 트리거와 가장 빠른 알고리즘

을 이용한 소프트웨어 방식의 필터링인 HLT(High level trigger) 등이다. 이 때

트리거링을 하는 데이터는 실제 P5의 운영에 영향을 주는 ONLINE 데이터들로

취급된다. 반면에, P5에서 HLT를 거쳐 보다 물리적인 의미를 가질 것으로 추정

되는 데이터들은 P5의 운영에는 직접적으로 영향을 끼치지는 않는 데이터로 실제

연구자들에게는 이런 OFFLINE 데이터가 제공된다.

그림 3.5: Offline 데이터의 흐름

T0 center에서 수행하는 목표는 제공받은 데이터의 안정적인 Tape 백업과 첫

RECO과정을 수행하는 것이다. 또한, T0센터는 T1센터들에 데이터를 최대한 빠

른 시간에 제공하기 위한 목표도 가지고 있다. T1은 데이터 압축, 세부 Recon-

stuction, 데이터의 조정, 스키밍 등의 데이터 관련 작업을 수행하며, 각 지역의

T2센터로 데이터를 재전송한다.

34

Page 44: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

gLite 미들웨어는 종합 설정파일로부터 모든 하부 프로그램의 설정이 자동으로 이

루어지므로, 최상위 설정파일의 설정이 올바르지 않다면 시스템이 정상작동하지 않

는다. 따라서, 각 노드들의 쓰임새가 어떻게 되면 주의할 점이 무엇인지 아는 것이

매우 중요하다.

gLite-UI는 실제로 일반 사용자들이 그리드 시스템을 이용하기 위한 유저 인터페

이스 (User Interface,UI)를 제공하기 위한 노드이다. 이 노드에서는 실제로 그리

드 상의 파일 복사, 파일 등록, 파일 삭제, 노드에 속해 있는 컴퓨터의 접속 등 그

리드 노드에 속해있는 컴퓨팅 자원에 접근하기 위한 거의 모든 프로그램이 설치가

된다. 따라서, 이 머신이 존재하지 않다면 그리드 자원을 사용할 방법이 없게 된다.

CMS에서는 glite-UI 머신에서만 CRAB(CMS Remote Analysis Builder)를

이용하여 그리드 노드들의 자원을 이용하여 작업을 진행할 수 있다.

glite-CE는 컴퓨팅 자원 중 계산 자원들의 관리를 위한 노드이다. 일반적인 클러

스터 시스템에서는 작업 관리 프로그램 (Job management program)으로 PBS,

LSF, LoadLeveler 등의 여러 상용 혹은 공개 프로그램들을 이용하여 실제 자원들

이 사용되고 있는지를 미리 모니터링을 하여 실제 연산작업이 사용되지 않고 자원의

여유가 있는 머신들에게 보내지도록 구성되어 있다. 이와 비슷한 원리로 glite-CE

노드는 이러한 작업관리프로그램을 하부 시스템을 설치하여 하부 노드들을 관리하

고, 각 노드들의 접근을 특정 인증서를 가진 사람들이 사용할 수 있도록 지원하는

시스템을 구축하게 된다.

glite-SE는 그리드 노드 중 저장 자원의 관리를 위한 노드이다. 현재 glite에서는

35

Page 45: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

저장 자원을 활용하기 위하여 3가지 방식을 추천하고 있다. 하나는 일반적인 디스

크를 이용할 때 적용하는 classic 방식으로 이 방식을 이용하면 단일 대용량 디스

크를 저장장소로 사용하게 된다. 두번째 방식은 DPM(Disk Pool Management)

프로그램을 이용하게 되는데 이 방식은 여러 개의 디스크나 파티션을 설정하면 이를

통합하여 하나의 논리적인 드라이브를 만들어서 이를 사용하는 방식으로 통합한 데

이터를 mysql을 이용한 데이터베이스로 메타정보를 저장하고 있다. 따라서, 기존

클래식 방식에 비해서 디스크를 하나의 서버가 아닌 별도의 여러 서버에 설정할 수

있고 다른 서버들에 분산하여 저장하기 때문에 분산처리도 어느 정도 가능한 시스템

이다. 하지만, 이 방식은 분산관리를 한개의 파일 단위로 구분을 하기 때문에 파일

하나의 크기가 큰 경우에는 생각보다 성능 향상을 기대하기는 어렵다. 하지만, 설정

자체가 매우 간단하고 이를 수정하는 명령어도 직관적이기 때문에 별도의 분산파일

시스템을 구축하지 않을 경우 이 방식을 이용하면 손쉽게 분산시스템을 구축할 수

있다. 마지막으로 추천하는 방식은 dcache라는 분산파일 처리 시스템을 이용하는

것이다. dcache는 CERN에서 개발한 분산처리 시스템으로 이 시스템은 이기종

장비 ( 예를 들면 테이프와 디스크)를 하나의 파일 시스템으로 묶어서 관리할 수 있

는 시스템이다. 일반적으로 테이프 저장 시스템이 일반 하드디스크 보다 가격이 저

렴하므로 대량 정보를 순차접근 방식으로 저장할 때에는 매우 훌륭한 시스템인데,

이러한 시스템은 DPM에서는 적용할 수 없다. 따라서, 데이터의 저장용량이 매우

많이 필요한 tier1,2센터의 경우 이러한 저장 시스템을 dcache를 이용하여 종합

적으로 관리하도록 하여 그리드 시스템을 운영하고 있다. 서울시립대학교 슈퍼컴퓨

36

Page 46: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

터센터는 자원 제공의 강제성이 없는 tier3센터에 등록되었으며, 슈퍼컴퓨터센터의

저장 시스템을 지원하기 위하여 DPM방식을 이용하여 저장 자원을 그리드상에서

활용하고 있다.

glite-BDII(자원정보 관리 노드)는 Top과 Site, Resource 3가지 자원정보를 관

리하기 위하여 이용한다. Resource BDII는 실제 자원들이 작동을 하는지에 관한

정보를 ldap 서비스를 이용하여 관리하게 되는데, 이 패키지는 각 자원들을 직접

관리하는 노드들에 포함되어 있다. 즉, glite-CE와 glite-SE 패키지에 포함되어

있는 패키지로 별도의 노드를 필요로 하지 않는다. Site-BDII 노드는 Resource-

bdii에서 수집한 정보를 통합하려는 목적으로 만들어진 노드로 이 노드에서는 같은

site에 존재하는 각 노드들의 자원상태, 에러 메세지, 상호 교신 정보 등을 수집하

여 최상위 정보노드인 Top-BDII에 제공하는 역할을 수행한다. Top-bdii는 site-

BDII 노드들의 정보를 수집하여 최상위 정보 수집 장소로 각 Top-BDII는 제공된

정보를 이용하여 사용자들에게 어떠한 사이트들이 존재하는지 어떠한 자원을 사용

할 수 있는지에 대한 정보를 제공한다. [3] 이외에도 사용자가 수행하려는 작업을

관리해주는 glite-WMS, 그리드 노드의 로그파일을 관리하는 glite-RB, 논리파일

과 실제파일을 이어주는 glite-LFC 노드 등도 구성할 수 있다.

제 4 절 제트 (Jet)

제트의 정의는 하나의 명확한 단어로 정의되어 있지는 않으나 대개 ”좁은 범위에

많은 입자들이 포함된 현상”을 지칭하는 표현이 가장 넓은 의미로 사용되고 있다.

37

Page 47: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

입자물리연구에서 활발히 연구되고 있는 가속기 연구분야는 가속된 입자를 충돌시

켜 발생하는 파편 입자들을 분석하는 실험이다. 입자가속기 실험의 측정결과를 이

용하여 이전입자들을 재구성함으로써 입자물리학자들은 지금까지는 발견되지 않았

던 새로운 입자나 그 때까지 추측으로만 여겨지고 있던 여러 가설들을 증명할 수 있

었다. 이러한 역산을 재구성 (Reconstruction)이라고 하는데, 일반적인 재구성 방

법은 실제 측정된 입자들의 4-momentum으로부터 이전 입자 (mother particle)

를 알아내는 방식을 사용한다. 새로 발견된 많은 입자들이 이러한 방식으로 발견되

었다. 그러나, 이러한 재구성방식에는 매우 큰 한계점이 있는데 충돌초기의 물리현

상을 살펴보기 위해서 엄청난 시간을 들여 모든 확인 가능한 입자들의 역사를 거슬

러 올라가야하며 실제 측정에 실패하는 입자들 (i.e. 중성미자)가 존재할 경우 초기

상태의 정확한 측정이 어렵다는 점이다. 이러한 재구성 방식의 문제점을 극복하기

위하여 최종 결과값들을 이용하여 제트를 이용하여 원래 어떠한 물리적인 현상이

있었는지를 유추하는 방식을 사용함으로써 특정 물리사건의 대략적인 정보를 매우

빠른 시간에 확인 할 수 있는 장점[5]을 지녔다. 반면, 이러한 방법상의 문제점으로

인하여 일반적인 재구성 방식을 거쳐 역산된 결과값에 비해 정밀하지 못하다는 단

점이 존재한다. 따라서, 수많은 제트 검색을 위한 알고리즘을 개발하고 이에 대한

연구를 통하여 제트를 발견하는 것뿐만 아니라 제트를 통해 재구성된 물리현상의

신뢰성이 얼마나 되는지도 알아낼 수 있다. 제트 검색 알고리즘은 제트의 신뢰성을

이해하는데 매우 중요한 요소로서 각 알고리즘은 실험조건에 따라 그 신뢰성을 연

구해야 한다.

38

Page 48: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

4.1 FastJet에 대하여

원래 클러스터 알고리즘의 한 종류인 Kt 알고리즘은 그 정확성에 비해 속도가 매우

느려 다른 cone알고리즘보다 그 중요도가 적다고 여겨지고 있었다. 이러했던 Kt,

AK 알고리즘은 후속 연구를 통해 2006년의 발행된 논문에 의해 원래의 O(N3)

의 속도를 극복하고 다른 Cone알고리즘 보다도 빠른 O(NlogN)의 속도를 가지

게 되었다. [4]이렇게 빨라진 Kt알고리즘의 최적화방안을 생각해낸 Gavin Salam

은 자신의 알고리즘을 이용한 Kt,AK제트 검색 프로그램인 FastJet을 개발하여 제

공하고 있다. 이 프로그램을 이용하면, 최신 Kt,AK알고리즘을 실제로 적용할 수

있을뿐만 아니라, 기타 다른 알고리즘들도 플러그인의 형태를 이용하여 제트 검색을

할 수 있다. FastJet은 기존의 물리학 연구에 많이 사용되었던 포트란을 사용하지

않고 차세대 프로그래밍 언어로서 인기를 끌고 있는 C++언어를 이용하여 프로그

램 되어 젊은 물리학자들로부터 좋은 호평을 듣고 있으며, 프로그램의 크기도 매우

작고 응용하기 편리하게 되어 있어 여타 다른 프로그램의 외부 모듈로서 널리 사

용되고 있다. 현재 CMS실험의 전산모사 및 연구를 위한 소프트웨어인 CMSSW

에서는 제트 알고리즘을 분석하기 위하여 이 프로그램을 이용하고 있으며, 이후의

다른 연구들에도 제트 검색을 위한 프로그램으로서 더욱 많이 사용될 것이라 여겨

지고 있다.

39

Page 49: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

4.2 제트 검색 알고리즘의 종류

제트 검색 알고리즘은 현재 2가지 계열로 구분되어진다.[2][10] 하나는 Pseudo

rapidity-Azimuthal(η − φ)공간에서의 거리를 이용한 원뿔 (cone) 알고리즘 계

열과 각 입자의 운동량을 고려하여 영향력의 분포를 고려한 클러스터 알고리즘 계

열이 그 나머지이다. 원뿔 알고리즘이란, 최종적으로 발견된 강입자들의 운동량을

이용하여 특정거리를 기준으로하여 실제 방사된 입자들의 형태를 유추하는 것이다.

따라서, 실제 가속기에서 발생한 제트가 중심을 기점으로 하여 가우시안 분포를 갖

추고 있을 경우 높은 정확도를 가질 것으로 여겨진다. 클러스터 알고리즘은 각 입

자들의 모든 관계되는 입자쌍들의 운동량 값과 거리의 함수가 특정 값 이하일 경

우에 새로운 클러스터로 합치는 작업을 통해 제트를 계산한다. 따라서, 이 방식은

각 입자들이 최종입자로 구성되어가는 도중에도 서로간의 영향을 줄 경우에 더 적

절하다고 판단된다. 이 논문에서 사용된 비교 알고리즘으로 원뿔 알고리즘으로는

iterativecone 알고리즘, seedless infrared safe cone(이하 SISCone) 알고리즘

이 클러스터 알고리즘으로는 Anti−KT 알고리즘과 KT 알고리즘을 사용하였다.

우리가 논문에서 분석할 물귀신 알고리즘은 원뿔 알고리즘의 일부이지만, 입자와

입자간의 거리를 측정하는 iterativecone 등과 달리 입자들을 기존에 만들어진 임

시 제트와 비교하여 포함/제외의 여부를 판단하는 방법으로 검색을 하게 된다. 이

방법의 장점은 제트로 이미 찾아진 입자들의 숫자가 적을 때 입자가 어느 제트에

속할지를 판단하는 시간이 매우 적어진다는 점이다. 또한, 모양이 원형이 아닌 제

트의 모양에서도 대응할 수 있는 장점을 가지게 된다. 이번 논문의 중요하게 살펴

40

Page 50: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

보는 성능 기준은 검색 속도와 재구성된 제트의 Pt의 값과 원래의 Parton Pt를

비교한 에너지 검색률이다.

FastJet에서 제공하고 있는 알고리즘 중 이번 실험에서 사용된 알고리즘은 다음과

같다.

4.2.1 Iterative Cone Algorithm(IC)

Iterative Cone Algorithm은 이름 그대로 알다시피 Cone알고리즘의 한 종류

로서 기존에 사용되었던 Simple Cone( 중심을 기점으로 특정 반지름 안에 들어오

는 모든 입자들을 하나의 젯으로 봄 )의 개념에서 중심 (Seed)의 값을 기존 Pt가

추가적인 입자들에 의해 변할 수 있도록한 알고리즘이다. 첫 제트의 중심은 가장

높은 Pt를 가지는 셀이며, 이 셀을 중심으로 한 Cone을 그린 후 이에 포함된 입자

들을 설정된 Recombination Scheme(재결성 방식)을 이용하여 다시 중심을 이

동시켜가며 셀을 추가하거나 빼게 된다. 보편적으로 사용되는 Pt recombination

scheme은 다음과 같다.

P after−Jett = P before−Jet

t + Pnew−cellt

ηafter−jet = ηbefore−Jet + ηnew−cell × Pnew−cellt

P after−jett

φafter−jet = φbefore−Jet + φnew−cell × Pnew−cellt

P after−jett

41

Page 51: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

1. 입자들의 리스트를 작성한 후 가장 큰 가중치 (예를 들면 Pt)를 가지는 입자를

선택, 선택은 조건을 줄 수 있다.

2. 이를 seed라고 부르며, seed의 위치가 제트 중심의 초기위치가 됨.

3. 제트 중심을 기준으로 주어진 반지름으로 하는 원을 그림.

4. 원 안에 들어오는 모든 입자들을 가중치가 큰 순서로 정렬하여 제트와 재결성

방식을 이용하여 추가.

5. 씨앗과 결합한 입자들은 리스트에서 제거. 모든 입자들이 없어질 때까지 4-5

번 반복. 모든 입자가 없어지면 지금까지의 제트를 최종 제트로 결정

6. 1번으로 가서 반복. 단, 더이상 입자를 찾이 못한다면 종료.

4.2.2 Seedless infrared-Safe Cone(SISCone)

Seedless infrared-Safe Cone(SISCone)은 기존 Cone알고리즘들이 가지고 있

던 infrared-safe문제를 해결하기 위한 cone알고리즘이다. infrared safe는 2개

의 제트사이에 발생한 soft gluon의 유무로 인하여 2개의 제트로 합쳐지는 현상을

말하는데, 이 문제의 발생원인은 cone알고리즘이 가진 seed(cone의 중심)이라는

개념 때문에 생겨나는 것으로 알려졌다. SISCone은 모든 측정된 cell들을 각각을

특정한 원들의 한 점으로 생각하는 개념을 이용하여 seed를 없애 이러한 문제를 해

결하려 하였다. 이렇게 생겨난 무수히 많은 원들의 집합을 다른 셀을 이용하여 생겨

42

Page 52: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

난 원들과 합치거나 나눠서 (split and merge과정) 제트를 검색하게 된다. 이러한

naive한 방법은 시간소요가 너무나 어마어마하여 사용되는 SISCone 알고리즘은

두 개의 점을 지나는 2개의 원을 셀을 중심으로 회전시켜 원들을 만들고 이들 중

의미없는 원들을 제거하고 난 후, 남은 원들을 합쳐 제트를 구성하게 된다. 자세한

알고리즘은 아래와 같다.

1. 소프트 글루온으로 생겨난 입자는 생략한다.

2. 하나의 입자 i를 선택한다. 그리고, 그 입자를 중심으로 2R의 거리 안에 있는

모든 입자들을 j라고 지정한다..

3. i와 j를 지나는 반지름 R의 원 2개를 그린다. 총 원은 2j 개일 것이다.

4. 모든 원들마다 i와 원의 중심을 잇는 선을 그린 후 선의 각도를 측정하고 작은

각도부터 큰 순서로 정렬한다.

5. 첫번째 원부터 시작한다. 원에 포함된 입자들로 운동량을 계산하는데, i와 j를

순열로 빼서 계산하여 총 4개의 ”현재 원뿔들”을 만든다. 즉, i와 j가 포함된

원뿔, i만 포함된 원뿔, j만 포함된 원뿔, i와 j가 포함되지 않은 원뿔 총 4

개를 만든다.

6. 각 원뿔 4개를 기존에 있었던 원뿔들과 비교해본다. 같은 원뿔이 있다면 빠진

i와 j의 상태도 같은지 확인한다. 같다면 원뿔로 정하고, 다르다면 불안정한

원뿔이라고 한다.

7. 5번으로 가서 모든 원이 종료할 때까지 원뿔들을 찾는다.

43

Page 53: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

8. 2번으로 가서 모든 입자들이 종료될 때까지 반복한다.

9. 안정한 원뿔들이 정말 그런지 체크한다.

10. 안정한 원뿔을 리스트에 추가한다.

4.2.3 KT, AK 알고리즘

위 두 알고리즘은 모든 입자들 상호간의 영향력을 계산하여 클러스터를 만들어 제

트를 검색하는 알고리즘이다. 최초의 가장 naive한 알고리즘은 아래와 같다.

di,j = min(pkt,i), pkt,j ×

(ηi − ηj)2 + (φi − φj)

2

R

di,b = pkt,i

Kt : k = 2, AK : k = −2

위의 di,j가 di,b보다 작은 경우에는 각 셀들을 합치게 되고 더이상 그런 셀이 존재

하지 않는다면 다음 셀로 넘어가서 나머지 작업을 처리하게 된다. 위의 나와 있는

수식을 이용하여 내용을 분석하면, Kt알고리즘은 기준이 되는 Celli의 Pt가 클수록

더 멀리 있는 Cell들이 합쳐지고, AK알고리즘은 비교대상인 Cellj의 Pt가 클수록

멀리 떨어져있는 Cell들도 합쳐지게 된다. 따라서, Kt보다 AK알고리즘을 사용할

때에 큰 Pt의 입자가 작은 Pt를 가진 입자들보다 더 가중치가 크도록 제트를 검색

할 수 있다. 위 알고리즘으로 계산을 하게 되면, 필요한 계산횟수는 O(N3)이지만,

최근 FastJet알고리즘[4]으로 인하여 O(NlogN)정도로 속도를 개선하게 되었다.

44

Page 54: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

4.2.4 물귀신 알고리즘

이 논문에서 살펴보고자 하는 물귀신 알고리즘은 콘 알고리즘과 클러스터 알고리즘

의 성질을 취한 알고리즘이다. 기본적으로 seed를 중심으로 원뿔 계산을 하기 때문

에 콘 알고리즘으로서의 성질을 지니면서도, 계산 과정에는 AK알고리즘과 비슷하

게 어느 클러스터에 속하는지를 조사한다는 점은 클러스터 알고리즘처럼 작동하게

된다. 가장 naive한 물귀신 알고리즘은 다음과 같다.

1. 모든 셀들을 Pt별로 내림차순으로 정렬한다.

2. 가장 높은 셀부터 하나씩 기존 제트들의 구성성분들이 존재하는지 비교한다.

3. 기존 제트들의 구성성분이 존재하지 않는다면 그 셀을 새로운 제트로 만든다.

4. 기존 제트들의 구성성분들이 존재한다면 그 중 가장 가까운 구성성분이 있는

제트에 해당 셀을 추가한다.

5. 가까운 거리에 구성성분이 존재하지 않는다면 그 셀이 새로운 제트가 된다.

위 알고리즘대로 프로그램을 작성할 경우 필요한 계산횟수는

(1) - Average : O(NlogN), (2) - O(N2), (3) - O(N) 이므로 가장 많이 계

산을 하는 수식이 주요한 계산식이 되므로 O(N2)가 된다. 이는 여타 다른 cone

알고리즘 (SIS,IC)과 비슷한 속도를 가지게 된다. 또한, 제트검색의 정확성은 AK

45

Page 55: Study on performance of jet finder algorithms at the LHC energy

제 3 장. 소프트웨어

와 비슷하며, infrared-safe한 알고리즘이다. 이 알고리즘은 Kt, AK알고리즘이

최적화되기 이전에는 속도와 정확성 면에 있어서 비교대상이 없을만큼 매우 우수한

알고리즘이었으나, 최근 FastJet알고리즘으로 인하여 클러스터 알고리즘이 O(N3)

에서 O(NlogN)의 속도를 가지게 되어 그 장점인 속도 면에 있어서 논란의 여지가

있다.

하지만, 알고리즘의 구조상 초기 탐색속도가 굉장히 빠르기 때문에 중이온 충돌 실

험들의 실험에서 제트의 트리거링에 사용된다면 매우 탁월한 기능을 하리라 예상할

수 있다. 다른 알고리즘들은 어마어마한 데이터를 처음부터 모두 계산하여야 하는

반면, 이 알고리즘은 이미 존재하는 제트와만 비교하면 되기 때문이다.

46

Page 56: Study on performance of jet finder algorithms at the LHC energy

제 4장

실험설계및결과

제 1 절 제트 검색 능력 비교

1.1 Infrared Safety Test

표 4.1: Infrared Safety Test[IR(3+1)]를 위한 입자 목록

Particle Pt eta phi

1 400 0 0

2 110 0.9R 0

3 90 2.3R 0

4 1.1 1.5R 0

제트 검색 알고리즘의 성능 측정 중 Infrared test는 2개로 나누어진 제트가 하

나의 soft-gluon의 영향으로 하나로 합쳐지는 현상이 발생하는지를 확인하는 것이

다. 간단한 실험방법은 표4.1에 있는 입자들을 집어넣을 때 3번 입자까지 넣었을

47

Page 57: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

표 4.2: Infrared test[IR(3+1)] 결과

Jet 알고리즘 True Data True + Soft gluon Data Result

CMS IC J1 2.3R 90GeV J1 2.29167R 91.1

J2 0.2004R 510GeV J2 0.2004R 510 Passed

MGS J1 2.3R 90 J1 2.3R 90

J2 0.2004R 510 J2 0.203492R 511.1 Passed

SIS J1 0.588337R 600 J1 0.590174R 601.1 Passed

KT J1 2.3R 90GeV J1 2.3R 90

J2 0.2004R 510 J2 0.203492R 511.1 Passed

AK J1 2.3R 90GeV J1 2.29167R 91.1

J2 0.2004R 510GeV J2 0.2004R 510 Passed

Atlas Cone J1 2.3R 90 J1 0.590174R 601.1

J2 .2004R 510 Failed

때와 4번 입자 (soft-gluon)를 넣었을 때 얼마나 민감하게 반응하는지를 살펴보는

것이다.[9]

1.2 Collinear Test

표 4.3: Collnear Safety Test를 위한 입자 목록

Particle Pt eta phi

1-1 600 -0.3R 0

1-2 600 +0.3R 0

2 1000 0.7R 0

3 300 -0.7R 0

Collinear 테스트는 작은 Pt값을 가지는 여러 개의 입자들이 검출기의 구조상 혹

은 워낙 거리가 가까워서 합쳐졌을 때와 구별되었을 때 제트 알고리즘이 얼마나 민

감하게 변하는 것을 검증하는 것이다. 이 테스트에서는 표4.3의 입자 1-1와 1-2를

48

Page 58: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

표 4.4: Collinear Safety Test 결과

Jet 알고리즘 True Data True + Soft gluon Data

CMS IC J1 0.199694R 2500GeV J1 -0.7R 300GeV

J2 0.323308R 2200 Failed

MGS J1 0.199694R 2500GeV J1 0.199694R 2500GeV passed

SIS J1 0.199694R 2500GeV J1 0.199694R 2500GeV passed

KT J1 0.199694R 2500GeV J1 0.199694R 2500GeV passed

AK J1 0.199694R 2500GeV J1 0.199694R 2500GeV passed

합쳤을 때와 분리했을 때를 대입하였을 때 제트의 개수가 변하는지 확인하여 검사

결과를 도출하였다. 위에서 살펴본 infrared test와 collinear test를 실패하게 되

면 파이만 다이어그램은 발산하게 되어 물리적인 의미가 없어지게 된다.[1]

물귀신 알고리즘은 Infrared Safety와 Collinear Safety 간이 테스트를 통과하

여 물리적인 의미를 분석할 때 문제가 없는 알고리즘인 것을 확인할 수 있다.

1.3 Parton jet과 Reconstruction Jet의 에너지 비교

표 4.5: Jet Pt resolution 결과

Jet 알고리즘 Mean RMS

CMS IC 0.5381 0.1749

MGS 0.5485 0.1773

SIS 0.5448 0.1722

KT 0.5427 0.1783

AK 0.5374 0.1756

49

Page 59: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.1: Jet의 MinPt 10GeV일 때의 에너지 비율

50

Page 60: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

최초의 충돌시 Hard-process과정에서 나오는 쿼크나 글루온들을 파톤이라고 부

르며, PYTHIA의 경우 이러한 파톤은 2 → 2 형식으로 구성되어 2개의 Outgoing

Parton을 구성하게 된다. 이 입자들이 최초로 수직방향의 운동량 (Pt)를 가지게

되므로 이를 참값으로 두고 재구성된 제트를 비교하여 얼마나 해당 알고리즘이 에

너지를 감지할 수 있는지를 확인해보는 작업을 해보았다. 이 작업을 위하여 생성

한 PYTHIA 전산모사 결과를 Hard QCD사건들로 파톤 레벨에서의 Pt의 최

소값을 50GeV를 가지도록 생성되었으며, 파톤과 제트의 상관관계를 명확하게 분

석하기 위하여 파톤레벨에서의 작업 중 하나의 파톤에서 발생했다고 보기 어려운

Multiple interaction(MI)와 Initial state radiation(ISR)은 사용하지 않도록

수정된 설정으로 전산모사되었다. 각 알고리즘들간에는 오차범위 안에서의 차이만

존재하기 때문에 각 알고리즘 중 더 뛰어난 알고리즘이라고는 이야기 할 수 없으나,

그림4.1에 의하면 각 알고리즘 중 물귀신 알고리즘이 가장 파톤의 에너지를 재구

성할 수 있는 것으로 분석되었으며, 그 다음으로 SISCone알고리즘이 잘 재구성한

것으로 나타났다. 표4.5는 각 값들의 평균값 및 RMS값을 나타낸 표이다. 가장

잘 재구성한 물귀신 알고리즘과 가장 재구성을 하지 못한 AK알고리즘간 Pt의 차

이는 평균 2%이며, 이는 오차범위 안에 들어간다. 오차범위를 줄여 알고리즘간의

상관관계를 밝히려면 10억번의 사건을 이용한 작업이 필요할 것으로 보여진다.

1.4 제트 알고리즘간 속도비교

제트 알고리즘의 성능을 분석할 때에는 정확성과 재구현된 에너지 혹은 Pt와 더불

어 제트 알고리즘이 얼마나 시간을 소모하는지에 대한 연구도 필요하다. 그림4.2는

51

Page 61: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.2: Seed Pt 1GeV일 때의 속도 비교

52

Page 62: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.3: Seed Pt 2GeV일 떄의 속도 비교

53

Page 63: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

Cone알고리즘 중 IC와 MGS 같은 Seed를 사용하는 알고리즘의 Seed의 Pt를

최하 1GeV로 잡은 것으로 실제 검출기에서는 하드웨어 구성상 1GeV이하의 에

너지를 구별하는 것이 쉽지 않기 때문에 주로 사용되는 Cut 조건이다. 이를 통해서

보면 FastJet 알고리즘을 사용하고 있는 KT, AK알고리즘은 NlogN의 속도로 증

가하고 있어 가장 빠른 속도를 가지고 있으며, 나머지 알고리즘들은 N32 의 속도로

증가하는 것을 볼 수 있다. 그 중에서 Seed값을 줄일 수 없는 SISCone알고리즘

이 가장 느린 속도를 가지는 것으로 조사되었으며, 물귀신 알고리즘은 IC알고리즘

보다 조금 빠른 속도를 가진 것으로 조사되었다. 이는 Jet의 eta,phi를 변경하는

부분이 물귀신 알고리즘에서는 필요가 없어 생략되었기 때문이다. 하지만, 추후 물

귀신 알고리즘의 정확성을 향상시키기 위해서 Jet의 Eta,Phi의 Recombination

scheme과정을 거치게 된다면 IC알고리즘과 비슷하거나 약간 느린 속도를 가지게

될 것이다. Seed Pt의 컷 조건을 2GeV로 할 경우 계산수가 줄어들어 더 빠른

시간안에 제트 검색을 끝낼 수가 있다. 물론, Seed가 없는 SIS, KT, AK는 이를

적용할 수 없다.

1.5 제트 알고리즘 검색 결과 비교

다음 그림들은 각 알고리즘에 따른 제트 검색 결과를 그린 것으로, 이를 살펴보면

물귀신 알고리즘과 SIS알고리즘이 다른 알고리즘보다도 보다 많은 입자들을 제트

로 검색하는 것을 알 수 있다. 특히, AK알고리즘과 물귀신 알고리즘의 결과가 비

슷한 것으로 보인다.

54

Page 64: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.4: CMS Iterative 알고리즘을 이용한 제트 검색 결과

그림 4.5: Seedless Infrared-safety(SIS) Cone 알고리즘을 이용한 제트 검색 결과

55

Page 65: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.6: KT 알고리즘을 이용한 제트 검색 결과

그림 4.7: AK 알고리즘을 이용한 제트 검색 결과

56

Page 66: Study on performance of jet finder algorithms at the LHC energy

제 4 장. 실험 설계 및 결과

그림 4.8: 물귀신 알고리즘을 이용한 제트 검색 결과

57

Page 67: Study on performance of jet finder algorithms at the LHC energy

제 5장

결론

우리는 LHC에너지에서의 PYTHIA 전산모사 프로그램을 이용하여 발생시킨 충

돌사건을 이용하여 각각의 제트 검색 알고리즘의 성능을 비교해 보았다. 이 논문에

서 주로 보고자 했던 내용은 물귀신 알고리즘의 성능 분석으로 검색된 물귀신 알고

리즘은 다른 알고리즘들과 비교하여 제트 검색 능력이 최대 2%정도 좋은 것으로

나타났으며, 물귀신 알고리즘의 최적화 수준에 따라 제트 검색 시간이 Cone알고

리즘들 중에 가장 빠른 것을 볼 수 있었다. 또한, 이미 최적화된 Kt 및 AK알고리

즘과의 비교할 떄에도 Seed Cut을 줄 경우 거의 유사할 정도로 속도의 개선을 가

져올 수 있음을 알 수 있었다. 물귀신 알고리즘은 AK알고리즘과 비슷한 방식으로

클러스터링을 하는데 이를 플롯으로도 확인할 수 있었다.

58

Page 68: Study on performance of jet finder algorithms at the LHC energy

참고문헌

[1] Gerald C. Blazey, Jay R. Dittmann, Stephen D. Ellis, V.Daniel Elvira,

K. Frame, et al., Run ii jet physics, Tech. report, Run II, 2000.

[2] M Bosman, I C Park, M Cobal, D Costanzo, S Lami, R Paoletti, Georges

Azuelos, and K Strahl, Jet finder library: version 1.0, Tech. Report ATL-

SOFT-98-038, CERN, Geneva, Sep 1998.

[3] Stephen Burke, Simone Campana, Elisa Lanciotti, MaartenLitmaath, Patrici-

aMe ndez Lorenzo, Vincenzo Miccio, Christopher Nater, Roberto Santinelli,

and Andrea Sciaba, glite-3-userguide, CERN, 2011.

[4] Matteo Cacciari and Gavin P. Salam, Dispelling the n**3 myth for the k(t)

jet-finder, Phys. Lett. B641 (2006), 57–61.

[5] S V Chekanov, Jet algorithms: a minireview, Hadron collider physics 2002

2002 (2002), no. hep-ph/0211298. ANL-HEP-CP-2002-103, pp. 478–486.

59

Page 69: Study on performance of jet finder algorithms at the LHC energy

참고 문헌

[6] CMS Collaborator, Cms physics technical design report volume i: Detector

performance and software, Technical Design Report CMS, CERN, Geneva,

2006.

[7] Bayatyan GL, Della Negra, Michel, Foa, Herve A, Petrilli, and Achille, Cms

computing: Technical design report, Technical Design Report CMS, CERN,

Geneva, 2005, Submitted on 31 May 2005.

[8] A. M. Poskanzer and S. A. Voloshin, Methods for analyzing anisotropic flow

in relativistic nuclear collisions, Phys. Rev. C 58 (1998), 1671–1678.

[9] Gavin P. Salam and Gregory Soyez, A practical seedless infrared-safe cone jet

algorithm, Journal of High Energy Physics 2007 (2007), no. 05, 086.

[10] Michael H. Seymour, Searches for new particles using cone and cluster jet al-

gorithms: a comparative study, Zeitschrift fur Physik C Particles and Fields

62 (1994), 127–138, 10.1007/BF01559532.

[11] Torbjorn Sjostrand, Stephen Mrenna, and Peter Skands, Pythia 6.4 physics

and manual, Journal of High Energy Physics 2006 (2006), no. 05, 026.

[12] S. Voloshin and Y. Zhang, Flow study in relativistic nuclear collisions by

fourier expansion of azimuthal particle distributions, Zeitschrift fA1/4r Physik

C Particles and Fields 70 (1996), 665–671, 10.1007/s002880050141.

60

Page 70: Study on performance of jet finder algorithms at the LHC energy

참고 문헌

[13] 홍 병식 권 민정, 김 동조, 특별한 강한상호작용 물질의 실험적인 증거, 물리와

첨단기술학과 첨단기술 1-2월호 (2010), pp26–31.

[14] 전 상용, 쿼크-글루온 플라즈마와 제트 소멸, 물리와 첨단기술 1,2월호 (2010),

10–16.

61

Page 71: Study on performance of jet finder algorithms at the LHC energy

Abstract

Study onperformance of jetfinder algorithms at the LHC

energy

Geonmo Ryu

Department of Physics

The Graduate School

University of Seoul

On high energy physics, the particle accelerator experiment was very

important, the accelerator physics had many categories because it colud

use various particles as source. LHC has 2 mode. one was proton-proton

collision and the other was Pb-Pb heavy ion collision. Especially, heavyion

collision was very useful experiment for measure of QGP’s property. QGP

(Quark-gluon plasma) was very interesting phenomenon because it was

only existed at very high temperature and it had very strong interaction

for quarks and gluons. We studied elliptic flow.Also, we studied jets to

know jet quenching on this paper.

62

Page 72: Study on performance of jet finder algorithms at the LHC energy

감사의글

석사 학위논문을 쓰는데 많은 격려와 도움을 주신 많은 분들께 감사를 드립니다.

학위논문을 쓰는데 필요한 물리학에 대해 깊이 이해하도록 많은 지도를 해주신 박

인규 교수님께 특히 깊은 감사를 드립니다. 또한, 논문을 심사해주신 민현수 교수

님, 박동수 교수님께도 정말 감사를 드립니다. 교수님들께 신경 써주신 덕에 보다

훌륭한 논문을 작성할 수 있었습니다. 또한, 이때까지 부족한 저를 위해 많은 가르

침을 주신 이주한 교수님, 한문섭 교수님, 유병덕 교수님, 최은집 교수님, 손주혁

교수님, 노재동 교수님께도 깊은 감사를 드립니다.

옆에서 많은 격려를 해주신 박차원 박사님, 김지현 박사님께 감사를 드립니다. 논

문을 쓰는 가운데 불안한 마음을 격려해주시고 부족한 부분이 있을 때마다 이를 지

적해주셔서 많은 도움을 받았습니다. 또, 같은 실험실 식구로서 많은 격려를 아끼지

않으신 서곤이형, 민규형, 가람이형, 원일이형과 동기인 현용이와 태희, 기진이한테

도 진심으로 감사를 드립니다. 또한, 랩미팅 시간에 참석하셔서 많은 지적을 해주신

상남이형과 태형이형에게도 감사를 드립니다.

63