gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve vs fzÚ )
DESCRIPTION
Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ ). Ji ří Chudoba Institute of Physics and CESNET, Prague. Přehled. Hardware Jeho využití ATLAS Data management VO auger Další skupiny – fyzika pevných látek Tým – mo žnost aktivní účasti!. EGI v CZ. - PowerPoint PPT PresentationTRANSCRIPT
www.egi.euEGI-InSPIRE RI-261323
EGI-InSPIRE
www.egi.euEGI-InSPIRE RI-261323
Gridové výpočty pro velké projekty i jednotlivé uživatele(aktivity ve VS FZÚ)
Jiří ChudobaInstitute of Physics and CESNET, Prague
www.egi.euEGI-InSPIRE RI-261323
Přehled
• Hardware• Jeho využití• ATLAS Data management• VO auger• Další skupiny – fyzika pevných látek• Tým – možnost aktivní účasti!
4.3.2013 [email protected] 2
www.egi.euEGI-InSPIRE RI-261323
EGI v CZ
4.3.2013 [email protected] 3
http://grid-monitoring.cern.ch/myegi/gridmap/
www.egi.euEGI-InSPIRE RI-261323
Hardware – středisko FZÚ
• praguelcg2• publikujeme 3860 jader• 1.5 PB DPM, 540 TB xrootd, 40 TB dcache v
Plzni• HW různého typu
4.3.2013 [email protected] 4
www.egi.euEGI-InSPIRE RI-261323
Hardware – středisko FZÚ
4.3.2013 [email protected] 5
• Hlavní serverovna• 62 m2, ~20 racks 350 kVA motor generator, 200 + 2 x 100 kVA
UPS, 108 kW air cooling, 176 kW water cooling
www.egi.euEGI-InSPIRE RI-261323
HW ve FZÚ
Farma Goliáš z několika subklastrů• společný torque server, subklastry z
různého hw
4.3.2013 [email protected] 6
Například subklastr rubus:23 uzlů SGI Rackable C1001-G132x (Opteron 6274 16 jader) 64 GB RAM, 2x SAS 300 GB374 W (full load)232 HS06 na uzel, 5343 HS06 celkem
Celkem v klastru Goliáš: 30700 HS06
www.egi.euEGI-InSPIRE RI-261323
HW ve FZÚ
4.3.2013 [email protected] 7
47%
26%
22%
4% 1%
37%
30%
28%
1% 4%
d0
alice
atlas
auger
solid
2011 HS06 shareAlice+Star 7551 30Atlas 7087 28D0 9165 37Solid 914 4Calice 30 0Auger 205 1
24951 100
2012 HS06 shareAlice+Star 7564 25Atlas 11861 39D0 9969 32Solid 629 2Calice 13 0Auger 668 2
30704 100
3%4% 15%
22%
15%8%
5%
12%
17%
Golias-pGolias-cIberisIbisIbSalixSaltixDorjeRubus
Plán a skutečnost (walltime)Kapacita podle subklastrů
www.egi.euEGI-InSPIRE RI-261323
Tier2 centrum pro LHC
Příspěvky pro 2012 ATLAS závazek: 10000 HS06, 1030 TiB; dostupné: 11861 HS06, 1300 TB ALICE závazek: 5000 HS06, 420 TiB; dostupné: 7546 HS06, 540 TB
4.3.2013 [email protected] 8
Plnění: vyžaduje se 70% z plánované kapacity, ale CPU timeProblematické pro ALICE, kde je efektivita kolem 50%
www.egi.euEGI-InSPIRE RI-261323
ATLAS DDM
• Komplikovaný systém pro potřeby projektu ATLAS• Současná verze DQ2, nová Rucio• Eviduje 120 PB dat, 350 mil. souborů• DQ2:
• práce s Datasety (množiny souborů)• db pro DS a jejich obsah• fyzické umístění souborů pomocí LFC• 11 LFC (jeden LFC pro oblast) postupně přenášeno do CERN• FTS zůstávají v Tier1• podpůrné služby: DaTRI, data popularity, obsazenost prostoru
4.3.2013 [email protected] 10
www.egi.euEGI-InSPIRE RI-261323
ATLAS DDM
4.3.2013 [email protected] 11
Přenosy dat do FZÚ, graf za 1 týden
www.egi.euEGI-InSPIRE RI-261323
ATLAS – přenosy dat
4.3.2013 [email protected] 12
Přenesený objem dat
www.egi.euEGI-InSPIRE RI-261323
ATLAS – přenosy dat
4.3.2013 [email protected] 13
počty přenesených souborů za den
www.egi.euEGI-InSPIRE RI-261323
Lokální přenosy
4.3.2013 [email protected] 14
Přenosy z lokálních SE (nejvíce na lokální WN) dosahují rychlosti přes 30 Gbps
www.egi.euEGI-InSPIRE RI-261323
Výsledky
4.3.2013 [email protected] 15
https://twiki.cern.ch/twiki/bin/view/AtlasPublic
Number of public papers: 245 Number of public papers with collision data: 237 Number of published papers: 216 Last updated: 2013-02-25, 17:02
www.egi.euEGI-InSPIRE RI-261323
PAO
• Pierre Auger Observatory
• 19 zemí, 500 členů, 94 institucí
• plocha 3000 km2
4.3.2013 [email protected] 16
www.egi.euEGI-InSPIRE RI-261323
VO auger
• Založili jsme roku 2006 v rámci EGEE II• Poskytujeme centrální služby
• VOMS, LFC• Největší VO mimo LHC ve využití CPU
4.3.2013 [email protected] 17
www.egi.euEGI-InSPIRE RI-261323
VO auger: Zapojení mnoha oblastí
4.3.2013 [email protected] 18
Poměr příspěvků pro VO auger různých oblastí do celkového použitého výpočetního času; data pro celý rok 2011
www.egi.euEGI-InSPIRE RI-261323
Superpočítač Dorje
• Vyhrazený klastr pro skupiny fyziky pevných látek
• Altix ICE8200, 512 jader, 64 uzlů spojených Infiniband
• Využití 50 až 80% kvůli omezujícím pravidlům (maximální počet úloh od 1 uživatele), požadavek na okamžitou odezvu
• Rozšíření ještě v tomto roce, investice 900 kKč
4.3.2013 [email protected] 19
www.egi.euEGI-InSPIRE RI-261323
Lidské zdroje
• Neprovozujeme standardní software• Správa vyžaduje proaktivní přístup, častou komunikaci, otevřenou
hlavu!• Prostor pro nové nápady, detailní ladění a zkoumání určitých částí• Správa OS, monitorování, programování v shell, python, perl, C,
C++, Fortran, správa MySQL, práce s páskami, ...
• Schopní pracovníci stále vítáni.
4.3.2013 [email protected] 20
Kontakt: [email protected]
http://www.farm.particle.cz/twiki/bin/view/VS/WebHome
www.egi.euEGI-InSPIRE RI-261323
pád dpm daemona 28.9.2012
• email od nagios ve 4:18 (plus SMS)• TK restartoval v 10:20, zápis do FarmEvents
• recovery: email a SMS v 10:21• 13:42 GGUS TEAM lístek 86515 (RT 35874)
In the last 6 hours more than 300 failures in praguelcg2 production.• TK odpověděl a zavřel ve 13:45
4.3.2013 [email protected] 21
V pátek 28.9. začínal dlouhý víkend. Oficiálně nemáme žádné směny mimo pracovní dobu.