1 / 13

Administrasjons-program for Cluster i HLT

Administrasjons-program for Cluster i HLT. CERN - ALICE. Torstein Thingnæs. CERN. I Genève Fra 1954 Forsker på partikler Bruker akseleratorer 3000 ansatte 6500 forskere. LHC - Large Hadron Collider. 27 km omkrets 50-170m dybde -271ºC Bruker LEP tunnelen. ALICE. Bly kollisjoner

havard
Download Presentation

Administrasjons-program for Cluster i HLT

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Administrasjons-program for Cluster i HLT CERN - ALICE Torstein Thingnæs

  2. CERN • I Genève • Fra 1954 • Forsker på partikler • Bruker akseleratorer • 3000 ansatte • 6500 forskere

  3. LHC - Large Hadron Collider • 27 km omkrets • 50-170m dybde • -271ºC • Bruker LEP tunnelen

  4. ALICE • Bly kollisjoner • Ca 10000 kollisjoner pr sekund • Ca 50 relevante kollisjoner pr sekund • 20000 produserte partikler • Flere 100 spor hver • Enorme datamengder

  5. TPC – Time Projection Chamber • Detekterer partikler • Måler punkter

  6. Bearbeiding av data • 50 GB/s inn • 1-2GB/s ut • Finne og fjerne feildata • Unødvendig data • Komprimere • Flere nivåer

  7. HLT – HIGH LEVEL TRIGGER • Bearbeiding på høyt nivå • Finne punkter fra spor • Komprimere data • Litt fysikk analyse • Velge ut interessante data • Trenger stor datakraft

  8. Cluster • 700 – 800 datamaskiner • Stor arbeidsmengde • Må foregå i sanntid • Jevn fordeling

  9. Min Problemstilling • Lage automatisk program • Sjekke status/belastning • Finne type feil • Mulige feil • Ujevn belastning • Låser seg • Andre software feil • Hardware

  10. Tiltak • Omfordele arbeidsbelasting • Utbedre feil • Omstart av node/programvare • Tilkalle hjelp

  11. Problemer • Finne feil på pc som er nede • Finne hva som er feil • Fjern omstart av låst pc

  12. Verktøy • Bruke Linux • C++/C • Bruke ferdige pakker, bl.a. AliRoot • Administrasjonsprogram på en maskin • Klientprogram på de andre

  13. Fremdrift • Sette seg inn i clusteret • Jobbe med Hansa-clusteret ved Institutt for fysikk og teknologi på UiB • Klargjøre mulige feil • Finne tiltak • Administrere

More Related