To tam w 1989 roku Tim Berners-Lee wymyślił World Wide Web (WWW). To tam powstała pierwsza strona internetowa. To tam przechowuje się do dziś pierwszy komputer, który pełnił rolę serwera internetowego. CERN Data Center jest dziś sercem Grid, czyli całej sieci centrów komputerowych, które współpracują ze sobą po to, żeby zapewnić wystarczającą możliwość przetwarzania danych, pochodzących z eksperymentów Wielkiego Zderzacza Hadronów. Pracuje tam 15 dziś tysięcy serwerów, a dane - na zawsze - zapisywane są na 30 tysiącach taśm magnetycznych.

System zapisu na taśmach magnetycznych w CERN / Grzegorz Jasiński / RMF FM

Centrum Komputerowe (CERN Data Center) jest sercem całej infrastruktury naukowej Europejskiej Organizacji Badań Jądrowych CERN. To tam trafiają ogromne ilości danych, zbieranych podczas eksperymentów prowadzonych w Wielkim Zderzaczu Hadronów. Dane przechowywane są tam na stałe, ale dodatkowo trafiają do sieci 170 centrów obliczeniowych w ponad 40 krajach światowej sieci obliczeniowej LHC, czyli Worldwide LHC Computing Grid (WLCG). Ta sieć, zwana popularnie Gridem zapewnia globalne zasoby obliczeniowe do przechowywania, dystrybucji i analizy danych z LHC i innych eksperymentów w CERN. Rozszerzenie CERN Data Centre w postaci centrum komputerowego w Wigner Research Centre for Physics na Węgrzech zapewnia dodatkowe możliwości gromadzenia i analizy danych.





Jeden z dwóch pierwszych serwerów internetowych na świecie (CERN Data Center) / Grzegorz Jasiński / RMF FM



W Centrum Komputerowym CERN pracuje około 15000 serwerów, 260000 rdzeni procesorów, 130000 dysków twardych i 30000 taśm magnetycznych. Na taśmach magnetycznych zarchiwizowano tam 340 petabajtów danych (340 milionów gigabajtów), co odpowiada 2000 lat filmów zapisanych w jakości HD. W samym 2018 roku zapisano 115 petabajtów nowych danych. Po rozpoczęciu eksperymentów w warunkach większej świetlności akceleratora strumień danych będzie jeszcze większy. Aparaturę Centrum i eksperymenty LHC łączy w sumie ponad 50000 kilometrów światowodów.

Między Genewą a oddalonym o 1200 kilometrów Wigner Data Centre na Węgrzech poprowadzono trzy linie światłowodowe o szybkości przesyłu danych 100 Gb/s, przekazanie informacji między nimi trwa około 12 milisekund. Przeciętnie eksperymenty LHC przynoszą rocznie 50 petabajtów danych, inne eksperyment w CERN, np. dotyczące antymeterii, jeszcze około 25 petabajtów.





Katarzyna Dziedziniewicz-Wójcik / Grzegorz Jasiński / RMF FM

Do długotrwałego magazynowanie danych używa się w CERN przede wszystkim taśm magnetycznych. Ta technologia okazuje się wciąż bardzo skuteczna i pojemna. Taśmy są względnie tanie i bardzo trwałe, nie zajmują dyzo miejsca. Pozwalają też ograniczać zużycie prądu, bo czytniki pracują tylko w chwili zapisu i odczytu. Warunkiem wysokiej wydajności takiej metody gromadzenia danych jest wykorzystanie robotów, które automatycznie znajdują odpowiednią taśmę i dokonują jej odczytu.

Wszystkie dane z poprzednich eksperymentów są przechowywane już na zawsze, co jakiś czas dokonuje się tylko ich przepisania na nowe taśmy. Ilość danych z poprzednich okresów pracy CERN jest znikoma w porównaniu z obecnie gromadzonymi. Cały zestaw danych z eksperymentów akceleratora LEP, który był poprzednikiem Wielkiego Zderzacza Hadronów, to zaledwie około 400 terabajtów.

Artur Więcek / Grzegorz Jasiński / RMF FM

Chłodzenie jest poważnym problemem wszystkich centrów obliczeniowych. Nie inaczej jest w CERN. Temperatura w Centrum Komputerowym jest tropikalna, przekracza 30 stopni Celsjusza. Szybsze procesory, nawet nowszych generacji, pracują coraz bardziej intensywnie, nagrzewają się bardziej i obecnie ilość wydzielanego w tych układach ciepła rośnie nawet szybciej, niż ich możliwości obliczeniowe. Niektóre szafy z procesorami nie mogą być z tego względu wypełnione w większym stopniu niż 30-40 procent. Ograniczeniem są właśnie zdolności chłodzenia i ilość prądu, którą można do centrum doprowadzić. Praktycznie nie ma możliwości wypełnienia CDC bardziej. Samo chłodzenie wymaga około 1,5 MW energii elektrycznej. By poprawić efektywność chłodzenia szafy ustawione są tak, że tworzą gorące i chłodne korytarze, te ostatnie są zamknięte, by dopuszczać do procesorów tylko schłodzone powietrze.

W CERN Data Center / Grzegorz Jasiński / RMF FM

Grid to sieć centrów komputerowych, które współpracują ze sobą po to, żeby zapewnić wystarczającą możliwość przetwarzania danych. Przy wykorzystaniu tylko komputerów w CERN Data Center byłoby to niemożliwe. Dane eksperymentalne przechowywane są więc nie tylko na miejscu. Tam jest tylko ich pierwsza kopia. Dane przetworzone, używane do analiz, są rozrzucone po całym świecie w wielu ośrodkach, na różnych etapach analizy. Użytkownik tak naprawdę nie musi wiedzieć, gdzie te dane są. Oprogramowanie, które służy do ostatecznej analizy, jest przesyłane do tych danych, bo kod do przesłania jest w tym przypadku stosunkowo niewielki. Program wykonuje pracę w miejscu gdzie są dane, a potem same wyniki wracają do użytkownika. Jedno tzw. zadanie może się wykonywać w bardzo wielu miejscach na świecie, w zależności od tego, gdzie dane wejściowe są.

Zobacz CERN Data Center RMF FM

W październiku 2019 roku przedstawiciele polskich mediów, korzystając z długiej przerwy modernizacyjnej Wielkiego Zderzacza Hadronów (LHC), mieli możliwość zwiedzania akceleratora.

CERN zaprasza dziennikarzy z krajów członkowskich i stowarzyszonych do odwiedzenia swej siedziby, w szczególności zapoznania się z udziałem naukowców z danego kraju w prowadzonych tam badaniach. Podczas dwudniowej wizyty polscy dziennikarze reprezentujący prasę, radio i media online zwiedzili dwa spośród wielkich eksperymentów na Wielkim Zderzaczu Hadronów, CMS i ALICE, tunel samego akceleratora, a także inne laboratoria i projekty ze znaczącym udziałem polskich grup badawczych. Wszędzie byli oprowadzani przez polskich ekspertów.