O projekcie | Podstawy formalne | Pakiety robocze | Dokumenty | Produkty | Spotkania | Partnerzy | Kontakt |

 »   Pakiety robocze

 »   WP 3.2 Zastosowanie zapasowego centrum obliczeniowego

Prowadzący »
inż. Jan Orłowski
IMGW, oddział Kraków
Współrealizujący » ACK Cyfronet, PCSS
Data rozpoczęcia » 1 marca 2003
Data zakończenia » 31 października 2004
[ Harmonogram  | Zespół  | Dokumenty ]
Krótki opis zadania

Instytut Meteorologii i Gospodarki Wodnej w Warszawie, w ramach projektu likwidacji skutków powodzi z lipca 1997 roku (projekt finansowany z kredytu Banku Światowego), zakupił system SGI Origin 2000. System ten wykorzystany zostanie do obliczania prognoz meteorologicznych i hydrologicznych.

W związku z koniecznością zakończenia obliczeń w ściśle określonym czasie, powstaje konieczność równoważenia obciążenia lub przeniesienia obliczeń na inne systemy. Dotyczy to w szczególności sytuacji kryzysowych, między innymi awarii systemu komputerowego IMGW. W sytuacjach awaryjnych lub zbyt dużego obciążenia systemu, część zadań obliczeniowych uruchomionych zostanie w ośrodkach superkomputerowych w ramach globalnego równoważenia obciążenia. Konieczne jest również uwzględnienie potrzeby przeniesienia obliczeń w trakcie ich trwania na inny zdalny system, przy zachowaniu ściśle określonego wcześniej czasu zakończenia zadania. Ponieważ systemy SGI, wchodzące w skład klastra krajowego, będą kompatybilne binarnie, możliwa jest również migracja procesów.

Głównym celem części badawczej zadania jest opracowanie i rozwój metod i narzędzi pozwalających na przejęcie obliczeń z zachowaniem krytycznego czasu ich zakończenia:

  • zmniejszenia obciążenia na systemie komputerowym IMGW poprzez dystrybucję zadań w środowisku rozproszonym,
  • utrzymywania ograniczeń krytycznych i zarządzanie zadaniami z określonym ostatecznym terminem zakończenia,
  • cyklicznego zapisu i tworzenia kopii zapasowych punktów kontrolnych (ang. checkpointing) zadania w celu umożliwienia automatycznej kontynuacji obliczeń w przypadku wystąpienia awarii sprzętowej,
  • zapewnienia możliwości równoległego obliczania kilku modeli meteorologiczncyh i hydrologicznych,
  • wcześniejszej rezerwacji zasobów obliczeniowych.

W celu podniesienia dostępności zasobów obliczeniowych proponuje się zastosowanie maszyn klienckich. Z powodu możliwości wystąpienia awarii maszyny obliczeniowej, wymagana jest replikacja danych zapamiętanego obrazu procesów. Zważywszy na fakt, iż cecha ta nie jest dostępna w systemie LSF, wymagane jest opracowanie projektu oraz jej implementacja. Proponuje się również wykorzystanie Systemu Użytkowników Wirtualnych (zobacz opis WP 6), który pozwoli na automatyzację procesu uruchamiania zadań w środowisku rozproszonym oraz zmniejszy narzuty czasowe związane z zarządzaniem kontami użytkowników.