|
Krótki opis zadania
Instytut Meteorologii i Gospodarki Wodnej w
Warszawie, w ramach projektu likwidacji skutków powodzi z lipca 1997 roku
(projekt finansowany z kredytu Banku Światowego), zakupił system SGI Origin
2000. System ten wykorzystany zostanie do obliczania prognoz
meteorologicznych i hydrologicznych.
W związku z koniecznością zakończenia
obliczeń w ściśle określonym czasie, powstaje konieczność równoważenia
obciążenia lub przeniesienia obliczeń na inne systemy. Dotyczy to w
szczególności sytuacji kryzysowych, między innymi awarii systemu
komputerowego IMGW. W sytuacjach awaryjnych lub zbyt dużego obciążenia
systemu, część zadań obliczeniowych uruchomionych zostanie w ośrodkach
superkomputerowych w ramach globalnego równoważenia obciążenia. Konieczne
jest również uwzględnienie potrzeby przeniesienia obliczeń w trakcie ich
trwania na inny zdalny system, przy zachowaniu ściśle określonego wcześniej
czasu zakończenia zadania. Ponieważ systemy SGI, wchodzące w skład klastra
krajowego, będą kompatybilne binarnie, możliwa jest również migracja
procesów.
Głównym celem części badawczej zadania jest
opracowanie i rozwój metod i narzędzi pozwalających na przejęcie obliczeń
z zachowaniem krytycznego czasu ich zakończenia:
- zmniejszenia obciążenia na systemie komputerowym IMGW poprzez
dystrybucję zadań w środowisku rozproszonym,
- utrzymywania ograniczeń krytycznych i zarządzanie zadaniami z
określonym ostatecznym terminem zakończenia,
- cyklicznego zapisu i tworzenia kopii zapasowych punktów kontrolnych
(ang. checkpointing) zadania w celu umożliwienia automatycznej kontynuacji
obliczeń w przypadku wystąpienia awarii sprzętowej,
- zapewnienia możliwości równoległego obliczania kilku modeli
meteorologiczncyh i hydrologicznych,
- wcześniejszej rezerwacji zasobów obliczeniowych.
W celu podniesienia dostępności zasobów
obliczeniowych proponuje się zastosowanie maszyn klienckich. Z powodu
możliwości wystąpienia awarii maszyny obliczeniowej, wymagana jest
replikacja danych zapamiętanego obrazu procesów. Zważywszy na fakt, iż
cecha ta nie jest dostępna w systemie LSF, wymagane jest opracowanie
projektu oraz jej implementacja. Proponuje się również wykorzystanie
Systemu Użytkowników Wirtualnych (zobacz opis WP 6),
który pozwoli na automatyzację procesu uruchamiania zadań w środowisku
rozproszonym oraz zmniejszy narzuty czasowe związane z zarządzaniem kontami
użytkowników. |