O projekcie | Podstawy formalne | Pakiety robocze | Dokumenty | Produkty | Spotkania | Partnerzy | Kontakt |

 »   Pakiety robocze

 »   WP 2.2 Mechanizm punktów kontrolnych oraz migracja procesów dla procesorów IA-64

Prowadzący »
Dr inż. Maciej Stroiński
PCSS, Poznań
Współrealizujący » ACK Cyfronet AGH
Data rozpoczęcia » 2 czerwca 2003
Data zakończenia » 31 października 2004
[ Zespół  | Dokumenty ]
Krótki opis zadania

Zadania trwające długi okres czasu są narażone na przerwania za względu na awarie sprzętu lub oprogramowania. Ze względów ekonomicznych niewskazane jest tracenie czasu na ponowne wykonywanie przerwanych obliczeń od początku.

Systemy operacyjne przeznaczone dla rodziny procesorów Intela x86 nie zapewniają realizacji punktów kontrolnych na poziomie systemu operacyjnego. Taka funkcjonalność w świecie komputerów PC nie była do tej pory wymagana. Wprowadzenie przez firmę Intel nowej rodziny procesorów IA-64, daje możliwość wykorzystania tych procesorów do obliczeń HPC. Opracowanie i udostępnienie nowych procesorów oraz systemów operacyjnych dla nich przeznaczonych jest dobrym momentem na przygotowanie mechanizmu punktów kontrolnych na poziomie jądra oraz mechanizmu migracji zadań na inny węzeł obliczeniowy.

Bazując na doświadczeniach projektów CRAK i EPCKPT planowana jest implementacja mechanizmu punktów kontrolnych w środowisku systemu operacyjnego Linux dla nowych procesorów firmy Intel IA-64. Zadanie polega na zaimplementowaniu funkcji zatrzymywania, restartu oraz migracji zadań na komputerach z procesorami Intel Itanium pracujących pod systemem z rodziny Linux. Mechanizm punktów kontrolnych wdrożony zostanie jako moduł dołączany do systemu operacyjnego i będzie pracował na poziomie jądra systemu. Moduł ten będzie wspierał mechanizmy potoków, mechanizmów IPC (semafory, pamięć współdzielona, kolejki komunikatów), bibliotek ładowanych dynamicznie, zapisywanie grup procesów zarówno w systemach z jednym jak i wieloma procesorami oraz komunikację gniazdek dla TCP/IPv4. Prowadzone będą również prace badawcze związane z opracowaniem mechanizmów migracji procesów pomiędzy systemami o takiej samej architekturze oraz implementacja narzędzi umożliwiających migrację zadań.

Do celów realizacji zadania wykorzystany zostanie klaster systemów SGI 750 (z systemem operacyjnym Linux i procesorami Intel Itanium) rozproszony w kilku ośrodkach komputerowych i połączony szybką siecią optyczną (zobacz opis WP 1.2).