O projekcie | Podstawy formalne | Pakiety robocze | Dokumenty | Produkty | Spotkania | Partnerzy | Kontakt |

 »   Pakiety robocze

 »   WP 1.3 Budowa systemu archiwizacji danych

Prowadzący »
Dr inż. Jerzy M. Zaczek
ACK CYFRONET AGH, Kraków
Współrealizujący » TASK, WCSS
Data rozpoczęcia » 1 grudnia 2002
Data zakończenia » 31 października 2004
[ Harmonogram  | Zespół  | Dokumenty ]
Krótki opis zadania

Zadania przechowywania, zabezpieczania i udostępniania stale rosnącej objętości danych generowanych przez rozproszone środowisko użytkowników, wykorzystujących ogólnokrajowe zasoby obliczeniowe, są jednymi z najbardziej istotnych zagadnień dotyczących wykorzystania klastra SGI. Dla potrzeb klastra narodowego naturalnym rozwiązaniem jest utworzenie meta-systemu hierarchicznego zarządzania danymi (MHSM, ang. Meta Hierarchical Storage Management), pracującego w oparciu o lokalne systemy HSM istniejące w Gdańsku, Krakowie, Poznaniu i Wrocławiu oraz planowane w Łodzi i Warszawie (IMGW). Prace związane z budową systemu MHSM koncentrować się będą wokół następujących zagadnień:

  • Rozbudowa funkcjonalna istniejących, lokalnych systemów HSM
  • Metabaza danych (MBD) dla lokalizacji rozproszonych danych oraz wspólny interfejs API do lokalnych systemów HSM
  • Integracja, testowanie i udoskonalanie

Rozbudowa funkcjonalna lokalnych systemów HSM polega na stworzeniu podsystemu szybkiego dostępu do wielkich plików rezydujących na taśmach i podsystemu określania czasu dostępu do plików. Celem prac pierwszego podzadania jest projekt i implementacja podsystemu szybkiego dostępu do plików wielkich rozmiarów rezydujących na taśmach z wykorzystaniem strategii podziału plików. Dla realizacji tej strategii musi zostać opracowany podsystem umieszczony pomiędzy aplikacją klienta i systemem HSM. Podsystem ten będzie dzielił pliki podczas ich zapisu na taśmę, w sposób przeźroczysty dla użytkownika. Informacja o fragmentacji plików będzie umieszczana w bazie danych indeksów. Aby utrzymać jednolitą prędkość transmisji plików i skrócić czas jej trwania dodatkowo stosowana będzie technika prefetchingu. Technika ta polega na sprowadzeniu kolejnego podpliku do pamięci podręcznej systemu przy jednoczesnej transmisji poprzedniego podpliku z pamięci podręcznej do aplikacji użytkownika. Celem prac w drugim podzadaniu jest opracowanie i implementacja podsystemu, który będzie dostarczał odpowiedzi w jakim czasie żądany plik z określonego HSM będzie dostępny. Odpowiedź jest zależna od wielu czynników takich jak: obciążenie HSM, długość kolejki, ilość napędów i ich przepustowość, rozmiar pliku, itp.