Technologie taśmowe – wprowadzenie i zastosowania
Jacek Herold, WCSS
Zagadnienia
Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeń
• Parametry streamerów
• Parametry taśm Najczęściej używane technologie i kompatybilność Kiedy i dlaczego używamy technologii taśmowych Trochę głębiej w technologię
• Systemy kodowania
• Sposób zapisu Line Serpentine vs. Helical Track
• Urządzenia blokowe vs znakowe
• sposób dostępu do danych - szeregowe układanie danych. Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana Systemy automatyczne: autloadery, biblioteki RAIT
Zagadnienia c.d. Oprogramowanie do archiwizacji
tar, dump/restore IBM TSMAmanda, BaculaVeritas
Czym są urządzenia taśmowe - historia
Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji na taśmach magnetycznych (nośnikach taśmowych). Służą przede wszystkim do archiwizacji i tworzenia kopii zapasowych.
Ich historia sięga roku 1951 kiedy to firma Remington Rand wyprodukowała pierwszy na świecie napęd taśmowy. Napęd obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a szybkość odczytu wynosiła 7200 znaków na sekundę.
W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd korzystający z technologii zapisu Line Serpentine. Co znacznie przyspieszyło szybkość wymiany danych pomiędzy taśmą a urządzeniem.
Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości zapis / odczyt.
Czym są urządzenia taśmowe – c.d.
Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą:
Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC.
Czym są urządzenia taśmowe – c.d.
Różne rodzaje napędów taśmowych:
Czym są urządzenia taśmowe – c.d.
Przykładowe system prowadzenia taśmy:
Czym różnią się od dysków twardych
Urządzenia taśmowe: Twarde dyski
•Szeregowy dostęp do danych•Wymienne nośniki•Długi czas przechowywania danych(30 lat)•Wydajne algorytmy korekcji błędówWH Error: 10-17 SW Error: 10-27
•Duża odporność na uszkodzenianośnika•Bardzo szybki transfer liniowy – ok. 280MB/s (LTO-5 Comp.)•Potencjalnie bardzo długi czas oczekiwania na określowny fragment danych•Kodowanie: RLL, MPRL, NPML•Brak systemu plików (wyjątek LTFS)
•Blokowy dostęp do danych•Niewymienne nośniki – wyjątek MO•Nieznany maksymalny czas przechowywania•Słabsze algorytmy korekcji•Mała odporność na uszkodzenia mechaniczne•Transfer liniowy na poziomie 120MB/s•Stosunkowo krótki czas oczekiwania na określony fragment danych•Kodowanie RLL•Ściśle zdefinowane systemy plików
Technologia: LTO, SDLT, AIT, DDS (DAT) Pojemność nośnika: nominalna, z kompresją Interface: SCSI, FC, SAS Szybkość transferu: nominalna, z kompresją Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum Szyfrowanie sprzętowe WORM Gwarantowany czas przechowania danych Maksymalna liczba przebiegów głowicy Maksymalna liczba montowań nośnika Cartidge Memory (CM) Korekcja błędów HW Error, SW Error Pamięć cache Wsteczna kompatybilność
Podstawowe parametry urządzeń i nośników
Podstawowe parametry urządzeń i nośnikówLTO-5: (przykładowo Quantum LTO-5 FH)•Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM)•Interface FC-8•Szybkość transferu: 140MB/s, 280MB/s (2:1)•Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności należy przyjąć 120minut•Dostepność WORM-a: TAK•Szyfrowanie sprzętowe: NIE•Pamięć cache: 256MB
Podstawowe parametry urządzeń i nośników
Taśma LTO-5:
Gwarantowany czas przechowywania archiwum 15..30 lat
Pojemność 1500GB / 3000GB (2:1)
Maksymalna liczba montowań taśmy: 5000
Maksymalna liczba przebiegów głowicy 1 000 000 co daje ok. 260 pełnych zapisów / odczytów nośnika.
CM: jeśli występuje pozwala odczytać ważne informacje o taśmie:
Liczbę montowań
Liczbę przebiegów głowicy
Ewentualne problemy
Bar Code
Najczęściej używane technologie i kompatybilność
Technologie profesjonalne:•LTO (obecnie LTO-5)
• 1500GB• 120MB/s
•SDLT• 300GB (1:1)• 36MB/s (1:1)
•AIT (oczekiwane AIT-6)• 800GB• 248MB/s
•SAIT (oczekiwane SAIT-4)• 4000GB (1:1)• 240MB/s (1:1)
•T10000 (T10000B)• 1000GB (1:1)• 120MB/s (1:1)
•DLT-S4• 800GB (1:1)• 60MB/s
Technologie użytku domowego i małych firm• Digital Data Storage (DDS) (obecnie DAT-160)
• 80GB• 6,9MB/s
• VXA (obecnie VXA-320)• 160GB• 24MB/s
• SLR (Scalable Linear Recording)• 70GB• 6MB/s
Ponadto wiele innych formatów.
Najczęściej używane technologie i kompatybilność
Najczęściej używane technologie i kompatybilność
Na co zwracać uwagę przy wyborze technologii:•Powszechność danej technologii•Lista kompatybilności•Dostępność serwisu•Współpraca z innymi urządzeniami •Możliwości rozwojowe technologii
Najczęściej używane technologie i kompatybilność
Kompatybilność technologii LTO-5
Najczęściej używane technologie i kompatybilność
Kompatybilność technologii DDS
Najczęściej używane technologie i kompatybilność
Przyszłość technologii LTO:
Najczęściej używane technologie i kompatybilność
Przyszłość technologii DDS:
Przyrost pojemności taśm
0,25
2050
200
12000
400000
1500000
0,1
1
10
100
1000
10000
100000
1000000
10000000
1951 1964 1974 1984 1996 2004 2010
Pojemność [MB]
•Rok 1974 – pierwsza „biblioteka” taśmowa (IBM)•Rok 1996 – zastosowanie algorytmu PRML (DDS-3)
Kiedy i dlaczego używamy technologii taśmowych
Stosujemy:•Archiwa długoterminowe•Bezpieczeństwo danych nie modyfikowanych (WORM)•Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę•Przechowywanie dużych pojemności•Archiwa multi-volume•Kopie bezpieczeństwa•Szybkość dostępu do danych jest drugorzędna•Wymagane mocne kody korekcyjne
Nie stosujemy:•Szybki lub losowy dostęp do danych•Dane często ulegają zmianie•Krótki czas, życia danych •Dane małoistotne
Kilka słów więcej o technologii
•Systemy kodowania•Sposoby zapisu•Urządzenia blokowe i znakowe•Sposób dostępu do danych (partycje)
Systemy kodowania danych na taśmach
•Czym jest kodowanie i dlaczego je stosujemy
•Rodzina LTO:• LTO-1: RLL1,7• LTO 2,3,4: PRML• LTO-5: NPML
•Rodzina DDS:• Helical scan (R-DAT, PRML od DDS3)
Sposób zapisu danych – metody prowadzenia taśmy
Sposób zapisu danych – ułożenie ścieżekHelical scan
Line serpentine
Sposób zapisu danych – ułożenie domen magnetycznych
Urządzenia blokowe i znakowe
•Sposób dostępu do danych•Szybkość liniowa vs czas dostępu
• Odczyt danych z taśmy a ułożenie plików• Dane na „końcu” taśmy• Czas dostępu do danych na „końcu” taśmy
•Partycje na taśmie vs partycje na dysku
Kompresja danych i pojemność taśmy
•Pojemność nominalna•Problem kompresji danych •Porównanie przykładowych wyników kompresji•Szybkość transferu a kompresja•Kompresja automatyczna (LTO) a kompresja konfigurowana
Systemy automatyczne
•Autoloadery•Biblioteki•Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc.•Zarządzanie biblioteką•Partycje biblioteki•VTL
Systemy automatyczne – rodzaje bibliotek
•Z pojedynczym robotem •Z wieloma robotami
• Współdzielony obszar roboczy• Autonomiczne obszary robocze
•Pojedyncza technologia zapisu lub wiele technologii zapisu•Wiele bibliotek w systemie
Systemy automatyczne – zarządzanie biblioteką
•Elementy biblioteki: napędy, roboty•Biblioteka podłączona bezpośrednio•Biblioteka w strukturze SAN•Partycje biblioteki
RAIT
•Co to jest RAIT•Poziomy – konfiguracje: 0,1,5•Dlaczego stosujemy RAIT•Gdzie zastosowanie RAIT jest uzasadnione•HW RAIT vs Software RAIT dopasowanie nośników
Oprogramowanie do archiwizacji
•Istotne cechy oprogramowania• Wspierany sprzęt• Wspierane systemy operacyjne• Praca w sieci• Sposób zarządzania• Procedury awaryjne• Wsparcie od strony producenta• Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool
•Oprogramowanie• IBM TSM• Bacula• Amanda• CASTOR (CERN)• Veritas backup• tar, dump/restore, mt, mtx
Oprogramowanie do archiwizacji
HSM – ang. Hierarchical Storage Management
Parametry użytkowe i cechy systemu HSM Przykładowa realizacja HSM w PCSSPoziomy hierarchii HSM
Przyrost pojemności technologii taśmowych
•Współczynnik 2x•Przyrost na przestrzeni lat
...
Podsumowanie