seminar großrechneraspekte

Backup- und Administrationswerkzeuge

Seminar Großrechneraspekte

Gliederung Backup/Recovery Werkzeuge

• Grundlagen und Einführung

• System Managed Storage:

• Data Facility Storage Management Subsystem

• Aggregate Backup & Recovery Support

• Remote Copy

• Tivoli Storage Manager

• SAN & NAS

Einführung in Hardware Management Console

Zusammenfassung

Allgemeines zu Backup/Recovery

• Hohe Verfügbarkeit und Datensicherheit wichtiger Wirtschaftsfaktor

• Zwiespalt: Verfügbarkeit Kosten

• Für Datensicherheit in großen Systemen Recoveryplan nötig: erstellt durch Administrator und User

Was soll wie und wogegen gesichert werden?

• Vollbackup: alles wird gesichert

• Inkrementelles Backup: es werden nur Objekte gesichert die seit der letzten Sicherung verändert wurden

• Partielles Backup: verschiedene Objekte werden zu verschiedenen Zeitpunkten & verschieden häufig gesichert

7 Recovery-Stufen• Stufe 0: Es existiert kein Recovery-Plan bzw. die

Möglichkeit für Backups

• Stufe 1: Pickup Truck Access Methode (PTAM)

Backup auf Externspeichermedium

Medien werden außerhalb in sicherer Umgebung gelagert und

für Recovery zurückgeholt

• Stufe 2: PTAM + Hotside

Hotside = doppelte Hardware an anderem Ort auf

der im Crashfall Recovery durchgeführt wird

• Stufe 3: Elektronischer Abgleich kritischer Daten

• Stufe 4: Aktive Hotside

• Stufe 5: Two-side Two-phase commit

automatischer Online-Datenabgleich zwischen beiden Seiten

• Stufe 6: kein Datenverlust

System Managed Storage: DFSMS

• Data Facility Storage Management Subsystem übernimmt automatische Datenverwaltung als Teil des Betriebsystems

• DFSMS fasst verschiedene Werkzeuge zusammen: Hierarchischer Speichermanager Datensatz-Services

• Administrator definiert Poolstruktur von Speichergruppen und ACS (automatic class selektion) Routinen

• ACS Routinen bestimmen welchen Speichergruppen welche Daten zugeordnet werden

System entscheidet automatisch wieviel Speicher es an welcher Stelle für welche Daten braucht

System Managed Storage: CDS

• Control Data Set (CDS) sind Metadaten über die vom DFSMS kontrollierten Daten

• M(igration)CDS: Informationen über Datensätze der Benutzer und der Anwendungen

• B(ackup)CDS: Informationen über Backup-Kopien der jeweiligen Datensätze

• O(ffline)CDS: Informationen über gesicherte Datensätze auf Externspeichermedien (Datenbänder)

• Durch CDS und Journal Recovery auf Hotside mit differenzierter Hardware und Struktur möglich

System Managed Storage: ABARS (1)

• Aggregate Backup & Recovery Support benötigt aktives DFSMS

• Daten und Anwendungen werden durch CDS in kritisch und unkritisch unterschieden Auswahl durch User und Administrator nötig

• Definition von Aggregate Groups die Daten und zugehörige Metadaten für Backup auf Band oder über Netzwerk zusammenfassen

• Verschiedene Gruppen werden zu Managementklassen zusammengefasst die gemeinsame Attribute für Verwaltung besitzen

System Managed Storage: ABARS (2)

• Tape-Storage-Groups verbinden Gruppen mit Tapelibrarys und ermöglichen so automatische Verteilung der Backups

• Abackup erstellt 3 Dateitypen:– Aggregation control file: enthält Information über Umgebung für

Remote-Recovery

– Instruction data set: enthält Metadaten über gesicherte Daten

– Aggregation data file: enthält eigentliche Daten

• Backup kann explizit durch ein Kommando gestartet werden oder eingebettet in ein Programm

• Falls bei Recovery Namenskonflikte auftreten, kann dies durch Ersetzen, Auslassen des Datensatzes oder Umbenennen des Ziels oder der Quelle gelöst werden

Beispiel: ABARS

System Managed Storage: Remote Copy

• Dient automatischem Abgleich zu remoter Hotside

• Extended Remote Copy (XRC) – ab Recovery-Stufe 4 einsetzbar z.B. bei Wide-Area Parallel

Sysplex

– Zeitunterschied beim Speichern auf Localhost und Remotehost möglich da asynchrones Kopieren der Daten zum Recovery-System im Fehlerfall nur geringe Datenverluste

• Peer-to-Peer Remote Copy (PPRC)– Speichert synchron Daten auf Localhost und Recovery-System

und benötigt damit ein immer aktuelles Remotesystem

Tivoli Storage Manager (1)

• Optionales Programmpaket von IBM für Speicherverwaltung und Wartung unter vielen OS

• Client-Server Anwendung:

Tivoli Storage Manager (2)

• Automatisiert gesamten Backupprozess:– Daten werden über Netzwerk vom Client an den TSM-Server

versendet

– Server verwaltet sowohl Bandlaufwerke als auch Disk Storage Pool

– Optional ist gleichzeitige weitere externe Kopie der Daten möglich

– Verwaltung der Daten und zugehöriger Metadaten erfolgt über relational Datenbank

• Automatisierung für Recovery schwierig da meist ad-hoc Ereignis:– Zumindest Definition der Arbeiten die parallel bei

Wiederherstellung ausgeführt werden können

Storage Area Network (SAN)

• Speicher ist auf dediziertes Netzwerk verteilt mit any-to-any Verbindung zwischen Speicher und Prozessoren

• Verteiltes Speicher- und Backupmedium das per Glasfaser (oder selten: Ethernet) an Mainframe angebunden ist

• Reduziert I/O-Traffic im LAN bei mehr möglichen gleichzeitigen Zugriffen durch mehr Prozessoren (Server)

• Setzt SCSI-Protokoll über Netzwerk für Zugriffe um

• Backup innerhalb des SAN direkt möglich ohne externes Zubehör und mit gringer Belastung des LAN da nur Metadaten darüber gesichert

• Server-free Backup per Tivoli Storage Manager umgesetzt

SAN-Struktur

Network Attached Storage (NAS)

• NAS nutzt LAN und dessen Protokolle (TCP/IP, Netbios) für Datenübertragung und –zugriffe

• Im Prinzip jeder Fileserver unter jeglichem OS für NAS nutzbar da nur Device-Freigaben z.B. NFS-Freigaben zusammengefasst werden

• Arbeitet auf Filelevel (verarbeitet bei Anfragen nur ganze Dateien) im Gegensatz zum SAN mit Blocklevel

• Für Backup schlechter geeignet da I/O-Zugriffe vollständig über LAN ablaufen

NAS-Struktur

Hardware Management Console (HMC)

• Mächtiges Administrationswerkzeug für Remoteeinsatz

bildet Kontrollinstanz und stellt Systemimages bereit

• Direkte Verbindung über LAN mit Supportelementen (SE) der Prozessorelemente (CPC)

• Pro CPC gibt es 2 SEs per Power Service & Control Network angebunden:– Speichern Hardware-Konfigurationsinformationen

– Laden gespeicherten LIC in Prozessor

– Überwachen Hardware- und Imagestatus

– Im Fehlerfall (Ausfall einer SE oder Verlust der Verbindung) ersetzt zweite automatisch erste SE

Beispielkonfiguration

HMC: Aufgaben

• Überwacht Statusreporte der einzelnen Hardwareelemente

• Kann System komplett herunterfahren oder neu starten

• Dient Problemanalyse:– Administrator definiert Bedingungen für Fehlerbehandlung

– HMC überwacht Bedingungen und setzt falls nötig Status auf „Service benötigt“

• Stellt Systemimage(s) für CPC mit eigener VM bereit und ordnet jeweils Hardwareressourcen zu (LPAR)

• Kann einzelne Prozessoreinheiten in CPC im Fehlerfall deaktivieren und dafür ungenutzte PUs bereitstellen

• Regelt Lastverteilung innerhalb einer CPC

Licensed Internal Code (LIC)

• LIC ist Maschinencode der über HMC und SE direkt im CPC ausgeführt werden kann

• kann unterhalb des OS Hardware simulieren

• Es gibt jeweils 2 Kopien (A- und B-side) die abgespeichert sind aber verschiedene aktive Elemente bzw. Befehle enthalten die direkten Hardwarezugriff ermöglichen

• Durch Start der verschiedenen Kopien unterschiedliches Hardwareverhalten möglich

• Unterstützt Mirroring von Platten und auch von ganzen virtuellen Hardwaresystemen mit darüber liegendem OS

Zusammenfassung

•Remotezugriff bzw. Netzwerkfähigkeit für Backup und andere Administrationsaufgaben notwendig

• Automatisierung vieler Backupaspekte durch DFSMS und zusätzlicher Programmpakete wie z.B. Tivoli

• HMC kann Hardware fast in vollem Umfang „online“ verwalten und konfigurieren

• sehr wichtiger Kostenfaktor für Firmen

einfache und übersichtliche Administration notwendig

seminar großrechneraspekte

Documents