cloudera manager 4 の紹介

94
CDHはなぜエンタープライズに適し ているのか 嶋内 翔 カスタマーオペレーションズエンジニア

Upload: cloudera-japan

Post on 28-May-2015

3.077 views

Category:

Technology


0 download

DESCRIPTION

2012/07/31に発表した、Cloudera QA セミナーで発表した資料です。

TRANSCRIPT

Page 1: Cloudera Manager 4 の紹介

CDHはなぜエンタープライズに適しているのか

嶋内 翔

カスタマーオペレーションズエンジニア

Page 2: Cloudera Manager 4 の紹介

アジェンダ

•  Cloudera Manager 概要 •  Cloudera Manager Free Edition

•  Service and Configuration Manager •  Cloudera Manager API

•  Cloudera Manager Enterprise Edition •  Service Monitor •  Host Monitor •  Activity Monitor •  Report •  Cluster Stats

Page 3: Cloudera Manager 4 の紹介

エンタープライズにおける ソフトウェアの要件

Page 4: Cloudera Manager 4 の紹介

CDH4 + Cloudera Manager 4.0: エンタープライズの要件とは…

スケーラビリティと拡張性  

1 2 3

高可用性    他のITとの統合  

セキュリティ  

6

設定と構築の単純化  

グローバルサポートとサービス  

5 4

Page 5: Cloudera Manager 4 の紹介

CLOUDERA MANAGER 4 ビッグデータ時代の運用管理ソフトウェア

Page 6: Cloudera Manager 4 の紹介

Cloudera Manager(以下CM) とは?

•  CDHを1つのシステムとして扱い、あらゆる構築・運用のシナリオを統一されたインタフェースから行うための運用管理ツール

•  分散システムの熟知やコンポーネントの相互依存性などのCDHの運用・構築に必須の知識を必要としない

Page 7: Cloudera Manager 4 の紹介

アーキテクチャ

•  集約型管理サーバ •  全デーモンとサービスの設定情報を管理 •  サービスと設定の作成・管理をするためのWeb

UI を提供 •  エージェントは全てのノードで稼働

•  エージェントはHadoopの起動・停止に責任を持つ

•  サーバから指示されたコマンドを実行する •  デーモンのログへのアクセス手段を提供する

Page 8: Cloudera Manager 4 の紹介

CM なしの CDH

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

NN  

RM  

HMaster  

Hue  

管理者  

Page 9: Cloudera Manager 4 の紹介

CDH  クラスタ  

CM 導入後

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

管理者  

Hue  

HMaster  

RM  

NN  

Cloudera    Manager  

CMエージェント  

Page 10: Cloudera Manager 4 の紹介

RAID構成のディスクで一台壊れても……

•  サービス停止は発生しない

•  ディスクを交換すれば問題ない

•  ディスク故障を最も致命的な問題と考える人は少ないはず

Page 11: Cloudera Manager 4 の紹介

CDH  クラスタ  

Hadoopクラスタを同じように考える

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

管理者  

Hue  

HMaster  

RM  

NN  

Cloudera    Manager  

CMエージェント  

1ノード壊れてもサービス継続  サーバ故障が致命的な問題に

ならない  

Page 12: Cloudera Manager 4 の紹介

Cloudera Manager 構成図

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

DN/RS/NM  

CM  

管理PC  

スイッチ  

スイッチ  

DB  

管理者はwebブラウザで  CMにアクセス  

設定情報やログ等は  DBに保存  

Page 13: Cloudera Manager 4 の紹介

CM 基本用語

•  サービス •  一つの処理のために協調稼働するデーモン群の単

位 •  例: HDFS, MapReduce, HBase

•  ロール •  あるサービスを稼働させるにあたってホストに割り当

てられた役割 •  例: NAMENODE, DATANODE

•  コマンド •  サービスを動作させるために管理者が実行する処理 •  例: 起動/停止、HDFSのフォーマット

Page 14: Cloudera Manager 4 の紹介

CM4.0の新機能(一部)

•  国際化対応(日本語化!) •  CM API

•  管理用 REST API(後述) •  ホスト監視

•  CPUリソースなど、CDH以外の部分も監視できるようになった

•  複数クラスタ管理 •  クライアント設定の管理

Page 15: Cloudera Manager 4 の紹介

CMサーバインストール方法

•  ウィザードによるインストール •  GUIベースの自己解凍形式インストーラ

•  マニュアルインストール •  ユーザがyumなどでインストールする •  柔軟性の高いインストールをしたいならこちら

Page 16: Cloudera Manager 4 の紹介

CMインストーラ

•  ローカルリポジトリのサポート •  サポートDBの強化

•  デフォルトで組み込みPostgreSQLを使うので、デモ用などの場合にDBサーバの構築は不要

•  MySQL/PostgreSQL/OracleDBに対応 •  Debian/Ubuntuのサポート •  CDHのバージョンを選択可能(CDH3/CDH4)

Page 17: Cloudera Manager 4 の紹介

CLOUDERA MANAGER FREE EDITION クラスタの管理を簡単にする

Page 18: Cloudera Manager 4 の紹介

CM Free Edition

•  ウェブサイトから自由にダウンロード可能 •  監視、アラート、イベント、ログ検索、

Kerberosサポートはありません •  50ホストまで管理可能 •  ライセンスキーでアップグレード可能(要再起

動)

Page 19: Cloudera Manager 4 の紹介

Free Edition と Enterprise Edition の違い

Free  Edi*on   Enterprise  Edi*on  サービス管理   ◯   ◯  

設定管理   ◯   ◎(バージョン管理可能)  

CDH一括インストール   ◯   ◯  

API   ◯   ◯  

管理ノード数制限   50ノードまで   無制限  

監視機能   -­‐-­‐   ◯  

セキュリティ機能   -­‐-­‐   ◯  

イベント機能   -­‐-­‐   ◯  

入手方法   無償でDL可   Cloudera  Enterprise  サブスクリプションがあれば誰で

も利用可  

Page 20: Cloudera Manager 4 の紹介

Service and Configuration Manager

Page 21: Cloudera Manager 4 の紹介

SCM

•  Service and Configuration Manager (サービス・設定マネージャ)

•  プロセスの起動・停止を行う •  設定の管理、配布を行う •  Free Edition ではほぼ全機能が使用可能

•  設定のバージョン管理機能のみEnterprise専用(後述)

Page 22: Cloudera Manager 4 の紹介

サービス管理画面

Page 23: Cloudera Manager 4 の紹介

コマンドメニュー

•  再起動なども簡単 •  HBase の graceful stop なども自動で行う

•  クラスタ単位の再起動が可能 •  停止順序などもきちんと考慮

Page 24: Cloudera Manager 4 の紹介

設定管理画面

•  設定に問題がある場合は警告する •  下の図では2箇所に警告が出ている

•  NNと2NNのヒープサイズが異なる •  NNのヒープサイズが1GBを下回っている

Page 25: Cloudera Manager 4 の紹介

設定はバージョン管理できる Enterprise  Only  

Page 26: Cloudera Manager 4 の紹介

設定変更後は再起動を促す

Page 27: Cloudera Manager 4 の紹介

マルチクラスタサポート

•  サービスはクラスタとしてグループ化される •  サービス設定と監視はクラスタ別に可能 •  クラスタ単位での起動・停止 •  異なるバージョンのクラスタを管理可能

Page 28: Cloudera Manager 4 の紹介

2クラスタ管理時

CDH3クラスタ  

CDH4クラスタ  

管理サービス  

Page 29: Cloudera Manager 4 の紹介

クライアント設定管理

•  クライアント = サービスを利用するためにアクセスするノード

•  CM4からGUIで管理・自動配布できるようになった •  CM3ではxmlファイルの生成のみ

•  クライアント上のユーザは環境変数等の設定なしでクラスタにアクセス可能

•  そのサービスのロールを持つ全ホストからアクセス可能

Page 30: Cloudera Manager 4 の紹介

クライアント設定の配布とダウンロード

Page 31: Cloudera Manager 4 の紹介

3ステップHA

•  3ステップでHDFS HAを設定可能 •  マニュアル設定すると16ステップ必要 •  CM用のカスタムフェイルオーバフェンシング

ルールも設定

Page 32: Cloudera Manager 4 の紹介

3ステップ HA(ステップ1)

1. スタンバイNNを選ぶ

Page 33: Cloudera Manager 4 の紹介

3ステップ HA(ステップ2) 2. 共有editsディレクトリを指定する 3ステップ目で設定が始まるので注意

Page 34: Cloudera Manager 4 の紹介

サービス管理画面から見たHA

NNの片方がダウンして、アクティブのみで動いていることがわかる

Page 35: Cloudera Manager 4 の紹介

CDH3からCDH4へのアップグレード

•  重要: CMはCDHパッケージ自体のアップグレードはしません

•  パッケージがアップデートされたら、サービスごとのアップグレードウィザードがある •  例: HDFS メタデータアップグレード

•  古い設定プロパティは新しいプロパティに自動置換してくれる

Page 36: Cloudera Manager 4 の紹介

Cloudera Manager API

Page 37: Cloudera Manager 4 の紹介

Cloudera Manager API

•  Cloudera Manager を REST 経由で管理するための API

•  HTTPベーシック認証を使う •  JSONでデータの送受信を行う •  github で Python クライアントライブラリを公

開中 (Apache License) •  http://cloudera.github.com/cm_api/

Page 38: Cloudera Manager 4 の紹介

組み込みの API ドキュメント

Page 39: Cloudera Manager 4 の紹介

例:クラスタのリスト $ curl -u "admin:admin" http://$CM/api/v1/clusters {

"items" : [ {

"name" : "Cluster 1 - CDH4",

"version" : "CDH4"

}, {

"name" : "Cluster 2 - CDH3",

"version" : "CDH3"

} ] }

Page 40: Cloudera Manager 4 の紹介

例:コマンドの実行 $ curl -X POST -u admin:admin 'http://$CM/api/v1/clusters/Cluster%201%20

-%20CDH4/services/my_hbase/commands/hbaseCreateRoot' { "id" : 142, "name" : "CreateRootDir", "startTime" : "2012-05-06T20:56:57.918Z", "active" : true, "serviceRef" : { "serviceName" : "my_hbase", "clusterName" : "Cluster 1 - CDH4" } }

Page 41: Cloudera Manager 4 の紹介

CLOUDRA MANAGER ENTERPRISE EDITION

Page 42: Cloudera Manager 4 の紹介

Enterprise Editionとは?

•  CM Free Edition に、監視やログ検索、Kerberos認証などエンタープライズ領域において必須の機能を追加したもの

•  サブスクリプションをご購入いただいたお客様なら自由に利用できます

Page 43: Cloudera Manager 4 の紹介

Cloudera  Manager  Free  Edi*on   Cloudera  Manager  Ent.  Edi*on  

自動構築   Yes   Yes  

API   Yes   Yes  

 サービス及び設定管理  

HDFS,  MapReduce,  MR2,  HBase,  Hue,  Oozie,  Zookeeper  の管理   Yes   Yes  

高可用性と名前空間管理のサポート   Yes   Yes  

設定の自動化   Yes   Yes  

クライアント設定管理   Yes   Yes  

監査と追跡   Yes   Yes  

追加/再起動/デコミッションロールインスタンス   Yes   Yes  

設定のバージョン管理   Yes  

サービス監視  

プロアクティブ・ヘルスチェック   Yes  

ステータスサマリー   Yes  

ヒートマップと性能監視   Yes  

ホスト監視   Yes  

セキュリティ  

LDAP  認証   Yes  

Kerberos  設定   Yes  

マルチクラスタ管理   Yes  

インテリジェント・ログ管理   Yes  

イベントマネジメントとアラート   Yes  

アクティビティ監視   Yes  

運用レポート   Yes  

ファイルブラウザとクォータ管理   Yes  

グローバルタイムコントロール   Yes  

サポート統合   Yes  

Free  

Enterprise  

Page 44: Cloudera Manager 4 の紹介

Service Monitor

Page 45: Cloudera Manager 4 の紹介

サービスモニタ

•  サービスの状態をグラフィカルに監視する機能

•  表示できる情報はサービスによって異なる •  HDFS: IO, 壊れたレプリカ数, etc •  MapReduce: Map数, Reduce数

•  アラートなどもリンクつきでモニタに表示 •  クリックすると詳細ページに飛ぶ

Page 46: Cloudera Manager 4 の紹介

サービスモニタ(トップ画面) 画面はSCMと変わらない

Page 47: Cloudera Manager 4 の紹介

サービスモニタ(HDFS)

Page 48: Cloudera Manager 4 の紹介

サービスモニタ(HDFS詳細)

Page 49: Cloudera Manager 4 の紹介

ヘルスチェック

•  サービスの状態を細かくチェック •  問題がある場合アラートを上げる

Page 50: Cloudera Manager 4 の紹介

ヒートマップ

•  多数のノードの状態をグラフィカルに表現

•  ヘルスチェックの項目の多くはヒートマップで表現可能

Page 51: Cloudera Manager 4 の紹介

ヒートマップ(赤は問題のあるノード)

Page 52: Cloudera Manager 4 の紹介

サービスモニタ(HDFSチャート)

•  メトリクスの経時変化をグラフ化して表示 •  アラートが発生したら、赤いフラグで表示

Page 53: Cloudera Manager 4 の紹介

サービスモニタ(MapReduceチャート)

Page 54: Cloudera Manager 4 の紹介

Host Monitor

Page 55: Cloudera Manager 4 の紹介

ホストモニタ

•  ホストに関する情報を管理・監視できる •  IPアドレス、ホスト名、ラックID •  CPUコア数、メモリ量などのハードウェア情報 •  ロードアベレージ

•  ホストインスペクタにより、ホストレベルでのヘルスチェックが可能 •  障害の原因として頻出のホスト名設定ミスなど

Page 56: Cloudera Manager 4 の紹介

ホストモニタ(ホスト全体画面)

Page 57: Cloudera Manager 4 の紹介

ホストモニタ(ホスト画面)

Page 58: Cloudera Manager 4 の紹介

ホストモニタ(ホスト画面詳細)

Page 59: Cloudera Manager 4 の紹介

ホストモニタ(ホスト画面チャート)

Page 60: Cloudera Manager 4 の紹介

ホストモニタ(ホスト監視設定)

Page 61: Cloudera Manager 4 の紹介

ホストインスペクタ

ホストのヘルスチェックを能動的に行うことも可能

インストールされているパッケージのバージョンチェックなども行う

Page 62: Cloudera Manager 4 の紹介

Activity Monitor

Page 63: Cloudera Manager 4 の紹介

アクティビティモニタ

•  実行した(している)ジョブを監視可能 •  MapReduce, Hive, Pig, Oozie など全て

•  map数/reduce数、mapの入出力バイト数など、MapReduceジョブに関するあらゆるデータをグラフィカルに表示可能

•  現在MR1のみ対応

Page 64: Cloudera Manager 4 の紹介

アクティビティモニタ

Page 65: Cloudera Manager 4 の紹介

アクティビティモニタ(ジョブ詳細画面)

Page 66: Cloudera Manager 4 の紹介

アクティビティモニタ(ジョブ比較)

•  類似ジョブの比較が可能 •  クエリ名、ジョブ名などで識別

•  ジョブのメトリクスの平均及び標準偏差を算出 •  選択中のジョブがどれだけ平均から離れている

かを表示 •  徐々に性能劣化していく、特定の日のジョブ

だけ遅い、などが検出可能

Page 67: Cloudera Manager 4 の紹介

アクティビティモニタ(ジョブ比較)

Page 68: Cloudera Manager 4 の紹介

アクティビティモニタ(ジョブ比較)

平均と±2σ(=  95%信頼区間)を表示  選択中のジョブのメトリクスがどのくらい平均から離れている

かをバーで表示

Page 69: Cloudera Manager 4 の紹介

アクティビティモニタ(jobのkill)

ジョブの強制終了が可能(MRとStreamingのみ)

Page 70: Cloudera Manager 4 の紹介

アクティビティモニタ(タスクの分散)

Page 71: Cloudera Manager 4 の紹介

アクティビティモニタ(タスクの分散)

異なる2つの評価軸による、タスクの分散を調べるヒートマップを

作成可能

Page 72: Cloudera Manager 4 の紹介

アクティビティモニタ(タスクの分散)

クリックするとそのタスクを実行したタスクトラッカーの一覧が表

示される  

遅いタスクがどのノードで実行されていたか、容易に特定が可能

Page 73: Cloudera Manager 4 の紹介

Log Search

Page 74: Cloudera Manager 4 の紹介

ログ検索

•  クラスタ全体のログを高速に検索可能 •  以下のようなクエリで検索できる

•  「7月6日 20:00から21:00の間に」 •  「ホストa,b,c,dにおいて」 •  「サービスmapreduce1で発生した」 •  「WARN以上のログ」

•  結果をグラフィカルに表示するため、特定のホストのログが極端に多いなども一目で識別可能

Page 75: Cloudera Manager 4 の紹介

ログ検索

Page 76: Cloudera Manager 4 の紹介

ログ検索(検索オプション)

サービス、ログレベル、ホスト名、キーワードなどで絞り込み可能

Page 77: Cloudera Manager 4 の紹介

ログ検索(結果ウィンドウ)

ホスト別の集計結果を表示するので、ログが極端に多いホストを容易に特定可能

Page 78: Cloudera Manager 4 の紹介

Event

Page 79: Cloudera Manager 4 の紹介

イベント

•  ヘルスチェックにおいて、イベントのしきい値を柔軟に設定可能 •  重要、致命的の2段階

•  CDH標準のログには出力されない情報をイベントとしてログ化 •  ログと同様検索が可能

Page 80: Cloudera Manager 4 の紹介

イベント設定(HDFS)

Page 81: Cloudera Manager 4 の紹介

イベント検索

Page 82: Cloudera Manager 4 の紹介

Report

Page 83: Cloudera Manager 4 の紹介

レポート機能 •  クラスタのディスク使用率についてのレポートを作成することがで

きる •  データサイズ別 •  ユーザ別 •  ディレクトリ別 •  etc.

•  ファイルを検索したり、クォータを設定したりすることも可能 •  ユーザ別のMapReduceアクティビティも閲覧することができる •  CSVやExcel形式でのダウンロードも可能

Page 84: Cloudera Manager 4 の紹介

レポート機能

•  トップ画面

Page 85: Cloudera Manager 4 の紹介

レポート機能(ユーザ別ディスク使用量)

Page 86: Cloudera Manager 4 の紹介

レポート機能(ユーザ別ディスク使用履歴)

Page 87: Cloudera Manager 4 の紹介

Cluster Stats

Page 88: Cloudera Manager 4 の紹介

サポート連携: Cluster Stats •  ユーザはボタン一つでクラスタの情報をzip形式に圧縮できる •  クラスタ情報の一例

•  ログ •  設定 •  メトリクス •  イベント •  ホスト情報

•  自動アップロード、自動定期アップロードが可能 •  自動送信はデフォルトで無効 •  ユーザはzipファイルをダウンロード可能

Page 89: Cloudera Manager 4 の紹介

Cluster Stats

Page 90: Cloudera Manager 4 の紹介

Cluster Stats 結果画面

Page 91: Cloudera Manager 4 の紹介

Cluster Stats 結果(jsonで保存)

{ "load_avg" : [ 4.11, 2.68, 1.31 ], "physical_memory_total" : 6260060160, "physical_memory_used" : 3595923456, "virtual_memory_total" : 2097434624, "virtual_memory_used" : 86016, "mountpoint_available_space_bytes" : { "/" : 205013987328, "/boot" : 85797888 } }

Page 92: Cloudera Manager 4 の紹介

まとめ

Page 93: Cloudera Manager 4 の紹介

Cloudera Manager

•  構築・運用が大変なHadoop の管理を楽にする

•  数100ノードのクラスタを数分で構築可能 •  Enterprise Edition ならログ検索、アラート機

能なども搭載 •  管理に時間をとられたくない人はまず試して

みましょう

Page 94: Cloudera Manager 4 の紹介

 cloudera.co.jp  03(6228)7930   twiVer.com/  

ClouderaJP

facebook.com/  cloudera

Thank You!

ご質問はこちら: [email protected]