agile baseball science - はじめてのセイバーメトリクス

49
Agile Baseball Science アジャイル脳によく効く野球のハナシ (はじめてのセイバーメトリクス) Shinichi Nakagawa@shinyorke 2015/8/17 ゆるプレ #4

Upload: -

Post on 21-Aug-2015

628 views

Category:

Sports


4 download

TRANSCRIPT

Page 1: Agile Baseball Science - はじめてのセイバーメトリクス

Agile Baseball Scienceアジャイル脳によく効く野球のハナシ (はじめてのセイバーメトリクス)

Shinichi Nakagawa@shinyorke 2015/8/17 ゆるプレ #4

Page 2: Agile Baseball Science - はじめてのセイバーメトリクス

本日のネタについて

• 本日のネタは「XP祭り2015 “俺も!!”」で披露するネタの試作品です

• 時間の関係で一部抜粋の省略バージョンです

• 面白い!って思ったら是非XP祭りに来てください(^O^)

2015/9/12(土) XP祭り2015 “俺も!!”

http://xpjug.com/xp2015/ ※中川のSessionは13:00から

Page 3: Agile Baseball Science - はじめてのセイバーメトリクス

自己紹介

Page 4: Agile Baseball Science - はじめてのセイバーメトリクス

お前だれよ

• Shinichi Nakagawa(36)

• Recruit Sumai Company, Ltd

• Web Engineer(Server side)

• Scrum(CSM) / Lean Startup / Python / IaaS

• “野生の野球アナリスト”活動(Hackとか発表)

Page 5: Agile Baseball Science - はじめてのセイバーメトリクス

“野生の野球アナリスト” 活動

Page 6: Agile Baseball Science - はじめてのセイバーメトリクス

• PyCon JP 2014 Talk Session • MLBオープンデータをシステム化(Python+Chef)

• 今年(PyCon JP 2015)も何かをやります(主に分析ネタ)

Page 7: Agile Baseball Science - はじめてのセイバーメトリクス

Other…

• Manaslinkで野球+αネタの不定期連載 ※開店休業中

• MLBオープンデータの紹介と活用例紹介(自分のブログにて)

• 野球データベース&解析用のライブラリをGithubで公開

(ほとんどがPython)

• データドリブン野球解説(New!)

Page 8: Agile Baseball Science - はじめてのセイバーメトリクス

本題

Page 9: Agile Baseball Science - はじめてのセイバーメトリクス

Today’s Starting Member

• 野球の統計学

• はじめてのセイバーメトリクス

• まとめ

Page 10: Agile Baseball Science - はじめてのセイバーメトリクス

野球の統計学

Page 11: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクス

Page 12: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクス is 何

“セイバーメトリクス(SABRmetrics,

Sabermetrics)とは、野球においてデータを統計学的見地から客観的に分析し、選手の評価や

戦略を考える分析手法である。”

-Wikipedia「セイバーメトリクス」https://ja.wikipedia.org/wiki/セイバーメトリクス

Page 13: Agile Baseball Science - はじめてのセイバーメトリクス

今までの野球(イメージ)

Page 14: Agile Baseball Science - はじめてのセイバーメトリクス
Page 15: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーな野球(イメージ)

Page 16: Agile Baseball Science - はじめてのセイバーメトリクス
Page 17: Agile Baseball Science - はじめてのセイバーメトリクス

掘り下げると…

• 選手のプレー,監督の采配,トレード,FA,ドラフトetc…、「成功より失敗が多い」活動の成功率を高める為、「データ」を元に「科学的手法で客観的」に考察・分析を行う

• チーム・選手の成績(安打,本塁打,三振,etc…)の掛けあわせ、

ビッグデータ(投球・打球の記録,野手の行動ログなど)を元に、

新たな評価軸(メトリクス)を作り、考察・分析を行う

• Lean Startupの元祖とも言える(Agile文脈的な意味で)

→野球の各データを科学的アプローチで客観的に分析、学びを得る

Page 18: Agile Baseball Science - はじめてのセイバーメトリクス

事例• マネー・ボール(小説/映画)

2000年代のMLBオークランド・アスレチックスが舞台、後ほど詳しく解説

• もしドラ(小説/映画)ドラッカー本を読んだ女子マネがデータを元にした客観的な采配でチームをサポート

• MLB(Major League Baseball)マネー・ボールの影響でほぼ全球団がセイバーを駆使したチーム経営、ボストン・レッドソックスはセイバーメトリクスを駆使してワールドシリーズ制覇(2004)

• 日本プロ野球楽天ゴールデンイーグルス、北海道日本ハムファイターズ他がセイバーメトリクスを活用、特に日ハムは一軍⇔二軍の選手の入れ替えにセイバーメトリクスを活用している(らしい)

Page 19: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクスの基本

Page 20: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクスの基本(チーム)

• シーズン中に予想される総得点と総失点を元にチームの行く末を予想

• 打者・走者は得点能力で評価

• 投手は投手独自の、野手は野手独自の守備力で評価

※例外もありますが、大体上記の観点が基本

Page 21: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクスの基本(攻撃)

• 得点能力 = アウトにならず、前の塁に出る能力!

• 掟その1「アウトになるな、塁に出ろ!」

• 掟その2「一本でも多く長打を打て!」

• アウトにならず、一つでも前の塁に出るプレーが正義

例:四球、二塁打、三塁打、本塁打、盗塁(ただし成功が前提)

• アウトになるリスクがある行為はNG例:犠牲バント(諸悪の根源)、無茶な盗塁

Page 22: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクスの基本(守備)

• 失点を抑える能力 = アウトを多く取る、長打を許さない能力!

• 掟その1「投手は長打、四球を許さないのが正義」

• 掟その2「野手は広い範囲でアウトを取るのが正義」

• 野手が介在しない投球結果or内野を越えた打球は投手の責任 例:四球、二塁打、三塁打、本塁打は投手の責任

• 内外野で”とれそうな打球”は野手の責任

→例えば”エラー”が悪いかどうかはやらかした場所による

Page 23: Agile Baseball Science - はじめてのセイバーメトリクス

はじめての セイバーメトリクス

Page 24: Agile Baseball Science - はじめてのセイバーメトリクス

セイバーメトリクス(初心者編)

• ピタゴラス勝率

• 出塁率、長打率とOPS

• アダム・ダン率

Page 25: Agile Baseball Science - はじめてのセイバーメトリクス

ピタゴラス勝率

Page 26: Agile Baseball Science - はじめてのセイバーメトリクス

ピタゴラス勝率

• “チームの総得点と総失点が等しい場合、勝率は5割(貯金・借金共にゼロ)である” という仮説を元に生み出された指標

• セイバーメトリクスの父、ビル・ジェイムズが生み出した

• チーム単位でのセイバーメトリクスの基本

Page 27: Agile Baseball Science - はじめてのセイバーメトリクス

(総得点)^2 / ((総得点)^2 + (総失点)^2)

Page 28: Agile Baseball Science - はじめてのセイバーメトリクス

パ・リーグ順位表(本物)

順位 チーム 勝 負 得点 失点 得失点差 勝率

1 ソフトバンク 67 33 481 346 135 0.6702 日本ハム 60 45 462 432 30 0.5713 ロッテ 51 50 411 411 0 0.5054 西武 49 55 451 448 3 0.4715 楽天 45 56 340 412 -72 0.4466 オリックス 44 60 389 413 -24 0.423

※2015/8/16現在の順位

Page 29: Agile Baseball Science - はじめてのセイバーメトリクス

パ・リーグ順位表(ピタゴラス)

順位 チーム 勝 (予)

負 (予) 得点 失点 得失点差 ピタゴラス

勝率順位 (現世)

1 ソフトバンク 68 35 481 346 135 0.659 12 日本ハム 57 49 462 432 30 0.534 23 西武 55 54 451 448 3 0.503 44 ロッテ 51 51 411 411 0 0.500 35 オリックス 50 56 389 413 -24 0.470 66 楽天 42 62 340 412 -72 0.405 5

※2015/8/16の得失点を元に算出、引分は考慮していない

Page 30: Agile Baseball Science - はじめてのセイバーメトリクス

セ・リーグ順位表(本物)

順位 チーム 勝 負 得点 失点 得失点差 勝率

1 阪神 57 49 360 425 -65 0.5382 ヤクルト 54 53 430 407 23 0.5053 巨人 55 54 359 350 9 0.5054 広島 50 53 403 359 44 0.4855 DeNA 50 58 394 451 -57 0.4636 中日 45 61 359 385 -26 0.425

※2015/8/16現在の順位

Page 31: Agile Baseball Science - はじめてのセイバーメトリクス

セ・リーグ順位表(ピタゴラス)

順位 チーム 勝 (予)

負 (予) 得点 失点 得失点差 ピタゴラス

勝率順位 (現世)

1 広島 58 46 403 359 44 0.558 42 ヤクルト 57 51 430 407 23 0.527 23 巨人 56 54 359 350 9 0.513 34 中日 50 58 359 385 -26 0.465 65 DeNA 47 62 394 451 -57 0.433 56 阪神 45 62 360 425 -65 0.418 1

※2015/8/16の得失点を元に算出、引分は考慮していない

Page 32: Agile Baseball Science - はじめてのセイバーメトリクス

出塁率、長打率とOPS

Page 33: Agile Baseball Science - はじめてのセイバーメトリクス

出塁率、長打率、OPS

• “アウトにならず、前の塁にでる”という能力を可視化する指標

• 出塁率(On-base)は「アウトにならない率」、長打率(Slugging)は「より前の塁に出る」能力を表す

• セイバーメトリクス的には、出塁率+長打率の和で大凡の得点能力がわかる(≒強い相関関係にある)

→OPS(On-base Plus Slugging)

Page 34: Agile Baseball Science - はじめてのセイバーメトリクス

出塁率 = (安打+四死球) / (打数+四死球+犠飛)

※打数 = 打席数 - (四死球 + 犠打 + 犠飛 + 走塁妨害)

Page 35: Agile Baseball Science - はじめてのセイバーメトリクス

長打率 = 塁打数 / 打数

※塁打 = 安打 + 二塁打 + 三塁打 * 2 + 本塁打 * 3

Page 36: Agile Baseball Science - はじめてのセイバーメトリクス

OPS = 出塁率 + 長打率

Page 37: Agile Baseball Science - はじめてのセイバーメトリクス

OPSランキング(パ・リーグ)

順位 選手名 (チーム) OPS 出塁率 長打率 備考

1 柳田悠岐(ソ) 1.092 0.468 0.624 日本で一番の強打者2 李大浩(ソ) 1.007 0.402 0.605 柳田と遜色ない成績3 中村剛也(西) 0.96 0.365 0.595 おかわり君4 秋山翔吾(西) 0.946 0.425 0.521 出塁率は二位5 清田育宏(ロ) 0.921 0.392 0.529 今年になって覚醒

※2015/8/16現在の成績を元に算出

Page 38: Agile Baseball Science - はじめてのセイバーメトリクス

OPSランキング(セ・リーグ)

順位 選手名 (チーム) OPS 出塁率 長打率 備考

1 山田哲人(ヤ) 1.000 0.411 0.589 歴史に残る強打の二塁?2 筒香嘉智(D) 0.943 0.416 0.527 今年急成長の長距離砲3 平田良介(中) 0.851 0.384 0.467 走攻守揃ったスラッガー4 ゴメス(神) 0.847 0.386 0.461 三振と四球が多い5 畠山和洋(ヤ) 0.839 0.346 0.493 AS選ばれなかった人

※2015/8/16現在の成績を元に算出

Page 39: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダン率

Page 40: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダンis誰?

• 元メジャーリーガー(2014年引退)で、三振が非常に多く、四球と本塁打も多かった名選手(又は迷選手)

• 実働14年間で2379三振、1317四球、462本塁打(打率.237、1631安打)

• Wikipedia「三振」ページのモデル

Page 41: Agile Baseball Science - はじめてのセイバーメトリクス

Wikipedia「三振」 ※2015/8/17現在 https://ja.wikipedia.org/wiki/三振

Page 42: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダン率

• ”全打席の中で三振と四球、本塁打が多い打者はアダム・ダンっぽい”という”事実”に基づき誕生したセイバーメトリクス指標

• なんJにて誕生、作者は不明

• アダム・ダン率が高い野手はバットをよく振る”扇風機”か、ボールをじっくり見る”地蔵”の可能性が高い

• “扇風機”および”地蔵”は相手野手の守備機会を奪う

→投手の責任増大(DIPSが重要に!!!)

Page 43: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダン率 = (ダンらしさ) / 打数 * 100

※ダンらしさ = 本塁打 + 四球+ 三振

Page 44: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダン率(パ・リーグ)

順位 選手名 (チーム)

ダン率 HR 四球 三振 備考

1 中村剛也(西) 47.3 33 47 139 三振王かつ本塁打王2 ペーニャ(楽) 43.4 13 50 85 地蔵&扇風機らしい成績3 メヒア(西) 40.4 18 30 119 去年の本塁打王4 森友哉(西) 38.3 13 33 113 イメージ以上に三振多い5 中田翔(日) 36.8 26 55 86 打率.260

※2015/8/16現在の成績を元に算出

Page 45: Agile Baseball Science - はじめてのセイバーメトリクス

アダム・ダン率(セ・リーグ)

順位 選手名 (チーム)

ダン率 HR 四球 三振 備考

1 丸佳浩(広) 38.4 15 64 97 貫禄の四球王2 梶谷隆幸(D) 36.0 7 44 105 三振王3 ゴメス(神) 35.7 14 55 92 安定した三振と四球4 山田哲人(ヤ) 33.5 26 57 81 思ったより三振多い5 筒香嘉智(D) 32.2 17 55 66 ある意味立派

※2015/8/16現在の成績を元に算出

Page 46: Agile Baseball Science - はじめてのセイバーメトリクス

まとめ

Page 47: Agile Baseball Science - はじめてのセイバーメトリクス

私から皆さんへ

• 贔屓球団、好きな選手のプレーに一喜一憂する野球とは違う、データを元に楽しむ野球の楽しみ方もあるんだぜっ!

• “野球の統計学はAgileに通ずる”

Agileの実践・勉強に疲れたら野球の統計学をやってみるのも手かと

※私が事実そうでした(Lean Startupの勉強してた頃)

Page 48: Agile Baseball Science - はじめてのセイバーメトリクス

皆さんにお願い

• これ、XP祭りでもイケると思う?

• 感想含め、忌憚なきご意見を!

Page 49: Agile Baseball Science - はじめてのセイバーメトリクス

ゲームセット!!!ご清聴ありがとうございました.

Shinichi Nakagawa(Twitter/Facebook/hatena:@shinyorke)