睡眠障害バイオマーカーの 探索的統計解析 -...

25
睡眠障害バイオマーカーの 探索的統計解析 産業技術総合研究所 根本 [email protected] 1

Upload: others

Post on 28-Sep-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

睡眠障害バイオマーカーの

探索的統計解析

産業技術総合研究所 根本 直

[email protected]

1

Page 2: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

現場では試料はあるものの、何かが起こっているが判然とはせず、どう切り込んで良いか分からない事象を測

る技術には大きな需要がある

• 製造現場:異常品分析や品質向上

• 研究開発現場:実験のばらつきの理由

• 医療現場:複数メカニズムの関与する病態や未病アセスメント

• 曖昧性のある定義を測る必要性

– 健全性、元気さ、深刻さ、不安定さ、微妙なばらつき、etc.

2

∴包括的にバイオマーカー候補等の影響因子を把握し、メカニズムを推定しナビゲーションする簡便な技術が必須

Page 3: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

インタラクティブNMR-メタボリック・プロファイリング

3

• ア・プリオリに適用でき、「何かが起こっている」混合物溶液をそのまま、スペクトルのプロフィールとして解析し、「データの分布の構造」を観察しながら因子を特定していく方法論を確立いたしました。

• 分離分析を伴わない非破壊の方法ですので「まずやってみる」のに適した方法です。

• メタボローム解析で近年行なわれているNMRメタボロミクスにインタラクティブな探索的解析を取り入れています。

この「インタラクティブ・スペクトルプロファイリング」は、NMR-MP法として開発応用化を進めてきましたが、広く応用がきき、データ散布図を中心として議論を進めるので、スペクトルの知識の無い分野外の人達と一緒に問題の本質を考察できます。結論は言えないものの、問題因子の発見、追跡、評価、そして「次の一手を示す」ためにとても便利なナビゲーションツールで、創薬・医療・食品を含む広い分野に適用可能です。

• 今回、計測評価が困難であった睡眠障害モデルマウスに適用してみました。

Page 4: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

•核スピンを計測するので再現性が極めて良い •ダイナミックレンジが大 •モル濃度を直接反映(検量線不要で定量) •混合物計測は試料調製が非常に簡単 •標準仕様の装置+精密空調 •最近の装置は自動化が進んでいる •1次元スペクトルは数分で計測可能 •発展的解析が可能

•500MHz@1H •H{CN}/広帯域プローブヘッド •シールドマグネット (漏れ磁場僅少) 震災後新規導入されたバイオ・汎用機 (800MHz 750MHz 600MHzは被災廃棄)

BrukerBiospin AvanceIII

私たちはNMRを利用しています

4

再現性に優れ基盤的・応用化研究に最適、実用性が高いが維持管理がハードル (他のスペクトルを利用した安価・簡便な探索解析法の実用化を行いたい)

Page 5: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

2次元分布を与える因子の特定画面

横軸分離に寄与する変数とスペクトルの 連結表示による因子の包括的把握

混合物スペクトル

解析中の画面の一例(因子群の包括把握)

5

散布図:データ分布の構造の観察 1点=1データ=1試料

Page 6: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

次元圧縮にK-L展開を用いる 探索的統計解析

•Karfunen-Loeve展開 – 多検体計測結果を数値化し行列として計算

– PCA(主成分分析)として一般的に認知されている

– 日本人が創りだした解析法

– データ分布を新たに合成した特徴軸に射影する

•探索的解析

日本独自のインタラクティブ変数選択法による

複数メカニズムへの分解・知識発見

Page 7: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

代謝物NMRスペクトル=包括的メタボローム=表現型スナップショット

短冊状に面積を測って数値化(~250次元)

次元圧縮して変数選択を行い「データ分布の構造」を観察

(K-L展開=PCA などの統計解析)

変数を選択しつつ散布図を描くことで変動を説明する因子(バイオマーカー候補など)を 探索的に探し出すことが出来る

(実験データの多次元空間を飛び回って俯瞰する)

NMR-メタボリック・プロファイリング

Page 8: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

Skip

バケット積分(ビニング)

200~250次元(変数)に

Page 9: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

Sample1の座標の記述=固有ベクトル(0.2,1.5,1.3,1,6,0,8, … )

今回の場合200~250個の変数(次元)

PC1 もっとも分散の大きくなる軸

PC2 2番めに大きく、PC1に直交し重心を通る軸

特徴を最大限残した姿での新しい合成軸への射影

新しい軸へ投影するときの影響量が因子負荷量(ローディング)

K-L展開=PCA:主成分分析

X3~250 X1

X2

PC1

Page 10: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

•次の一手の決断の支援 •変化を与えている因子を一括把握 •どう手をつけて良いかわからない対象に •解析標的(物質など)を設定しない •1試料=1スペクトル=1固有ベクトルで 記述される1データ点 •250変数への数値化(250次元空間) •250次元を2次元のスキャッタープロット として解析(次元圧縮による情報抽出) •出来るだけ情報を残し「影絵」を得る •データ分布の構造から意味を抽出 •万能ではないが大変便利 •ア・プリオリに実施できる手法だが 誤解が多い?

•果汁混合試験・コーヒーの品種解析 •醤油の品質とメイラード反応の可視化 •血液・尿・唾液からの健康状態分析 (がん、糖尿病、高血圧、ストレス) など

当方解析実例

非標的(ノンターゲットNMR)分析の目的と特徴

PC1( m%)

PC

2(

n%

)

数値化

縮約特徴抽出

データ分布の構造

Page 11: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

例:りんご・オレンジ果汁混合データの散布状況 水信号を除く212変数(212次元)を2次元に圧縮

データ分布に明確な構造は一見して見え無い

散布図のデータ点の色分け

赤:りんご 黄:オレンジ 青:混合物 黒:表示スペクト ルデータ点

Page 12: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

71.3%

27.1%

例:りんご・オレンジ果汁混合データの散布状況(構造の創出) (りんご4:オレンジ1混合試料の処理を変えてアウトライヤとするとデータが整列する)

散布図のデータ点の色分け

赤:りんご 黄:オレンジ 青:混合物

オレンジ100% (絶対値微分)

リンゴ/オレンジ 4:1(FFTのみ)

Page 13: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

13

例:果汁4種混合データの散布状況(データ分布に明らかな構造) 水信号を除く212変数(212次元空間)を2次元に圧縮

り:りんご ぶ:ぶどう グ:グレープフルーツ オ:オレンジ 数字は混合量比

りんご100%

ぶどう100% グレープフルーツ100%

オレンジ100%

りんごを原点にそれぞれの果汁へ容量比を反映して 放射状に分布

Page 14: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

変数は多ければ良いわけではない:意識すべき「ピーキング現象」

•変数が多すぎると識別器が劣化してしまう •次元圧縮による情報抽出量には最適値がある •最適値は集めたデータの「質と量」によって 決まる。 •量は容易に測れるが質は不明 •良質のデータを取得することが重要 •実用的なほどよい因子(変数)数で実施が肝要

次元圧縮

有用情報の抽出量

ピーク

最適数 (未知)

与えられた因子の数 次元(変数の数)

山口大学浜本義彦教授原図より改変

次元数の増加

識別情報の増加 識別器の劣化

Page 15: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

統計主成分の分布の確認と変数選択

15

100 %

75

50

25

0 PC2 PC6 PC8 PC4 PC1 PC5 PC3 PC7

NMR

質量分析

遺伝子チップ

•NNMRスペクトルによる統計解析では 統計主成分(PC)がすみやかに減少 •したがって質量分析や遺伝子チップと比べて 有利(差が出やすい) •NMRスペクトルではPC4/PC5平面などは ほとんど意味が無い •したがって変数選択によりあらたなPC1、2 (特徴空間)を導出するほうが知識発見に結びつく •変数の選択方法は試行錯誤的であっても あとで 納得の行く説明ができるのであれば良い

Page 16: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

‘NMR cocktail’添加

実験系

試料取得

多検体NMR測定

一次解析

二次解析

「因子」の追求・メカニズムの推定 仮説設定

散布図の観察

変数(因子)選択

観測系の最適化

探索的解析と観測系の最適化

Page 17: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

48.0%

38

.9%

例:細胞培養上清の解析 水信号を除く238変数を2次元に圧縮

PC1(赤) PC2(青)の 双方に同程度 影響を与えている 因子が存在する

(1.38)

1試料1点で散布 y1 y3 g11などが離れて見える 異常値(アウトライヤ)である 特徴空間をけん引する因子を探索する

課題:植え継ぎがうまくいかない培養液の存在

Page 18: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

細胞培養上清

例:細胞培養上清の解析

当該因子を削除すると 横軸の意義が明確に なった。 けん引する因子は2つ。 (1.22と3.7) これはNMRからEtOHと 判明。 定量するとアミノ酸量 より一桁多く混入。 (シャーレの蓋を開閉 しただけで混入)

第1:EtOH雰囲気下で細胞を取り扱ったため 予期せぬ因子の発見

Page 19: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

良好に生育

33.3%

30.0%

細胞培養上清の解析

第2:良好に生育するロットは近くに分布

EtOHの信号に相当 する因子を削除すると 良好に生育した培養液 のロットが近くに散布

過剰な消毒・換気不良のまま作業を進めたこと(予想外の因子) 確かに市販(輸入)培養液のロットには培養に適・不適が存在する 引き続き因子いて因子を特定する

Page 20: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

インタラクティブNMR-メタボリック・プロファイリング

• 多検体計測結果を数値化し探索的に多変量解析 – 前処理無く混合物のまま計測できるので高速

– 包括的に状態(因子)を把握

– 入り組んだメカニズムを分離できる

– 予期せぬ因子を発見できる

– 注目しているのは「データ分布の構造」なので簡単

• ストレス誘導睡眠障害モデルマウス

– 直ちに人間に外挿可能なモデル

– 継続的行動観察や遺伝子発現などで評価

そこで血液試料をNMR-メタボリック・プロファイリング解析

Page 21: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

青:ストレス負荷前 赤:ストレス負荷後 一見して判然とはしていないが 時間依存の応答があることが 判明

ストレス誘導性睡眠障害マウスの血液データ散布図

明期後半のみ(照明点灯後6〜10時間後)を抜き出して散布 左右に分離した(変数選択無し) 単一の化学成分では説明出来ずない

赤:ストレス負荷後

青:ストレス負荷前

Page 22: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

• 簡便な睡眠障害の計測・評価法は無かったがインタラクティブNMR-MPで可視化できる。

• ストレスにより睡眠障害を惹起せしめたマウスの血液中の構成成分はストレス・睡眠障害に呼応して変化する。

• 特に明期の血液にて顕著である(マウスは夜行性)。 • 散布図と因子負荷量(秘匿)の検討から目的因子(秘匿)を包括

的に把握。 • 典型的な血液試料スペクトルを選定して標的解析に供し化学成分

群を同定。

• いずれの血液中の単一化学成分では睡眠障害群と対照群の統計的有意差は無く説明不能。

• 複数成分の組み合わせが特徴空間を説明(構成)している。 • 睡眠障害群と対照群が分離する状況について統計的バリデーショ

ンを行い確認した。

22

ストレス誘導性睡眠障害マウスの血液データ散布図

単一化学成分では説明できないことが代謝の包括的解析で可能に!

Page 23: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

ご利用ください • 非標的NMR-MP分析は構造解析の知識が無くても簡単に実施できます • 意味のあるデータ構造を求める探索的統計解析です • 背後にある複数のメカニズムを皆で推定できます(課題発見・仮説設定) • 統計はあくまで可視化ツール、信頼性のある物理化学的計測量ベースです • 思いもよらない因子を発見できます

• 基本の習得は3ヶ月程度と短期です • 俯瞰的視点を持った人材を養成できます • 部署分野の壁を超えた討論ツールとして便利です

• 具体的応用例の詳細をお話できます • 共同研究を推進しています • 産総研各種制度を利用して解析支援や人材育成を進めています • 産総研保有装置が利用できます

お気軽にご相談ください

23

Page 24: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

特許

特願2012-234036号

「睡眠障害のバイオマーカーの計測方法」

未精製生体由来混合物試料を直接包括的にNMR計測し、統計散布図により把握する簡便な方法

特許第5088731号

「多変量解析装置及びコンピュータプログラム」 株式会社JEOL RESONANCEと産総研の共同出願

スペクトルを利用した多変量解析によりメタボローム、プロテオーム、ゲノム等のオミックスデータを

統合解析する技術「マルチオミックスプロファイラー」の特許。

24

Page 25: 睡眠障害バイオマーカーの 探索的統計解析 - JST...インタラクティブNMR-メタボリック・プロファイリング 3 • ア・プリオリに適用でき、「何かが起こっている」混合物溶

25

産業技術総合研究所

ライフサイエンス分野研究企画室

TEL : 029-862-6032

FAX : 029-862-6048

e-mail : [email protected]

お問い合わせ先