天文学 db 用検索言語仕様の考察

21
天天天 DB 天天天天天天天天天天 白白白白 , 白白白白 , 白白白白 , 白白白白 , 白白白白 ( 白白白白白 ), 白白白白 ( 白白白白白白 ), 白白白白 ( 白白白白白 )

Upload: ivy-richard

Post on 03-Jan-2016

41 views

Category:

Documents


0 download

DESCRIPTION

天文学 DB 用検索言語仕様の考察. 白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ), 安田直樹 ( 東大宇宙線研 ), 増永良文 ( お茶の水大 ). はじめに. バーチャル天文台 ( VO) 計画. 世界中の天文データベースを自動連携 データベースと解析ツールの統合環境 学校教育等、一般社会での利用 参加国 アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。. 国内の望遠鏡 すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 天文学  DB  用検索言語仕様の考察

天文学 DB 用検索言語仕様の考察

白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ),

安田直樹 ( 東大宇宙線研 ),増永良文 ( お茶の水大 )

Page 2: 天文学  DB  用検索言語仕様の考察

はじめに

Page 3: 天文学  DB  用検索言語仕様の考察

バーチャル天文台 ( VO) 計画

• 世界中の天文データベースを自動連携• データベースと解析ツールの統合環境• 学校教育等、一般社会での利用• 参加国

アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。

Page 4: 天文学  DB  用検索言語仕様の考察

現在 将来の望遠鏡・• 国内の望遠鏡– すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台)

– あすか , はるか , Astro-F, Astro-E2 ( 宇宙航空研究開発機構 )

• 海外の望遠鏡•ハッブル宇宙望遠鏡 , VLT,   Gemini, VLA, チャンドラ X 線望遠鏡、 XMM ニュートン X 線望遠鏡、 Integral 、 GLAST 、 HETE-2 、 Swift 等…

望遠鏡は年々巨大化 高機能化し、データ量も爆発的に増加・

野辺山電波~ 1TB/ 年 , すばる~ 20TB/ 年 , ALMA ~ 1PB/年

Page 5: 天文学  DB  用検索言語仕様の考察

天文 DB の現状ウェッブブラウザを利用して誰でもデータ

ベースへアクセス可能•国内

• SMOKA http://smoka.nao.ac.jp/• NRO http://nrodb.nro.nao.ac.jp/• Darts http://www.darts.isas.jaxa.jp/

•海外• MAST http://archive.stsci.edu/• SDSS http://skyserver.sdss.org/dr1/en/• VizieR http://cdsweb.u-strasbg.fr/viz-bin/VizieR• NED http://nedwww.ipac.caltech.edu/

データはこれからますます増えつづける。

これらの DB へのポータルサイト、バーチャルオブザバトリ (VO) が必要。

Page 6: 天文学  DB  用検索言語仕様の考察

データモデル

Page 7: 天文学  DB  用検索言語仕様の考察

天文データの種類• 天体カタログ:天体の属性(座標、明るさ、形状等)につい

てのテーブル。

• 画像データ:天体の外観 構造や局所的 大局的分布について・ ・の情報を視覚的に表現するデータ形式。

• スペクトルデータ:天体の波長毎の明るさの分布。元素組成、その天体までの距離の情報。

• フォトンデータ:光子毎の属性データ(座標、エネルギー、時刻)。

• ライトカーブデータ:天体の明るさの時間変動。ブラックホールの質量推定。

異なる形式のデータに対する統一的な検索言語データモデルの共通化

Page 8: 天文学  DB  用検索言語仕様の考察

観測データモデル• 天体観測というものは、空間座標と波長軸からなる三次元空間( データキューブ ) 内の明るさ分布を測定する、ということである。

• 画像データはデータキューブを空間平面へ射影である。

• スペクトルデータは波長軸への射影である。

Page 9: 天文学  DB  用検索言語仕様の考察

データキューブの仮想テーブル化データキューブからのデータの切り出し

• 切り出し条件(3次元空間内の部分空間を指定)• 射影方法(画像かスペクトル)

データへのポインタ(実データを得るための URL )これらをテーブルの要素 カラムとする無限個のレコードからな・る仮想テーブルを考え、それに対する検索とみなす。

条件1 条件2 Image() Spectrum()

領域1 波長域1 http://naoj/subaru/image?id=2312&ra=230.&dec=+23&r=1

http://naoj/subaru/spectrum?id=2312&ra=230.&dec=+23&r=1

領域2 波長域2 … …

SQL による検索、 RDB であるカタログデータとの親和性

Page 10: 天文学  DB  用検索言語仕様の考察

要求事項 検索システム・

Page 11: 天文学  DB  用検索言語仕様の考察

VO 用検索言語への要求事項• 分散 DB 対応

観測所毎に管理されている DB への一括検索要求。• 天球座標上での検索条件指定

特異点(極、経度360度)の取り扱い方法。• 天球座標に基づくテーブル Join の方法

天体の ID は座標である。複数テーブルの Join は座標の近さで行う。テーブル毎に座標値の精度は異なる。

• 画像データやスペクトルデータの検索データキューブからのデータ切り出し方法を記述。

• テーブル名やカラム名のアブストラクト指定大量にあるテーブルの中から、必要なテーブルを条

件付けて指定する方法。カラム名の共通化。• 読みやすく分かりやい言語

Page 12: 天文学  DB  用検索言語仕様の考察

VO における検索システム

天文 DB

データサービス

天文 DB

データサービス

天文 DB

データサービス

VO ポータル

MetadataDB

Registryサービス

SkyQueryADQL

ADQL

ADQL

SkyQuery は ユーザが VO ポータルを経由して利用する検索言語

ADQL (Astronomical Query Language) はデータサービスへの検索言語。 SkyQuery は ADQL の上位互換言語。 ADQL は SQL の上位互換言語。

ユーザ他の VO

• テーブル カラム名の解決・• 天体座標の解決• データサービス URL の解決

Page 13: 天文学  DB  用検索言語仕様の考察

検索言語仕様

Page 14: 天文学  DB  用検索言語仕様の考察

テーブル カラム指定・分散 DB への対応テーブル名、カラム名の URI を記述する。

[[[Authority.]DBname.]TableName.](ColumnName|UCD)

• Authority は DB管理組織に対して一意に割り当てられる名称。

• 各 DB管理組織はその内部で DB名の重複がないよう管理する。

• UCD (Unified Column Description) は天文データのカラムを意味づける標準名。フランス CDS を中心に取り決め。

• ファイル形式のテーブルの指定 

File:FileName

• 例 国立天文台のすばるデータベースにある銀河カタログの天体名カラム

naoj.subaru.galaxy.objectName

Page 15: 天文学  DB  用検索言語仕様の考察

テーブル カラム名のアブストラクト指定・

 テーブル名を指定するのではなく、テーブルの属性で検索候補を指定したい。

FROM TABLE OF [Keyword] “文字列”

  Keyword はテーブルのメタデータキーワードを利用する。 (IVOA により標準化作業中 )

  UCD名の候補を列挙 ,ワイルドカードの使用。SELECT (PHOTO_MAG_* | SPECT_FLUX_NORM)

 これらの文法は SkyQuery のみサポート。 データサーバに対してはテーブル名 カラム名は解・決した状態の SQL を渡すこと。

Page 16: 天文学  DB  用検索言語仕様の考察

位置指定文天球上の位置を記述する文

POINT(第一座標 , 第二座標 [, 座標系 [, 座標の Epoch]])POINT( 天体名 )

• 第一座標は赤経 (赤道座標) または銀経 (銀河座標 ) 、第二座標は赤緯または銀緯。• 座標系は赤道座標 (RA_DEC) または銀河座標 (GLON_GLAT) 。• 座標の Epoch は B1950 または J2000 。• 例

POINT(207.2, +23.3, RA_DEC, J2000)POINT(23:23:47.22, +02:35:10.00)POINT(“SN1987A”)

Page 17: 天文学  DB  用検索言語仕様の考察

領域指定文

位置領域指定文BOX(位置指定文 , 縦サイズ , 横サイズ [, ポジションアングル ])CIRCLE(位置指定文 , 半径サイズ )POLYGON(位置指定文のリスト [,(LARGE|SMALL)])HTM(HTM インデックスのリスト )

スペクトル範囲指定文SPECTRUM( 境界 1, 境界 2) | SPECTRUM( 波長帯名 ) • 境界値は波長 , 周波数 , エネルギーのいずれかを単位つきで指定する。• 波長帯名は “ optical”, “IR”, “radio”, “X-ray”, “gamma-ray”。

Page 18: 天文学  DB  用検索言語仕様の考察

テーブル Joinテーブル Join 文 ( クロスマッチ文 )XMATCH( テーブル1 , [!]テーブル2 ) <精度

[NEAREST|BRIGHTEST|ALL]• テーブル1の天体を基準に、テーブル2の天体とのジョインをその座標に基づき指定された精度で行う。• NEAREST がつくと最も近くの天体とジョインを行う。• BRIGHTEST がつくと最も明るい天体とのジョインを行う。• ALL がつくと「精度」内のすべての天体とのジョイン。• テーブル2に「!」がつく場合は排他的ジョイン。• Where 節で使用。

Page 19: 天文学  DB  用検索言語仕様の考察

画像 スペクトル検索・画像 スペクトルデータの検索・ SELECT   Image(条件指定文 ) | Spectrum(条件指定文 ) FROM   Authority.DBName.DataCube WHERE  条件指定文• 条件指定文は「領域指定文」、「スペクトル範囲指定文」、「キーワードに対する条件文」のうち複数を指定可。

• キーワードは別途定義の必要がある。例えば、 spatialRegion, spectrumBand, observatinTime, imagePixsize, integration 等。

• 検索結果はデータへのポインタ ( アクセス URL) を返す。• 画像 スペクトルデータの検索もカラム名の代わりに・ Image

(), Spectrum() といった関数を使うという以外、テーブルデータと同様の文法で記述される。

Page 20: 天文学  DB  用検索言語仕様の考察

まとめ

Page 21: 天文学  DB  用検索言語仕様の考察

SkyQuery, ADQL の拡張機能SQL への拡張機能 節 対応言語

テーブル名 カラム名の ・ URI 指定

S,F,W SkyQuery , ADQL

テーブル名 カラム名のアブスト・ラクト指定

S,F SkyQuery

天球上の位置指定文定義 S,W SkyQuery, ADQL( 天体名指定は SQのみ )

天球上の領域指定文定義 S,W SkyQuery, ADQLスペクトル範値指定文定義 S,W SkyQuery, ADQL座標値の誤差を考慮したテーブル Join 文

W SkyQuery, ADQL

画像検索指定文 Image() S SkyQuery, ADQLスペクトル検索指示文 Spectrum()

S SkyQuery, ADQL