[ddbjing29]ddbj nucleotide sequence submission system の紹介(第29回 ddbjing 講習会 in...

83
DDBJ Nucleotide Sequence Submission Systemの紹介 小菅 武英 Takehide Kosuge, Ph.D DDBJセンター、アノテーター DDBJ, Annotator 201461229DDBJing 講習会 (DDBJ) 1

Upload: dna-data-bank-of-japan-center

Post on 30-Jul-2015

2.601 views

Category:

Education


0 download

TRANSCRIPT

DDBJ Nucleotide Sequence Submission Systemの紹介

小菅 武英 Takehide Kosuge, Ph.D

DDBJセンター、アノテーター DDBJ, Annotator

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 1

目次

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 2

目次 2 塩基配列データの登録受付は2種類 3 データ登録~公開までの流れ 4 DDBJフラットファイル(flat file) 5 塩基配列の登録を開始する前に 6 必要な情報について 7 典型的な登録事例(アノテーション)の見本 8 フィーチャー、クオリファイア、生物名、CDS、Location 説明 ページへのリンク 9

DDBJ塩基配列登録システムの特徴 10 登録を開始する 11 データ登録ページ 12 Web版塩基配列登録システムの説明ページ 13 DDBJ Nucleotide Sequence Submission System スタート画面 14 Submission System における入力の流れ 15 各入力ページの説明 19 画面上部にあるプログレスバーについて 20 1. Contact person 21 登録開始メールについて 22 2. Hold date 23 3. Submitter 24 4. Reference 25 5. Sequence 26 入力可能な塩基配列について 27 6. Template 28 7. Annotation 表形式入力画面 29 7. Annotation Templateでotherを選択した際の入力画面 30 Confirm後、"Next"ボタンクリック時に表示される最終確認画面 31 8. Finish 32 登録完了メール 33 よくある入力ミス 34

補足資料 35 プログレスバーで画面を遷移して修正したときの注意事項 36 2. Submitter画面 登録者の追加・削除・表示順の変更操作 37 4. Reference画面 Unpublished の場合 38 In press 選択時 39 Published 選択時 40 Journal入力欄におけるJournal名の入力補助機能について 41 例: Journal of biological chemistry の検索 42 TPA 登録を行う場合の塩基配列入力画面 43 TPA登録における Assembly Information の書式 44 Assembly Information 入力規則 45 編集操作 Qualifierの編集アイコンをクリックした場合 46 Edit Columnをクリックした場合 47 セルのダブルクリックまたはTemplate: other選択時の場合に 青色文字(qualifierなど)をクリック 48 生物名の入力について 49 genetic codeについて 50 生物名入力におけるカテゴリーの選択について 51 Category: デフォルトの入力欄 52 Viruses/Phages 選択時の入力 53 Environmental Samples 選択時の入力 54 Artificial construct 選択時の入力 55 A known species but unregistered in taxonomy database 選択時の入力 56 Not found in taxonomy database, but already registered in other sequence data 選択時の入力 57 A novel species to be proposed in the paper 選択時の入力 58 annotation file の upload 59 Upload 可能な annotation file について 60 annotation file 例 61 エラーチェックに関する仕様 62 Upload & Confirmクリック後の画面 Errorが無い場合 63 Error/Warningが生じた場合 64 Confirmクリック後の画面 error無しの場合 65 errorが生じる場合 66 warningが生じる場合 67 SubmitterまたはReference内にerrorがある場合 68 Error/Warning説明ページへのリンク 69 CDSフィーチャーにおける翻訳エラーと説明ページへのリンク 70 入力例1 16S rRNAアノテーションの入力例 71 入力例2 ミトコンドリアCOI配列の入力画面例 77 入力例3 ミトコンドリアゲノム部分配列のannotation入力例 79

メイン 補足

塩基配列データの登録受付は2種類

DDBJ Nucleotide Sequence Submission System

(DDBJ塩基配列登録システム)

ウェブブラウザを使用 指定箇所に入力

小規模なアノテーション付きの塩基配列

登録者

DDBJ

Mass Submission System (MSS)

GenBank ENA

公開後はデータの共有が行われるため、DDBJに登録すればGenBankやENAからも検索が可能

登録者自身で登録用書式に基づいて登録ファイルを作成 登録用ファイル送信は主にE-mail 経由

INSDC*

*INSDC =International Nucleotide Sequence Database Collaboration http://www.insdc.org/

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 3

多件数または長大な塩基配列

データ登録~公開までの流れ

回答(email)

塩基配列登録 システム

問い合わせ(email) データに不足, 不備や不明な点がある場合

DDBJ (annotator)

即日公開

問題点が なくなるまで繰り返す

フラットファイル の公開

指定した日付まで非公開。ただし、以下の場合は公開処理を行います

• 指定した公開日が到来したとき

• 登録者から公開依頼を受けた時

• アクセッション 番号の公表をDDBJで確認できた場合

登録者 (Submitter(s))

または

アクセッション

番号発行

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 4

DDBJフラットファイル(flat file)

アノテーション

DEFINITION 行 (塩基配列の概要が示される)

アクセッション番号 生物分類情報

文献情報

配列情報

登録者情報

DDBJ

で作成

LOCUS ABxxxxxx 450 bp mRNA linear HUM 01-JUN-2014 DEFINITION Homo sapiens GAPD mRNA for glyceraldehyde-3-phosphate dehydrogenase, partial cds. ACCESSION ABxxxxxx VERSION ABxxxxxx.1 KEYWORDS . SOURCE Homo sapiens ORGANISM Homo sapiens Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Homo. REFERENCE 1 (bases 1 to 450) AUTHORS Mishima,H. and Shizuoka,T. TITLE Direct Submission JOURNAL Submitted (30-NOV-2013) to the DDBJ/EMBL/GenBank databases. Contact:Hanako Mishima National Institute of Genetics, DNA Data Bank of Japan; Yata 1111, Mishima, Shizuoka 411-8540, Japan REFERENCE 2 AUTHORS Mishima,H., Shizuoka,T. and Fuji,I. TITLE Glyceraldehyde-3-phosphate dehydrogenase expressed in human liver JOURNAL Unpublished (2013) COMMENT Human cDNA sequencing project. FEATURES Location/Qualifiers source 1..450 /chromosome="12" /clone="GT200015" /clone_lib="lambda gt11 human liver cDNA (GeneTech. No.20)" /map="12p13" /mol_type="mRNA" /organism="Homo sapiens" /tissue_type="liver" CDS 86..>450 /codon_start=1 /gene="GAPD" /product="glyceraldehyde-3-phosphate dehydrogenase" /protein_id="BAA12345.1" /transl_table=1 /translation="MAKIKIGINGFGRIGRLVARVALQSDDVELVAVNDPFITTDYMT YMFKYDTVHGQWKHHEVKVKDSKTLLFGEKEVTVFGCRNPKEIPWGETSAEFVVEYTG VFTDKDKAVAQLKGGAKKV" BASE COUNT 102 a 119 c 131 g 98 t ORIGIN 1 cccacgcgtc cggtcgcatc gcacttgtag ctctcgaccc ccgcatctca tccctcctct 61 cgcttagttc agatcgaaat cgcaaatggc gaagattaag atcgggatca atgggttcgg 121 gaggatcggg aggctcgtgg ccagggtggc cctgcagagc gacgacgtcg agctcgtcgc 181 cgtcaacgac cccttcatca ccaccgacta catgacatac atgttcaagt atgacactgt 241 gcacggccag tggaagcatc atgaggttaa ggtgaaggac tccaagaccc ttctcttcgg 301 tgagaaggag gtcaccgtgt tcggctgcag gaaccctaag gagatcccat ggggtgagac 361 tagcgctgag tttgttgtgg agtacactgg tgttttcact gacaaggaca aggccgttgc 421 tcaacttaag ggtggtgcta agaaggtctg //

Feature Location /Qualifier Feature = source, CDS など Location = 塩基配列上の ポジション Qualifier = feature 配下に / で示される /clone, /gene, /product など

参考 DDBJ のデータ公開形式 (flat file) の説明 http://www.ddbj.nig.ac.jp/sub/ref10-j.html

塩基配列登録システムに入力した内容がこの領域に記載されます

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 5

塩基配列の登録を開始する前に

Submit可能な配列は、アノテーション付きの塩基配列です 一度のsubmissionで1024件までの入力が可能です

(ただし各PCの環境により、一度に登録可能な最大件数は1024に 達しない場合もございます。この1024の設定値はDDBJ側のシステム環

境により変更する可能性があります) ブラウザは Firefox、Chrome を推奨しています。その他、 IE10、IE11、

Safari などでも経験上使用可能ですが、IE8では使用できません DDBJからのメールを受信できるようにしておいてください

※ 以下の場合はMass Submission Systemを利用してください。 ・ エントリ数(登録する配列の数)が多い場合 1024 を超えると塩基配列登録システムでは分割が必要です ・ 1エントリあたりに多数(概ね30以上)のFeature がある場合 ・ 配列が長い (目安は 500 kb 以上) 場合 ・ その他、塩基配列登録システムが対応していない登録 EST、STS、TSA、HTC、GSS、HTG、WGS、CON(AGP)など (http://www.ddbj.nig.ac.jp/sub/data_categories-j.html, Divisionを参照)

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 6

塩基配列の登録を開始する前に 必要な情報について

• コンタクトパーソン (登録者のうちDDBJと連絡できる方の氏名、Email、所属情報)

• 登録者(可能な限り複数名を指定)

• hold date (非公開にしておく期日) or 即公開希望

• 塩基配列に直接かかわるReference (著者、タイトル)

• 塩基配列(vector、linker、adaptor領域等がトリミング処理済であること)

• 塩基配列に対して記載するアノテーション

塩基配列を得た生物の学名

その生物の採取情報、ストレイン(/strain)、配列を得た組織名(/tissue_type) など

塩基配列の分子種(mRNA or genomic DNA or その他)

遺伝子の塩基配列上の位置(location)

protein-coding sequence (CDS)の場合は開始コドンから終止コドンまでの位置

遺伝子の gene symbol(/gene)とプロダクト名(/product) など

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 7

塩基配列の登録を開始する前に 典型的な登録事例(アノテーション)の見本

http://www.ddbj.nig.ac.jp/sub/example-j.html 典型的な登録事例(アノテーション)の見本をDDBJホームページに用意しています。アノテーションの参考にしてください

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 8

塩基配列の登録を開始する前に フィーチャー、クオリファイア、生物名、CDS、Location

説明ページへのリンク

Feature key (フィーチャーキー) の定義 http://www.ddbj.nig.ac.jp/sub/ref5-j.html

Qualifier key (クオリファイアキー) の定義 http://www.ddbj.nig.ac.jp/sub/ref6-j.html

登録の見本 http://www.ddbj.nig.ac.jp/sub/example-j.html

生物名に関する入力規則 http://www.ddbj.nig.ac.jp/sub/ref8-j.html

タンパク質コード配列(CDS)に関する説明 http://www.ddbj.nig.ac.jp/sub/cds-j.html

Location (塩基配列上の位置情報)記述法 http://www.ddbj.nig.ac.jp/sub/ref9-j.html

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 9

DDBJ塩基配列登録システムの特徴

• Submission完了までにかかる時間を短縮できます (前登録システムの SAKURA との比較)

• 16S rRNA配列, 1 CDSの配列, Influenza A virus 配列の登録など、典型

的な事例に対しては、アノテーション入力用テンプレートを用意しました。アノテーションの内容に応じた feature key、qualifier key が自動で選択される上、表形式の入力が可能です

• Multi-fasta形式の塩基配列を一度に入力することができます

• feature key、qualifier keyを自分で選ぶ入力方式にも対応しています

• DDBJアノテーションファイルのアップロードにも対応しています

• ブラウザでブックマークすることで、容易に入力の中断・再開が可能です

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 10

登録を開始する

http://www.ddbj.nig.ac.jp/

DDBJホームページから"登録"アイコンをクリックする

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 11

データ登録ページ

DDBJ Nucleotide Sequence Submission Systemをクリック

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 12

Web版塩基配列登録システムの説明ページ

"新規登録の開始"をクリックすると塩基配列登録システムページに遷移します

使い方の説明

ベクター配列のコンタミチェック

アノテーション記載に関する各説明ページへのリンク

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 13

DDBJ Nucleotide Sequence Submission System スタート画面

Create new submission をクリックしてスタートします

動作確認済みの推奨ブラウザ Firefox または Chrome

Safari、IE10、IE11 などにおいても経験上動作可能 ただしIE8では使用できません

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 14

Submission System における入力の流れ

1. Contact person を入力 メール受信、メール内リンクを開く

2. Hold date を指定

"Create new submission"をクリックしてスタート

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 15

3. Submitter を入力

4. Reference を入力

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 16

5. 塩基配列を入力 TPAの場合にはAssembly Informationも入力

6.アノテーション入力用テンプレートを選択。アノテーションをuploadするか、直接入力するかを選択

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 17

7. アノテーションを画面上で入力、または、 uploadする

エラーがなくなるまでアノテーションチェック、修正を繰り返す、最終確認画面表示

8. 完了 登録完了のメールを受信

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 18

各入力ページの説明

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 19

画面上部にあるプログレスバーについて

入力画面上部には進捗を示す プログレスバーが表示されます 入力済みのページは青字に変化し、クリック可能になり各ページに直接ジャンプできます

参考: 補足資料「プログレスバーで

画面を遷移して修正したときの注意事項」

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 20

1. Contact person

コンタクトパーソンは連絡の窓口となる方で登録者の中の1人を指定します

Email, Fax, Phone についてフラットファイル中で配列とともに公開してもよい場合にチェックを加えます

入力が済んだらNextをクリックします。入力したメールアドレス宛にメールが自動送信されます。

DDBJからの問い合わせに対する窓口となる方の電子メールアドレスを入力してください

コンタクトパーソンの氏名を full name で入力します

国名をリストから選択します 同時に、fax、phoneの国番号が自動選択されます

FAX番号を入力します

FAXを利用できない場合にはチェックを加えてください

電話番号を入力します(連絡に内線番号が必要な場合は内線番号も入力してください)

所属機関名を入力します

所属部署名を入力します(任意)

URLを入力します(任意)

郵便番号を入力します

都道府県名を入力します(任意) 市町村名を入力します

市町村名以降の住所を入力します

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 21

登録開始メールについて

Subject: DDBJ: Starting the submission To: [email protected] National Institute of Genetics Dear Hanako Mishima Thank you for using DDBJ. This email contains a link for proceeding of your nucleotide data submission. Please click the link below, then, you can continue your registration. http://ddbj.nig.ac.jp/submission/submissions/5036c6ee55d698c0ad000324/mail_confirmation?token=47444d24e2106dd81a323f6ed559b715ec8cbbab If you are not related person of the submission, please discard the email . Note : You must activate your new submission within 1 hour. If you failed to activate, please try again from the "Contact person" page. Note : You can not reply to this mail. If you encounter trouble while using this submission system, please send an email to [email protected] and let us know the browser's URL of your submission. Thank you, DNA Data Bank of Japan

コンタクトパーソンメールアドレス宛に登録開始用のリンクを含むメールが自動的に送信されます。 1時間以内にメール内のリンクから登録を続けてください。 "1.Contact person" ページのEmailアドレスが間違っている場合はメールが届きません。Emailアドレスを修正し、再度Next をクリックしてください。

メール本文内でリンクがかかっている場合はここをクリックすればブラウザが開きます。 リンクがかかっていない場合は、ここをコピーしてブラウザのURL欄に張り付け、リターンキーを押します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 22

2. Hold date

公開日(Hold date)をカレンダーから選択するか、即公開を選択します。

カレンダーアイコンをクリックし、表示されるカレンダーから公開希望日を指定してください

• カレンダーでは、6か月後の日付が自動的にハイライトされています • 年末・年始はDDBJの休業期間のため選択できません • 選択できる日付は最大3年後までです

入力が済んだらNextをクリックします

または、即公開希望の場合はここにチェックを加えてください

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 23

3. Submitter

Contact person の 氏名が自動変

換され初期値として入力されます。修正が必要な場合は適宜変更してください。

Submitter (登録者) 名を入力します

論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q.

・Addで登録者を追加できます (補足資料「2. Submitter」参照) ・DDBJでは複数の登録者の指定をお願いしております ・入力した順序通りにフラットファイル上に表示されます

入力が済んだらNextをクリックします

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

参考 登録者(Submitter) の定義 http://www.ddbj.nig.ac.jp/sub/submitter-j.html

複数の登録者を記載するようお願いいたします。 登録データの修正・更新を行える権利は登録者のみが有しております。 登録者が1名のみの場合、将来、修正が必要になった際に私どもから登録者本人への連絡がとれない場面に遭遇することもございます。1名の登録

者のみでの登録も可能ですが、複数の登録者を記載いただけるよう推奨しております。たとえば、実作業者と研究指導者(責任者)、論文著者から登録者

に加えるなど、2名以上の登録者記載に関しましてご協力をお願いいたします。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 24

4. Reference

Reference情報を入力します 配列に関する主論文(Primary citation)を第一referenceに入力してください

デフォルトで Unpublished が選択されています 論文準備中の場合、論文投稿後、論文を作成する予定がない場合はUnpublished を選択します 論文が受理されているときは In press、 論文がすでに公開されているなら Published を選びます Unpublished、In press、Published の選択に応じで入力欄が切り替わります(補足資料 「4. Reference」参照)

Referenceを追加する場合にクリックします

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

参考 Reference http://www.ddbj.nig.ac.jp/sub/reference2-j.html

論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q.

入力が済んだらNextをクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 25

5. Sequence

塩基配列を ペーストします

または、塩基配列ファイルをここからuploadします

デフォルトで”Yes”が選択されています、自身で塩基配列決定していればここは "YES" のままにします。 公開されているデータベースから塩基配列を一部でも引用している場合は "No." を選んでください、TPA入力モードに切り替わります (補足資料「TPA 登録を行う場合の塩基配列入力画面」参照)。

入力が済んだらNextをクリックします

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

注意!: アノテーション入力後、このページにおいて塩基配列を変更した場合、7.Annotationで入力した内容は失われます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 26

入力可能な塩基配列について

例1 >CLN01 ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa >CLN02 ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa 例2 >CLN01 ggacaggctgccgcaggagccaggccgggagcaggtggtggaagacagacctgtaggtgg aagaggcttcgggggagccggagaactgggccagaccccacaggtgcaggctgccctgtc tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tgaggcaggagaatcgcttgaaccccggaggcggaggttgcagtgagccgagattacgcc accgcactccagcctgggcgacagagtgagactccatctcaaaaaaaaaaaaaaaaaa // >CLN02 ctcacacagatgctgcgcacaccagtggttgtaacaatgccgtttgcctccttcaggtct gaagcctgaggtgcgctcgtggtcagtgaagagggcaaaaagagagagaggctcaaagga tgcgcttcagtcgtgggcgaagcctgaggaaaaagagagagaggctcaaggaagagagga tagtcattcatataaatttgaacacacctgctgtgcctagacaagtgtctttctgtaaga gctgtaactctgagatgtgctaaataaaccctctttctcaaaaaaaaaaaaaaaa //

Multi-FASTA形式の塩基配列をペースト(またはアップロード)可能です。 Entry name (エントリー名)は、24文字までの半角・英数記号(ただしスペース、"、?、¥、バックスラッシュを含まない)を用いて設定してください。 Entry name にはそれぞれ異なる名称を付けてください。 同じ Entry name が使用されている場合はエラーとなるため Entry name の修正が必要になります。 各エントリーの区切りに // を含んでいてもいなくても、問題ありません(例1、例2 のどちらでも良い)。 本システムでは // 無しの塩基配列を入力した場合、各エントリーの区切りとして // が自動的に挿入されます。 塩基配列は、a, c, g, t, m, r, w, s, y, k, v, h, d, b, or n のいずれかで構成される必要があります。 塩基配列中の スペース、数字は自動的に削除されます。 塩基配列中の大文字は自動的に小文字に変換されます

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 27

6. Template

ページ内に挙げられているアノテーションパターンに完全に合致する場合、template を利用した表形式でのア

ノテーション入力が可能になります。リストのいずれかを選択し、"Input annotation"をクリックしてください。 例えば、バクテリア16S rRNAの登録を行う場合はここを選択します。

上記リストに該当する項目がない場合にother を選択します。

この場合、テーブル形式のアノテーション入力は利用できません。

注意!: アノテーション入力後このページにおいてテンプレートを変更した場合、7.Annotationで入力した内容は失われます。

template選択後、"Input annotation"をクリックします

アノテーションファイルのuploadにも対応しています。upload機能の説明は補足資料「annotation file の upload」をご覧ください。

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 28

7. Annotation 表形式入力画面

②: Editクリックで、各エ

ントリーごとの編集が可能です

(c)各セルをダブルクリックして入力・編集が可能です

(a)Qualifier編集アイコン

のクリックで列ごとの編集が行えます

(b)Edit Columnをクリックした

場合、列ごとの編集が行え、copy & pasteによる一括入力が可能です

①: 追加したいQualifierを選択します

?アイコンクリックで各feature、qualifierの説明ページが開きます

"6.Template"画面でother以外を選択した場合には表形式のアノテーション入力画面になります。 基本操作 ① sourceフィーチャー横の"Select Qualifier"アイコンをクリック、Qualifierを追加しておく。sourceフィーチャー以外のフィーチャーにおいても必要であれば"Select Qualifier"からQualifierを追加する。 ② 各エントリーで"Edit"アイコンをクリックして入力していく ③ Confirmをクリック、Errorがある場合は②に戻って修正 ④ Confirmクリック、ErrorがなくなるとNextボタンがクリック可能になる ⑤ Nextをクリック、最終確認画面に遷移

"Edit"アイコンからの入力に加え次の入力方法が可能です a. Qualifier下に表示されている編集アイコンをクリッ

クする (補足資料「Qualifierの編集アイコンをクリックした場合」参照」)

b. Edit Columnの文字をクリックする(補足資料「Edit Columnをクリックした場合」参照」)

c. セルをダブルクリックする(補足資料「セルのダブルクリックまたはTemplate: other選択時の場合に青色文字(qualifierなど)をクリック」参照」 )

④⑤: チェック後、次のステップに進める場合のみ、"Next"がクリック可能になりま

す。アノテーションチェックで問題がある場合はクリックできません。

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

塩基配列入力時に各配列の先頭行に指定したEntry nameが表示されます

③: annotation入力後、Confirmをクリックします。

入力した内容の書式チェックが行われます。

追加情報がある場合にダブルクリックすれば、テキストでの自由記載が可能です。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 29

②: "Edit" クリックで、エントリーごとの編集が行えます

"Comment"クリックで、 必要に応じ、追加情報を自由テキスト記載で入力することが可能です

(b) Qualifierやlocationなどの青色文字を直接クリックすることでも編集可能です

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

(a) 全エントリーを対象に、クリッ

クしたクオリファイア値の編集が行えます

基本操作 ① sourceフィーチャーの"Select Qualifier"アイコンをクリック、sourceフィーチャー配下に記載するQualifierを追加しておく ② "Edit"アイコンをクリックしてsourceフィーチャー配下の情報を入力する ③ Add featureから必要なfeatureを追加。追加したfeatureに必要なQualifierは自動で選ばれているが、必要であれば適宜追加したfeatureの"Select Qualifier"アイコンをクリックして qualifierを追加しておく ④ 追加したfeature配下のlocation、qualifier をクリックしてアノテーションを入力、③④をfeatureの数だけ繰り返す ⑤ "Confirm"ボタンをクリック、Errorがある場合は修正 ⑥ "Confirm"をクリック、Errorがなくなると"Next"ボタンがクリック可能になるので "Next" をクリック、最終確認画面に遷移

③: featureを追加するには、Add featureをクリックします。フィーチャーリストからマウスで選択、クリックすると追加可能です。この図はCDSを追加したときの例です ④: 追加したfeature の location, qualifierをクリックして値を入力します。 ③④を繰り返します

①: "Select Qualifier"クリックで、qualifierを追加します

⑤: annotation入力後、Confirmをクリックします。入力

した内容の書式チェックが行われます

⑥: チェック後、次のステップに進める場合のみ、"Next"がクリック可

能になります。アノテーションチェックで問題がある場合はクリックできません

※ クリックすると、sourceフィーチャーに選

択されたクオリファイアが次のエントリー以降にコピーされます

"Edit"アイコンによる入力に加え次の方法が可能です a. sourceフィーチャー限定、qualifier左側に表示され

ている編集アイコンをクリックする (補足資料「Qualifierの編集アイコンをクリックした場合」参照」)

b. locationやqualifierをクリックする(補足資料「セルのダブルクリックまたはTemplate: other選択時の場合に青色文字(qualifierなど)をクリック」参照」 )

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 30

7. Annotation Templateでotherを選択した際の入力画面

これまでに入力してきた内容をテキストファイルで閲覧可能です

※ この欄にはテキスト

入力が可能ですので、伝えておきたい事項があれば記載しておいてください

Confirm後、"Next"ボタンクリック時に表示される最終確認画面

問題がなければ、どちらかの "Submit to DDBJ" ボタンをクリックします。"8. Finish" 画面に移動します。

修正を行う場合、画面上部のプログレスバーをクリックし、各画面にジャンプして編集後、各画面で必ず Next をクリックしてください。"5.Sequence"、"6.Template"で変更操作を行

うと入力済みのアノテーションが消去される点については注意してください。

各画面で修正後、画面上部プログレスバー"7.Annotation"をクリックすると、アノテーショ

ン入力画面にジャンプできます。"7.Annotation" 画面において Confirm後、Next をクリックすると再度この画面が表示されます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 31

8. Finish

DDBJに登録ファイルが転送されました。 この画面が出れば登録完了です。 同時に、登録完了のメール(次ページ)が自動送信されます。

入力した内容をDDBJ登録形式でダウン

ロードできますので、ファイルの保存を行ってください。同じファイルがDDBJサーバー

に自動転送されますので、これらのファイルをDDBJにお送りいただく必要はございません。

※ このページの URL をブックマー

クしておけば、短期間、閲覧可能です。

本システムにおいて問題が生じ場合は、ここのメールアドレス宛てに連絡を行ってください。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 32

登録完了メール

Contact person : [email protected] Hanako Mishima National Institute of Genetics DDBJ center, DDBJ 1111 Yata Mishima, Shizuoka, 411-8540 Japan Thank you very much for choosing DDBJ for data submission. We have received your data. We will soon check and annotate them on the basis of the manual and rules common to the DDBJ, EMBL-Bank, and GenBank. If you do not hear from DDBJ after 5 working days after receiving this notice, please contact us at the following address indicating your Entry ID. Email address: [email protected] Sincerely, DNA Data Bank of Japan DDBJ Center National Institute of Genetics Research Organization of Information and Systems Mishima, Shizuoka 411-8540, Japan fax: +81-55-981-6849 [Hold-date] 2013-03-29 [Entry ID] 5065382e55d69849870005fe.entry01 5065382e55d69849870005fe.entry02

From: [email protected] Subject: DDBJ: Web submission completed

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 33

• 塩基配列がmulti-fasta形式で入力されていないため、annotation画面の表示がおかしくなる

• クローニング時に人為的に加えられたvector、adapter、linker、primer領域はトリミングする → VecScreenでチェック(http://ddbj.nig.ac.jp/vecscreen/)

• genetic code が適切に入力されていないため、CDSが翻訳エラーになる

→ 補足資料:「genetic codeについて」を参照

• 開始コドンや終止コドンが含まれない部分配列の場合にCDS の locationが部分配列指定で入力されていないために翻訳エラーになる → Location記述法(http://www.ddbj.nig.ac.jp/sub/ref9-j.html) やタンパク

質コード配列; CDS feature について(http://www.ddbj.nig.ac.jp/sub/cds-j.html などを参考に修正する

• "MGA:No entry name is found other than [ COMMON ], without feature

[ DATATYPE/type=MGA ]."という訳の分からないエラーが表示される → /organism、/mol_typeを入力する前に"Confirm"をクリックしたため、

annotationを入力してから"Confirm"をクリックする

よくある入力ミス

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 34

補足資料

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 35

プログレスバーで画面を遷移して修正したときの注意事項

各ページ名をクリックすることで、前のページに戻って閲覧・修正することが可能です。修正後は、各ページ下部にある"Next"をクリックしてください

"5.Sequence"ページで塩基配列を差し替えた場合、入力したアノテーションが消去されます

"6.Template"ページでテンプレートを修正した場合、入力したアノテーションが消去されます

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 36

2. Submitter画面 登録者の追加・削除・表示順の変更操作

登録者を追加するには "Add"をクリックします

順番入れ替え 下に移動

順番入れ替え 上に移動

削除

登録者の順番を変えるには 登録者を削除するには

Addをクリックすると現れる入力

欄に登録者とメールアドレスを入力してください

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 37

4. Reference画面 Unpublished の場合

Yearは入力の必要がありません。自動で今年の西暦年が入力済みになります。

論文タイトルを入力します。 論文を準備されない場合も、塩基配列情報に応じてた適切なタイトルを記載してください。

論文の著者名を各欄に1名ずつ入力してください。 Add authorsで入力欄を追加できます。 X をクリックすると入力欄を消せます。

論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q.

入力が済んだらNextをクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 38

In press選択時、ジャーナルの略称(ISO abbreviation)を入力してく

ださい。この入力欄にはジャーナル名の入力補助機能がついています 参考:補足資料「Journal入力欄におけるJournal名の入力補助機能について」

Yearを入力します

論文タイトルを入力します

論文の著者名を各欄に1名ずつ入力してください Add authorsで入力欄を追加できます X をクリックすると入力欄を消せます

論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q.

4. Reference画面 In press 選択時

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 39

4. Reference画面 Published 選択時

Yearを入力します

Volume、Page、を入力します DOI が分かる場合は入力してください

論文タイトルを入力します

論文等の著者名に準ずる形式で,氏名の略記を記載してください。 カンマやピリオドの後ろにはスペースを入れないようにお願いいたします。 形式: last name[comma]first name の頭文字[period]middle name の頭文字[period] 例: Miyashita,Y. Robertson,G.R. Mishima-Tokai,H. Kim,C.S. Wang,Y.Q.

In press選択時、ジャーナルの略称(ISO abbreviation)を入力してください。この入力欄にはジャーナル名の入力補助機能がついています 参考:補足資料「Journal入力欄におけるJournal名の入力補助機能について」

論文の著者名を各欄に1名ずつ入力してください Add authorsで入力欄を追加できます X をクリックすると入力欄を消せます

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 40

Journal入力欄におけるJournal名の入力補助機能について

Journal Name欄にfull nameを入力いただく途中でジャーナル名の候補リストが表示されます。リストから選択することでISO Abbreviationに自動変換されます。

入力補助辞書は、 NLM Catalog を使用しております。 ISO Abbreviation については、NLM Catalog で検索することができます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 41

例: Journal of biological chemistry の検索 NLM Catalog(http://www.ncbi.nlm.nih.gov/nlmcatalog/)のページにアクセスします 検索したいジャーナル名[journal] を検索窓に入力し、Searchをクリックします

例 journal of biological chemistry[journal] クリックする

候補が表示されます 検索結果から、該当する方をクリックします

ISO Abbreviation はこれです

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 42

TPA登録を行う場合の塩基配列入力画面

塩基配列をここにペーストします。

または、塩基配列ファイルをここからuploadします。

自身で塩基配列を決定したのではなく、公開されている塩基配列を引用して塩基配列を構築した場合は "No" を選択してください。 TPA登録モードに切り替わります。

TPA配列の構築情報(次ページ参照)をペーストしま

す。各列が空白で区切られていることが重要です。

または、Assembly Information のファイルをここから upload します このページで入力を中断・再開するにはブラウザでブックマークす

るか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

入力後、Next をクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 43

TPA登録における Assembly Information の書式

TPA_SPAN PRIMARY_IDENTIFIER PRIMARY_SPAN COMPLEMENT FA01 1-552 ZZ000001.1 54872-55422

553-705 ZZ000002.5 1-153 BM123 1-438 ZZ000010.1 1-438

377-695 ZZ000011.1 1-320 c 411-790 ZZ000021.12 1-398 790-1191 ZZ000022.0 1-401

<入力例の意味> Entry name FA01 において; TPA塩基配列 1-552 の領域は ZZ000001.1 の 54872-55422 に対応 TPA塩基配列 553-705 の領域は ZZ000002.5 の 1-153 に対応 Entry name BM123 において TPA塩基配列 1-438 の領域は ZZ000010.1 の 1-438 に対応 TPA塩基配列 377-695 の領域は ZZ000011.1の 1-320 の相補鎖側に対応 TPA塩基配列 411-790 の領域は ZZ000021.12の 1-398 に対応 TPA塩基配列 790-1191 の領域は ZZ000022.0 の 1-401 に対応 いずれもTPA とプライマリーエントリの配列アラインメントに関する規則に従います

Entry Name

入力例

相補鎖に対応する場合のみ c を記載

TPA 配列上の location を記載

プライマリーエントリのアクセッション番号をバージョン番号とともに入力する。

プライマリーエントリの領域を入力する。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 44

Assembly Information 入力規則 第1行目は [tab or space]TPA_SPAN[tab or space]PRIMARY_IDENTIFIER[tab or space]PRIMARY_SPAN[tab or space]COMPLEMENT である必要があります 空行は指定しないでください Entry name は第1列に記載します、Entry name のある行でエントリーごとのAssembly情報が区切られることになります。 TPA_SPAN

書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要) TPA 配列上の領域を記載します。 例: 100..2000 例: 3400-4000

PRIMARY_IDENTIFIER

書式: accession number.version 引用するプライマリエントリのアクセッション番号をバージョン番号とともに入力します。未公開のアクセッション番号の場合はバージョン番号を 0 にしてください。 例: AB123456.1 例: AB987654.0

PRIMARY_SPAN

書式: X..Y もしくは、X-Y (X, Yは数字、X<Y であることが必要) プライマリエントリからの引用領域を入力します。抜き出した領域が TPA_SPANの領域と対応している必要があります。 例: 1..3345 例: 900-1235

COMPLEMENT

書式: 空欄もしくは c プライマリエントリから相補鎖領域を引用する場合にのみ c を指定します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 45

編集操作 Qualifierの編集アイコンをクリックした場合

Copy クリックで、そのエント

リー以降にも同じ値がコピーされます。 ただし、件数が多い場合やPCの環境により時間がかかる場合があります。 Qualifierの値が全エントリー

で同一である場合、同一値を速やかに入力することができる機能です。

クリックしたqualifierにおいて全

エントリーに対しての編集が可能です。

編集後"Save"をクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 46

Edit Columnをクリックした場合 テキストエリア上への一括pasteが可能

このテキストエリアに、直接入力するか、表計算ソフトやテキストエディタなどからcopy & pasteしてください。エントリーの区切りには改行を用います。 テキストリストからpasteすることで、全エント

リーに対して一括入力を行うことができる機能です。

表の列ごとに、各入力欄の編集が可能です。

編集後"Save"をクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 47

セルのダブルクリック または

Template: other選択時の場合に青色文字(qualifierなど)をクリック

セルのダブルクリック(Template: other選択時はqualifierのクリック)で入力欄が現れます。入力ウインドウに対して必要な値を入力してください

編集後"Save"をクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 48

生物名の入力について

入力した生物名を検索キーとして、NCBI taxonomy検索が実行可能です。 学名のスペルが曖昧なため調べたいとき、taxonomic lineageから

検索したいときなどにご利用ください。

Virus、Phage、環境サンプル、合成配列、taxonomy databaseに登録が無い場合などの場合に、カテゴリーを選択します。

参考 Organism qualifier に記載する生物名 http://www.ddbj.nig.ac.jp/sub/ref8-j.html

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 49

この欄に塩基配列を得た生物の学名を入力します。 正確な学名入力のための入力補助機能が備わっています。リスト表示された候補からマウスでクリックしてください。 生物の入力と同時に、Templateの種類に応じてgenetic codeに整数値が自動的に入力されます(次ページ参照)。 学名がtaxonomy databaseに存在しない場合など、genetic codeが自動的に入力されないときには、手動でgenetic codeを入力する必要があります。

genetic codeについて "7.annotation"画面において"Edit"アイコンをクリック ↓ (a) 学名をキーボードから入力、loadingアイコン(くるくる回転するマーク)が表示されます。 タイピングが速い場合や、学名を copy & pasteした場合には、loadingアイコンが出ないときがあります。

この場合は学名の入力欄をクリックし、キーボードの上または下キーを押すことで再検索されます。なお前後に空白があると検索できませんので必ず取り除いてください。 ↓ (b) 学名が見つかると、候補リストが表示されるのでマウスで選択します ↓ (c) genetic code欄に自動的に値が入力されます。 自動入力されない場合には手動で整数値を入力します

TemplateでCDSが指定される場合、もしくは、otherを選択した場合にgenetic codeの入力が必要です。 なぜなら、本システムではCDSフィーチャー配下の /transl_table に記載する整数値を、生物名入力時の genetic code 欄の値から取得するためです。 taxonomy databaseから公開されている学名であれば、scientific name入力欄で表示される候補リストからマウスで選択することによって、genetic codeが自動的に取得されます。genetic codeが自動入力されない場合は手動で整数値を入力する必要があります。 genetic code に指定する整数値については、 The genetic code(http://www.ddbj.nig.ac.jp/sub/geneticcode-e.html)をご覧ください。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 50

(a) (b) (c)

こちらもご覧ください。 Organism qualifier に記載する生物名 http://www.ddbj.nig.ac.jp/sub/ref8-j.html

生物名入力におけるカテゴリーの選択について

塩基配列が由来するサンプルに応じてCategoryを切り

替えてください。Categoryに応じ

て生物名入力欄が切り替わります。

Category 内容

Select only for virus, environmental sample, etc. デフォルトです。以下のカテゴリーでない場合に選択します。

Viruses/Phages VirusやPhageの場合に選択します、生物名入力補完辞書がVirus、Phageに切り替わります。

Environmental Samples 環境サンプルの場合に選択します。Scientific name: 入力欄に自答的に uncultured が記載されます。

Artificial Construct クローニングベクター、発現ベクター、合成配列の場合に選択します。

A known species but unregistered in taxonomy database 学名がvalidであるが、NCBI taxonomy databaseで見つからない場合に選択します。

Not found in taxonomy database, but already registered in other sequence data

NCBI taxonomy databaseに無いが、以前の登録で同じ生物名を使用したことのある場合に選択します。

A novel species to be proposed in the paper 新種を報告する場合に選択します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 51

Category: デフォルトの入力欄

Scientific name 欄に学名を入力

参考 Organism qualifier に記載する生物名:種が同定されている場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#species

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 52

Category: Viruses/Phages 選択時の入力

Scientific name欄に、VirusまたはPhageの名を入力します(入力補完辞書がVirus/Phage用に切り替わります)

参考 Organism qualifier に記載する生物名:ウイルス http://www.ddbj.nig.ac.jp/sub/ref8-j.html#virus

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 53

Category: Environmental Samples 選択時の入力

Scientific name 欄に uncultured が自動記載されるので、それに続く名称を入力します。 たとえば、uncultured の直後に Bacillus sp.を入力します。 補助情報入力欄が出現、必要な場合に記

載をお願いします。自由記載が可能ですが、入力は必須ではありません。

参考 Organism qualifier に記載する生物名:環境サンプルhttp://www.ddbj.nig.ac.jp/sub/ref8-j.html#env

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 54

Category: Artificial construct 選択時の入力

Scientific name欄に、ベクター名や合成配列の名称を入力します (入力補完辞書が人工合成配列用に切り替わります)

参考 Organism qualifier に記載する生物名:人工的に構築した配列 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#syn

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 55

Category: A known species but unregistered in taxonomy database 選択時の入力

taxonomic lineageを入力してください(必須)

生物名をvalidであるものと報告している論文を入力してください(必須)

そのほかの情報が存在する場合に入力します

学名を入力します

参考 Organism qualifier に記載する生物名: database で見つからない場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 56

Category: Not found in taxonomy database, but already registered in other sequence data 選択時の入力

生物名をvalid nameとして報告している論文を入力してください(任意)

そのほかの情報が存在する場合に入力します

学名を入力します

参考 Organism qualifier に記載する生物名: database で見つからない場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#novel

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 57

Category: A novel species to be proposed in the paper 選択時の入力

そのほかの情報が存在する場合に入力します。

taxonomic lineageを入力してください(必須)。

論文で提唱する新種名(学名)を入力します。

論文が公開されるまでは、学名がvalid nameになってないため、暫定名で登録します。 暫定名の書式は、 Genus sp. ##-yyyy の通りです。##を登録者名のイニシャル、yyyはその時の年に置き換えます。

参考 Organism qualifier に記載する生物名:種が同定されていない、または、新種提唱の場合 http://www.ddbj.nig.ac.jp/sub/ref8-j.html#unidentified

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 58

annotation file の upload DDBJ 登録用 annotation file をご自身で作成できる方は、"6.Template"画面から annotation file のアップロードを行うことができます。

① other を選択しておきます。

② "Upload annotation file" をクリックします

③ annotation file を指定します

④ "Upload & Confirm" をクリックして annotation file のチェックを行います ⑤ Errorが出る場合、annotation

fileを修正し③④を繰り返します。クリック可能になればNextをクリックします。最終確認画面に遷移します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 59

Upload 可能な annotation file について

annotation file の作成方法に関する手引きに関しては、アノテーションファイル作成概説(http://www.ddbj.nig.ac.jp/sub/mss/annotation_file-j.html) をご覧ください。 annotation file には、アノテーション部のみ(次ページ参照)を含めてください。

EST, STS, TSA, HTC, GSS, HTG, WGS, CON (AGP) ファイルのuploadには対応していません。これらの登録については、大量登録システム(MSS) をご利用ください。 1. Contact person、2. Hold date、3. Submitter、4. Reference に記載された内容は、

COMMON情報として upload された annotation file の先頭に加えられます。 COMMON がannotation file内に記載されていた場合は、 1. Contact person、2. Hold date、

3. Submitter、4. Reference に記載された内容に置き換わります。 TPA 登録においては、PRIMARY_CONTIG を annotation file に含めないでください。

5. Sequence 中の Assembly Information の入力内容が自動的に変換され、annotation file の各エントリーに挿入されます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 60

COMMON SUBMITTER contact Hanako Mishima ab_name Mishima,H. ab_name Yamada,T. ab_name Park,C.S. ab_name Liu,G.Q. email [email protected] phone 81-55-981-6853 fax 81-55-981-6849 institute National Institute of Genetics department DNA Data Bank of Japan country Japan state Shizuoka city Mishima street Yata 1111 zip 411-8540

REFERENCE ab_name Mishima,H. ab_name Yamada,T. ab_name Park,C.S. ab_name Liu,G.Q. title Aquaporin genes year 2012 status Unpublished

DATE hold_date 20131130 ENT01 source 1..2878 organism Homo sapiens

isolate FA01 mol_type mRNA tissue_type liver

CDS 217..1104 gene AQP9 product aquaporin 9

codon_start 1

transl_tabe 1 polyA_site 2878

ENT02 source 1..1409 organism Shigella flexneri strain BM123 mol_type genomic DNA

CDS <1..1051 gene APQZ product aquaporin Z transl_table 11

codon_start 2

この部分は不要、annotation file に含まれていた場合は、 1. Contact person 2. Hold date 3. Submitter 4. Reference の入力内容に置き換わります。

Biological featureが記載さ

れたこの領域、つまり、各エントリーのアノテーションのみを upload してください

annotation file 例

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 61

エラーチェックに関する仕様

• annotation、sequenceの書式チェックには Parser が、CDSの翻訳チェックにはtransCheckerがそれぞれ実行されます。

• CDS featureが含まれない場合には、"Confirm"クリックで書式チェック(Parserチェック)のみが行われます。

• CDSが存在する場合、Confirmクリックでまず書式チェック(Parserチェック) が行われ、入力内容にエラーが

ある場合は書式エラーが表示されます。書式に問題がなければ、その直後にアミノ酸配列への翻訳エラーチェックが実行されます。つまり、書式エラーが解消されるまでは、翻訳チェックが行われません。

例えば、/lat_lon の書式に間違いがある場合は Confirmクリック後 /lat_lon のエラーのみが表示されます。/lat_lon を修正後、再度Confirmをクリックし、翻訳エラーがある場合はその結果が表示されます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 62

/lat_lon 修正、Confirmをクリック

翻訳エラーが表示される

Upload & Confirmクリック後の画面 Errorが無い場合

アノテーションのチェックが行われた後、画面下にアノテーションファイルが表示されます。 COMMONの領域は、1.Contact person~4.Referenceページで入力した内容に置き換えられます。

エラーが無い場合は"Next"がクリック可能になります。 Warningがある場合でも、"Next"がクリッ

ク可能になりますが、必要に応じて修正を行ってください。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 63

Upload & Confirmクリック後の画面 Error/Warningが生じた場合

画面下部にDDBJ登録形式のannotation fileが表示されます。 エラー対象はハイライトされます。

Error/Warning内容が表示されます。

Line番号のクリックで画面下のError対象行にジャンプします。

クリックするとErrorの説明ページが開きます。

Errorがなくなると"Next"がクリック可能になります。 Warningが生じた場合でも入力内容に問題がなければ、"Next"をクリックしてください。

修正したannotation fileを指定し、"Upload & Confirm" を繰り返します。 Errorがなくなるまで繰り返します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 64

Confirmクリック後の画面 error無しの場合

annotation 入力画面の下側にDDBJ登録形式のアノテーションファイルが表示されます。

チェック後、次のステップに進める場合は、Nextがクリック可能になります。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 65

"Confirm"クリック後の画面 errorが生じる場合

エラーが生じる場合は、Next ボタンをクリックできません ① エラー内容が表

示されます

② アイコンをク

リックすると、エラーの説明ページが開きます(それぞれ日本語と英語ページ)

③ エラーが生じている行番号をクリックすると、画面下部に表示されるDDBJアノテーションファイル形式の該当行にジャンプします。

④ エラー対象行がハイライト表示されます。どのentry のどの feature、qualifier がエラーになっているかを確認します。

⑤ エラー箇所の修正を行う場合

は画面をスクロールアップし、エラーが生じたエントリーの"Edit"アイコンをクリックするなどの編集操作により、修正を行ってください。 エラー修正後、再度"Confirm"をクリックしてください。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 66

Confirmクリック後の画面 warningが生じる場合

Warningは、Errorと断定ができないが、注意を促すための警告としての意味で表示されます Warning の場合には Nextがクリック可能になりますが、入力内容に問題がないかどうかを確認してください

この例では、submitterの名前の書式に関するwarningが出ていますが、submitter 名に間違いがないならば warning を無視してかまいません。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 67

SubmitterまたはReference内にerrorがある場合

① プログレスバーの"3. Submitter"または"4.Reference" をクリックすると各入力ページにジャンプします ② 修正後、必ず"Next"ボタンをクリックします

Submitter、Reference に関するerrorやwarningに対して修正を行う場合にはプログレスバーから"3.Submitter"、"4.Reference"画面に戻って修正を行うことになります。 ① 画面上部のプログレスバーにある"3.Submitter"または"4.Reference"をクリックする ② "3.Submitter"もしくは"4.Refernece"入力画面上で修正し、必ず"Next"をクリックする(Nextをクリックしないと修正した内容が反映されません) ③ 画面上部のプログレスバーから、"7.Annotation" をクリックするとannotation入力画面に戻ることができる

③ 修正後、"7.Annotation" をク

リックするとアノテーション画面に戻ります

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 68

Error/Warning説明ページへのリンク

Error/Warningの説明は以下のURLでご覧いただけます。 http://www.ddbj.nig.ac.jp/sub/validator-j.html

CDSのアミノ酸翻訳に関するエラー説明は以下のURLからご覧ください。 transChecker エラーメッセージ http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC (次ページ参照)

以下のリンクもご参照ください • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 69

CDSフィーチャーにおける翻訳エラーと説明ページへのリンク

Message Link [WARNING] 'codon_start' qualifier should be selected. The value is automatically set 1. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC22 [WARNING] 'transl_table' qualifier should be selected. The value is automatically set 1. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC23 [WARNING] Amino acid of 'transl_except' qualifier [#Value] is not [Met]. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC24 [WARNING] [#Value] codons are not translatable. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC25 [ERROR] Untranslatable codon [#Codon] is found in the sequence range. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC18 [ERROR] First codon [#Codon] is not a start codon. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC19 [ERROR] Final codon [#Codon] is not a stop codon. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC20 [ERROR] Stop codon '*' is found in the range. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC21 [ERROR] Description of Location [#location of CDS feature] is illegal. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC04 [ERROR] 'codon_start' qualifier is duplicated. The value is automatically set 1. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC05 [ERROR] 'codon_start' qualifier has invalid value [#Value]. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC06 [ERROR] 'transl_table' qualifier is duplicated. The value is automatically set 1. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC07 [ERROR] 'transl_table' qualifier has invalid value [#Value]. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC08 [ERROR] Amino acid abbreviation [#abbreviation] in 'transl_except' qualifier is illegal. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC09 [ERROR] 'transl_except' qualifier has invalid value [#Value]. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC10 [ERROR] Location of 'transl_except' qualifier [#Value] is overlapped. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC11 [ERROR] Location of 'transl_except' qualifier [#Value] is invalid. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC12 [ERROR] Base range of 'transl_except' qualifier [#Value] is mismatched in reading frame. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC13 [ERROR] Amino acid of 'transl_except' qualifier [#Value] is not changed from conceptual translation. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC14 [ERROR] Amino acid of 'transl_except' qualifier [#Value] is not [TERM]. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC15 [ERROR] Stop codon is specified by 'transl_except' qualifier [#Value] in mid of CDS location. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC16 [ERROR] Entry [#Entry name] is NOT found in sequence entries. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC17 [FATAL] Proper 'Codon Table' is not found in 'src' folder. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC01

[FATAL] Proper 'Amino Table' is not found in 'src' folder. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC02

[FATAL] Unable to execute Translation. http://www.ddbj.nig.ac.jp/sub/validator-j.html#TC03

翻訳エラーの内容により、リンク先の記載内容に基づき修正してください

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 70

入力例1 16S rRNAアノテーションの入力例

6.Templateにて"16S rRNA sequence"を選択した場合

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 71

例 16S rRNAアノテーションの入力

② Editアイコンをクリックします。

rRNA featureのlocation、プロダクト名が初期値として記載されます。

必須feature、推奨qualifierが初期値として選択されています。

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法

① クリックして、必要なqualifierを追加しておきます。

追加情報がある場合にダブルクリックすれば、テキストでの自由記載が可能です。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 72

Qualifierを追加するにはSelect Qualifierアイコンをクリック

追加したいqualifier横のチェックボックスにチェックを加えて、 Save をクリックすると、qualifierを追加できます。 qualifierを消す場合は、チェックを外します。値が入力されたqualifierの消去を行う場合"確認ダイアログ"が出現しますので、"OK"をクリックすると消去できます。 アノテーションに必須なqualifierは消去不可能です。

templateの種類により、選択可能なqualifierは異なります。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 73

"Edit"クリック時の編集画面

生物名を学名で入力します(参考: 補足資料「生物名の入力に

ついて」、「生物名入力におけるカテゴリーの選択について」)

strain および、採取情報を入力します 該当情報がない場合は、空欄にします。

rRNAのlocationが配列全長として

自動的に設定されます。必要に応じて修正します。

16S rRNAのテンプレート選択しているの

で、プロダクト名は初めから入力済みになっており修正不可能です。

入力後、Saveをクリックします

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 74

1件目入力完了時

2件名以降も、1件目と同様にEditアイ

コンをクリックして入力を行い、アノテーション入力を完了させてください。

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法

値が空欄のqualifierは、DDBJに送信されるアノテーションファイル中に出力されません。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 75

annotation入力後"Confirm"をクリックしてチェックを行う

annotation入力後、Confirmをク

リックします。入力した内容の書式チェックが行われます

チェック後、次のステップに進める場合のみ、"Next"がクリック可能になります。チェックでErrorが生じる場合はクリックできません

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

参考: 補足資料「エラーチェックに関する仕様」

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 76

入力例2 ミトコンドリアCOI配列の入力画面例

6.Templateにて"single protein-coding sequence

(CDS), organelle" を選択した場合の画面例

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 77

この例では /isolate, /collection_date, /lat_lon, /dev_stage を選択しています。

⇒下表に続く

⇒上表からの続き

Link: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

テクニック2 Edit Column を利用すれば、エクセルなどで作成したリストからのpasteが可能 補足資料「Edit Columnをクリックした場合」

テクニック1 編集アイコンから copy 機能 を利用すれば、同じ値のcopyが可能 補足資料「Qualifierの編集アイコンをクリックした場合」

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 78

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 79

入力例3 ミトコンドリアゲノム部分配列のannotation入力例

6.Templateにて other を選択した場合

このページで入力を中断・再開するにはブラウザでブックマークするか、ページのURLを保存してください。ブラウザーを閉じた後でもブックマークしたURLを用いて、再開することが可能です。

③ Editをクリックして source feature への入力を行います。

① "Select Qualifier"で、qualifierを追加します。 この例では、 country isolate organelle を追加しました。

参考: • Feature key の定義 • Qualifier key の定義 • Organism qualifier に記載する生物名 • CDS feature について • Location の記述法

② このsourceで追加したqualifierを、以降のすべてのエントリーのsourceフィーチャーにもコピーしたい場合には、このアイコンをクリックします。なお、qualifierの値はコピーされません。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 80

④ ここをクリックし、追加したいfeatureをリストから選択すると追加されます

⑤ feature配下に追加すべきqualifierがある場合に"Select Qualifier"をクリックします

Editクリック時 生物名を学名で入力します(参考: 補足資料「生物名の入力に

ついて」、「生物名入力におけるカテゴリーの選択について」)

入力後、Saveをクリック

各情報を入力します genetic code には生物名入力時に整数値

が自動入力されることを確認、空欄であれば手動でgenetic code(整数値)を入力

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 81

⑥ 追加したfeature の locationを修正し

ます。クリックすると入力ウインドウが現れるので、値を入力します。

⑧ 続いて、次のfeatureを追加します。

⑦ qualifier値を編集します。 qualifierをクリックすると入力ウインドウが現れるので、値を入力します。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 82

⑨ 同様に、qualifierを選択してから、値を入力します。この操作をfeatureの数だけ繰り返します。

featureやqualifierを追加後、"Edit"クリックによりエントリー単位で編集することも可能です。

入力後、Confirm をクリックします。 入力したアノテーションの書式チェックが行われます。

2014年6月12日 第29回 DDBJing 講習会 (DDBJ) 83