manual - cau.edu.cnbioinfo.cau.edu.cn/agrigo/download/manual.pdfthe manual ? e right side nge depend...

19
User Manual Zhou Du ([email protected]) Version 1.0 1. What is agriGO? The agriGO is designed to automate the job for experimental biologists to identify enriched Gene Ontology (GO) terms in a list of microarray probe sets or gene identifiers (with or without expression information) and it is also a GOrelated database. The agriGO specially focus on agricultural species. 2. Why use agriGO? The agriGO provides heavy support to agricultural species. Not only limited to SEA analysis, GSEA which is achieved using PAGE method is also available. Furthermore we have BLAST4ID tool for ID transfer or annotation. And search as well as download function is accessible. The agriGO can give out rich outputs like graphical result, bar chart result and hierical tree which composing a comprehensive understanding of biological meaning of user's input data. 3. What data argiGO contains? We currently support on 35 species including 280 datatypes. Please check the data statistics page for detail information. We will continue adding more species and datatypes. 4. How agriGO prepare its data? Raw GO annotation data is generated using BLAST, Pfam, InterproScan by agriGO or obtained from B2GFAR center or from Gene Ontology. Arabidopsis genome data is from TAIR. Rice TIGR genome data is from Rice Genome Annotation Project. Rice KOME data is from KOME database. Rice Gramene data is from Gramene center. Populus genome data is collected from JGI. Soybean and Sorghum genome data is compiled from phytozome. Grape genome data is compiled from Genoscope. Medicago genome data is from Medicago truncatula sequencing resources. Maize genome data is from MaizeSequence.org. Castor bean genome data is from Castor Bean Genome Database. Brachypodium distachyon genome data is from Ensembl. Bovien genome data is from Bovine Genome Database. Silkworm genome data is from SilkDB. M. grisea genome data is from Magnaporthe grisea Database. affymetrixmetrix CSV files and array sequences are from NetAffx.

Upload: others

Post on 07-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

User Manual Zhou Du ([email protected]

Version 1.0 

 

 

1. What is agriGO? 

The agriGO is designed to automate the job for experimental biologists to identify enriched Gene 

Ontology  (GO)  terms  in  a  list  of microarray  probe  sets  or  gene  identifiers  (with  or  without 

expression  information)  and  it  is  also  a  GO‐related  database.  The  agriGO  specially  focus  on 

agricultural species. 

 

2. Why use agriGO? 

The agriGO provides heavy support to agricultural species. Not only limited to SEA analysis, GSEA 

which  is achieved using PAGE method  is also available. Furthermore we have BLAST4ID tool for 

ID transfer or annotation. And search as well as download function is accessible. The agriGO can 

give out rich outputs  like graphical result, bar chart result and hierical tree which composing a 

comprehensive understanding of biological meaning of user's input data. 

 

3. What data argiGO contains? 

We currently support on 35 species including 280 datatypes. Please check the data statistics page 

for detail information. We will continue adding more species and datatypes. 

 

4. How agriGO prepare its data? 

Raw GO annotation data  is generated using BLAST, Pfam,  InterproScan by agriGO or obtained 

from B2G‐FAR center or from Gene Ontology. Arabidopsis genome data  is from TAIR. Rice TIGR 

genome data is from Rice Genome Annotation Project. Rice KOME data is from KOME database. 

Rice Gramene data is from Gramene center. Populus genome data is collected from JGI. Soybean 

and Sorghum genome data  is compiled from phytozome. Grape genome data  is compiled from 

Genoscope. Medicago genome data  is  from Medicago  truncatula  sequencing  resources. Maize 

genome data is from MaizeSequence.org. Castor bean genome data is from Castor Bean Genome 

Database. Brachypodium distachyon genome data is from Ensembl. Bovien genome data is from 

Bovine Genome Database. Silkworm genome data is from SilkDB. M. grisea genome data is from 

Magnaporthe grisea Database. affymetrixmetrix CSV files and array sequences are from NetAffx. 

      

Page 2: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

5.  Qui1. You 

anno

chos

page

 2. Afte

subm

may

your

be d

 3. The 

flexi

And 

     

How to u

ck introducChoose toolshould  cho

otation  text 

se. You can m

e. 

Submit yourer submitting 

mitted succes

y close the wa

r jobs will be 

deleted. If you

Explore resuagriGO  prov

ble but you 

detailed intr

se tools p

ction to anal and set paroose  one  too

are  interacti

make the hel

r job and peyour job, the

ssfully, a job 

aiting page an

stored on ou

u want elong

ults vides  differe

may need so

roduction to t

provided b

alysis procerameters ol  to  go  for

ive.  The  cont

p frames sho

rform analyse agriGO will 

ID will be giv

nd use the jo

ur server for T

ation contact

nt  ways  to 

ome specific s

these tools in

by agriGO

edure 

rward.  At  th

tent will  cha

ow or hidden

sis pre‐check th

ven. Since th

ob ID to check

THREE DAYS.

t me. 

browse  resu

setting to ma

n the manual 

he  right  side

ange  depend

n by using HE

e validity of y

he analysis pr

k the work lat

. After 3 days

lts  of  differe

ake them to 

in the follow

e,  several  fr

ing  on  exact

ELP buttons a

your upload d

rocess could 

ter. Please no

s all informat

 

ent  tools.  So

castor to you

wing will help 

rames  conta

t  parameters

at top‐right o

data. If your j

take a while

ote that resu

tion of the job

ome  of  them

ur own dema

you to achiev

ining 

s  you 

of the 

 

job is 

, you 

lts of 

b will 

m  are 

ands. 

ve it. 

Page 3: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

A. SEA 

only

afte

STEPTo u

nam

prov

chec

suita

ensu

 

If yo

can 

OK, 

step

man

 

 

How to useis a tradition

y needs to pr

r statistical te

P 1: use SEA analy

mes with GO 

vide a list of s

ck all allowed

able  to be an

ure they are a

ou choose cus

use any IDs y

theoretically

ps.  Neverthel

nual. 

e Singular Enal and wide

repare a  list o

est from pre‐

ysis, you sho

accession.  If

sequence ide

d ID types of 

nalysis  in  this

allowed IDs. 

stomized mo

you have, but

y you can  jus

less,  if  you  w

Enrichment ly used meth

of gene/prob

‐calculated ba

uld firstly se

f you  choose

ntifiers. It sh

correspondi

s  type mode

de, you are n

t only be noti

t click “Subm

want  set mo

Analysis (Shod.  It  is simp

be names, an

ackground or

lect the type

 using  suppo

ould be note

ng species, t

e. And you ca

no long limite

ced IDs shou

mit” to perfor

ore  advanced

SEA) analysiple to use an

nd enrichmen

r customized 

e of your que

orted  species

ed that you w

hen submit y

an mix your 

ed by agriGO‐

ld attach wit

rm analysis n

d  parameters

is? nd simple to 

nt GO terms 

one. 

ery  list, eithe

s  in agriGO, y

would better s

your IDs. Onl

IDs  from diff

‐owned speci

h GO accessi

now and sim

s,  then  keep

understand. 

will be found

r single nam

you only nee

select species

y allowed ID

ferent  types.

ies any more

on!   

ply skip  follo

p  on  reading

User 

d out 

es or 

ed  to 

s and 

s are 

.  Just 

 

. You 

 owing 

g  this 

Page 4: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

STEPNow

cust

The 

poss

back

need

In  th

cust

selec

Also

price

You 

 

 

P 2: w  you  can  se

omized refer

default  para

sible  the  ba

kgrounds from

d, otherwise 

he  case  that 

omized refer

cted above fo

o  you  can use

e is to attach 

can paste dir

et  the  backg

rence and cus

ameter  is  us

ackground  ty

m neighbored

use customiz

you do not 

rence instead

or query list. 

e  any  IDs  if 

with GO acc

rect or upload

ground  or  re

stomized ann

ing  suggeste

ypes.  To  tho

d organisms a

zed reference

want  any of

d. NOTE: IDs i

you  choose 

ession to obt

d your file, fo

eference.  The

notated refer

d  backgroun

ose  species 

are suggeste

e. 

f  suggested p

in reference 

customized 

tain such free

or latter, plea

ere  three  ty

ence. 

nds.  For  each

without  a 

d. Users can 

pre‐computa

list should fr

annotated  re

edom. ☺ 

ase make sure

ypes:  suggest

h  species,  ag

relatively  co

select based 

ted backgrou

om the same

eference mo

e the file no b

ted  backgrou

griGO will  giv

ompleted  pr

on their prac

und,  you  can

e species that

de, however

bigger than 4

unds, 

ve  all 

ofile, 

ctical 

 n use 

t one 

 

r,  the 

 MB. 

Page 5: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

STEPThe 

need

hype

Whe

of  re

refe

list h

Next

avai

(FDR

you 

sign

and 

Min

the 

mor

Gen

subs

Last,

with

very

Gree

from

then

In th

 

 

 

 

 

 

P 3: advanced op

d to one click

ergeometric, 

en the input/

eference  list,

rence list nu

has few or no

t you can ch

lable  here,  i

R), Hommel, 

truly  can  tu

ificant level b

emphasized 

imum numbe

selected num

e entries nee

e  ontology  t

set of the ter

,  if you prov

h  the  link  to 

y fast. 

eting! You ca

m the right he

n contact me 

he following w

ptions are op

k to make th

chi‐square a

/query list is c

,  choose hyp

mber are qu

o intersection

oose method

ncluding:  Ye

Holm, False 

urn  off  it  and

below higher

in analysis re

er of mappin

mber of entr

eded to make

type:  Plant  G

ms in the wh

vide a mail ad

the  results. P

an now click s

elp frames, a

directly. 

we will discus

ptional but q

em visible. In

nd fisher test

compared wi

pergeometric

ite small, you

ns with the re

d  to do  the 

kutieli  (FDR 

Discovery Ra

d  use  no  ad

r. Terms unde

esults, and it w

g entries me

ries will not b

e one GO term

GO  slim  is  a 

ole GO for pl

ddress, a not

Providing a e

submit to pe

and a detaile

ss the output

uite  importa

n SEA analysi

t.   

ith the previo

c or  fisher. W

u may better

eference list, 

multi‐test ad

under  depen

ate. Though 

just. While  y

er the cutoff 

will affect yo

eans that GO 

be  shown.  In

m appear in t

cut‐down  ve

ant. 

tification wil

email addres

rform the an

d tutorial  in 

ts of the SEA 

nt. These op

s, there are t

ously comput

When both of

r choose fishe

the Chi‐squa

djustment. Se

ndency),  Bon

I would sugg

you  choose 

of the signif

ur test outpu

annotations 

n other word

the analysis re

ersion  of  the

l be  send wh

s  is optional

nalysis. You c

this manual,

analysis. 

ptions are de

three statisti

ted backgrou

f  your query

er test. When

re tests are m

even adjustm

nferroni,  Hoc

gest perform

no  adjust,  th

ficant level w

ut. 

that do not 

d, higher you

esult. 

e  GO  ontolo

hen  the anal

to SEA analy

an always ge

  if you still h

fault hidden,

cal test meth

und, or is a su

y  list number

n the input/q

more appropr

ment method

chberg,  Hoch

 adjustment 

hen  you may

will be highligh

appear in at 

  set  the num

gies  containi

ysis  is  comp

ysis, because

et interactive 

have any que

, and 

hods: 

ubset 

r  and 

query 

riate. 

s are 

hberg 

test, 

y  set 

hted, 

least 

mber, 

ing  a 

leted 

e  it  is 

 help 

stion 

Page 6: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

SingPartA br

entit

dow

 

PartIn  th

gene

mole

favo

form

insta

that

 

Click

pres

cont

Thes

spec

colo

p‐va

desc

quer

the u

To b

If  us

click

gular Enricht 1: rief summary

ties  in  the q

wnload. 

t 2: his  part,  you

erated  as  sep

ecular  functi

orite output fo

mat  you  pref

ance the dire

 user can set 

k the ‘genera

sented  accor

taining all sta

se nodes  in t

cific colors. Th

r is darker an

alue). Inside t

cription, item

ry  list and ba

user, only GO

better unders

ser  chooses 

king those blo

hment Anal

y of your job 

uery  list  tha

u  can  brows

parate  graph

on and  cellu

ormat, graph

ferred.  The  r

ection  in the 

smaller size 

ate  image’ bo

rding  to  you

atistically sign

the  image are

he smaller of

nd redder (No

the box of th

m number ma

ackground. B

O information

stand the gra

PNG  or  JPG 

ocks. 

ysis (SEA) R

will be given

t  can be  ann

e  the  hierat

hs  for each o

lar  compone

h rank directio

rank  directio

example  ima

if there are m

ottom after y

ur  own  sett

nificant terms

e classified  in

f the term’s q

ote: q‐value h

e significant 

pping the GO

ut when thos

n will be given

aphical result

or  GIF  resu

Results 

. The job ID i

notated by G

ical  graph  re

of  the  three 

ent. After  sel

on and font s

n  is  used  to

age  is  ‘top to

many nodes i

you set all pa

ings.  The  gr

s.   

nto ten  levels

q‐value, the m

here means t

terms, the in

O in the query

se term who

n in the box. 

t, investigatio

lt  format,  lin

is useful with

GO  associated

 

esult.  Note  t

GO  categorie

ect  the  cate

size. The resu

o  define  the 

o bottom’. An

n their result

rameters we

raphical  resu

s which are a

more significa

that the value

nformation in

y list and bac

ose q‐value  is

 

on of the ann

nkage  to  the

hin 3 days. A 

d with descr

that  the  gra

es, namely b

gory, uses  ca

ult format me

direction  in 

nd the font s

t. 

ell. The graph

ult  is  a  GO 

associated wi

ant statistical

e of the mult

ncludes: GO t

ckground, and

s higher than 

notation diag

e  term’s  deta

file containin

riptions  is  ab

phical  result

biological pro

an  specified 

eans which ou

your  output

ize  is self‐evi

hical result w

hieratical  im

ith correspon

ly, and the no

tiple‐test adju

term, q‐value

d total numb

the cutoff se

ram is sugge

ail  is  availab

ng all 

ble  to 

  was 

ocess, 

their 

utput 

t,  for 

ident 

 

will be 

mage 

nding 

ode’s 

usted 

e, GO 

ber of 

et by 

sted. 

le  by 

Page 7: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

 

PartThe 

sign

GO 

shou

setti

your

try s

 

Here

and 

selec

sugg

ther

vert

taste

The 

bord

infor

brow

dow

t 3: terms  select

ificant terms 

terms  are  re

uld  specified 

ing  to obtain

r cookie and 

several times 

e the bar cha

300  for X  le

ct  one  you 

gested, 3.  If y

re are too ma

ical, and 315

e but seems s

bar  chart  is 

ders to resize

rmation. A  ‘S

wser, and  if y

wnload this im

ted  here  are

of secondary

elatively  gene

their  param

n  favorite vie

these setting

and make yo

art  is using gl

egend  rotatio

like,  2.  Use 

you prefer G

any words, 4.

5 means 45 d

somehow str

created bas

e and adjust t

Save  as  Imag

you can also 

mage. 

e  children  te

y level terms

eral descripti

meters  before

ew of  the cha

gs will be de

our last attem

lass bar style

on. Here are 

HEX  format 

O annotation

. 270 to 315 

egree slope, 

range to me ☺

ed on  scripts

the image siz

ge’  bottom  i

use your  ‘Pr

rms  of  root 

. Thus, the ba

ion.  Similar  t

e  create  the

art bar. Note

fault ones  in

mpt as your o

e, default col

some  tips: 1

to  define  c

n as X  legend

is suggested 

and you can

☺. 

s  from Open

ze and ratio. 

s  existed  but

int Screen’ b

one  (or  call

ar chart gives

to  the proce

GO  abundan

e  the  setting 

 your future 

wn features.

ors, GO anno

1. Have a gla

olors  and  th

d content, yo

for X legend 

n try other nu

 Flash Chart

And bars are

t only  usefu

bottom on yo

ed  secondar

s user a brief 

dure of  grap

nce  chart. Us

you used w

jobs.  In othe

otation as X  l

ance of all  fo

here  is  a  we

ou may use s

rotation, in 

umber which

.  It  is power

e accessible t

l when  you 

our keyboard 

ry  level  term

f portray since

phical  result, 

ser  can  try  t

ill be  recorde

er word, you

legend, 14px

our bar  styles

ebsite  we  alr

smaller  font 

which 270 m

h may satisfy 

ful. You  can 

to term’s det

are using  Fir

or other too

 

ms)  or 

e the 

user 

these 

ed  in 

 may 

 

x font 

s and 

ready 

once 

means 

your 

drag 

tailed 

reFox 

ols to 

Page 8: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

 

PartIn th

table

or ca

User

para

be s

men

crea

Click

 

You 

that

draw

shou

and 

t 4: his part, deta

e. And you ca

an browse all

r  can  select 

ameters used

set or change

ntioned in par

ated here to r

k the checkbo

can click the

 can make al

wing graphica

uld be  includ

meaningless

iled informat

an browse th

l GO terms in

terms  to  d

d  in graph or 

ed when you

rt 2 and 3. W

redo the part

ox left to ‘GO

e GO name to

l significant s

al  results or 

ed  in graph 

. Click on the

tion is given. 

he GO terms 

n the similar t

draw  graphic

chart genera

u generate gr

While it will ma

 2 or 3 work o

 term’ can se

o collapse/ext

selected or n

to create ba

generation, o

e number will

All GO signif

using tree tr

type table, or

cal  result  or 

ating  is fetch

raphical  resu

ake you a bit 

once more to

elect all GO te

tend ontolog

ot is availabl

ar chart. Plea

otherwise th

 lead you to t

ficant terms w

raversing mo

r just the data

create  bar 

hed from you

lts or GO ab

trouble if yo

o change the 

erms at one t

gy terms in tr

e and those 

ase note  that

e graphical r

term’s detail 

will presente

de (we will d

a. 

chart.  Pleas

r cookie, and

bundant chart

u would like 

settings. 

time. 

ee traversing

selected term

t at  least one

result will be

information.

d in the follo

discussed it la

se  note  that

d your cookie

t which has 

adjust the im

g mode. A bo

ms can be us

e  significant 

 some kind b

 

owing 

ater), 

t  the 

e will 

been 

mages 

 

ottom 

ed in 

term 

blank 

Page 9: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

 

The 

term

desc

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

term’s detai

m besides a b

cription. 

il page  is as  f

rief summary

following. Th

y. And for eac

he agriGO wi

ch entry the a

ll give all ent

annotation in

tries can be 

ncludes: GO t

 

annotated  to

terms, GO so

o the 

urce, 

 

Page 10: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

B. PAG

stati

acco

 

STEPFirst

your

not 

the o

 STEPIn PA

imag

are n

pref

data

In ag

seco

Third

quic

dow

 

 

 

How to useE method is 

istics,  this m

ount, and can

P 1: tly, you shou

r  input shoul

stored  in agr

other is to us

P 2: AGE analysis,

ge, as least tw

numerical va

ferred) of the

a, then SEA m

griGO’s exam

ond row is ex

d row is expr

ck example fo

wnload the ful

e Parametriargued by Kim

method  is  sim

n deal with a l

ld choose th

d be one of 

riGO, there  is

se our BLAST4

, user should 

wo rows mus

lue. The num

e identifiers' e

may be the alt

mple, there ar

pression fold

ression FC of 

or the fast loa

ll example file

ic Analysis om [BMC Bioin

mple  and  effi

long list of ge

e species  for

datatypes  in

s another tw

4ID service.

pay more att

t be provided

merical value i

expression un

ternative cho

e 3 rows in th

 change (FC) 

cold/CK after

ad of the HTM

e and explore

of Gene Setnformatics 20

icient.  Differe

enes/probese

r your query 

nside the righ

wo ways: one

tention to inp

d. The first ro

is fold change

nder different

ice.   

his example. 

value of cold

r 24 hour cold

ML page. To o

e the followin

t Enrichmen005, 6:144]. U

ent  to  SEA, 

ets. 

data. Please

ht  informatio

  is provided 

put data. As p

ow is sequenc

e (FC) or log2

t condition. If

First row is A

d treatment t

d treatment. 

obtain a full v

ng analysis pr

nt (PAGE)? Using Central

it  takes  expr

e make sure t

n table.  If yo

your own GO

presented in 

ce identifiers,

2‐transformed

f you do not 

ATH1 probese

o CK(cold/CK

Only 600 pro

iew of PAGE 

rocedure. 

 Limit Theore

ression  level

that  identifie

our  identifier

O annotation

the following

, and followin

d FC value (la

have express

et name, the 

K) after half h

obesets are in

method, you

em in 

  into 

ers  in 

s are 

n  file, 

 

ngs 

atter 

sion 

our. 

n the 

u can 

 

Page 11: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

STEPNext

avai

(FDR

you 

sign

and 

Min

the 

mor

Gen

subs

If  yo

acce

OK, 

the f

 

 

 

 

 

 

 

 

 

 

 

P 3: t you can ch

lable  here,  i

R), Hommel, 

truly  can  tu

ificant level b

emphasized 

imum numbe

selected num

e entries nee

e  ontology  t

set of the ter

ou  can  also u

epted directly

now you can

following par

oose method

ncluding:  Ye

Holm, False 

urn  off  it  and

below higher

in analysis re

er of mappin

mber of entr

eded to make

type:  Plant  G

ms in the wh

upload  your 

y by agriGO. T

n click submit

rt of manual. 

d  to do  the 

kutieli  (FDR 

Discovery Ra

d  use  no  ad

r. Terms unde

esults, and it w

g entries me

ries will not b

e one GO term

GO  slim  is  a 

ole GO for pl

own  custom

The file’s size

t to start ana

multi‐test ad

under  depen

ate. Though 

just. While  y

er the cutoff 

will affect yo

eans that GO 

be  shown.  In

m appear in t

cut‐down  ve

ant. 

mized GO  ann

e is limited to 

lysis now. Yo

djustment. Se

ndency),  Bon

I would sugg

you  choose 

of the signif

ur test outpu

annotations 

n other word

the analysis re

ersion  of  the

notation  file 

4MB. 

ou may explor

even adjustm

nferroni,  Hoc

gest perform

no  adjust,  th

ficant level w

ut. 

that do not 

d, higher you

esult. 

e  GO  ontolo

once  your  id

re output of 

ment method

chberg,  Hoch

 adjustment 

hen  you may

will be highligh

appear in at 

  set  the num

gies  containi

dentifiers  are

analysis resu

s are 

hberg 

test, 

y  set 

hted, 

least 

mber, 

ing  a 

e not 

 

lts in 

Page 12: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

ParaResu

to b

expl

calcu

liste

 

The 

colo

used

regu

term

 

The 

simp

 

In g

selec

diffe

ametric Anults generate

rowse SEA re

ained. Since 

ulated, each 

d in the brief

number of t

rful model n

d  in graphica

ulated. And  e

m(s) to genera

term’s detai

ple because it

raphical  resu

cted,  a  third

erent regulati

alysis of Ged by PAGE an

esult  introdu

PAGE tool ca

row has its s

f summary pa

terms  is dete

named CM  fo

al  result  in w

each block p

ate further im

iled  informat

t is quite pos

ult part, user

  color  system

ion direction 

ene Set Enrinalysis have m

uction part  fir

an analysis se

ignificant GO

art. 

ermined by th

or short  is av

which  red  col

resent  the  t

mages. 

tion  is  gener

sible that the

 can choose 

m  (purple  co

in two rows.

ichment (PAmany similar 

rstly. And on

everal rows a

O terms. Num

 

he row you s

ailable. The 

or  system m

erm’s  Z‐scor

rated  if  you  c

ere are too m

one or  two 

olors) will be 

   

AGE) Resultpoints to SEA

ly unique  fea

at one time, 

mber of signifi

selected whic

color used  in

means up  reg

e  for  the  row

click  the num

many entries m

rows  to draw

used  in dem

t A analysis, th

atures to PAG

and terms in

cant GO term

ch  is colored

n the CM  is s

ulated and b

w.  You  can  s

mber. This pa

mapping to th

w  the  image

monstrating  t

hus it is sugge

GE results w

n each row w

ms for each ro

 by red. A si

same to the 

blue means d

select  row(s)

age may be 

he GO. 

e.  If  two  row

those  terms 

ested 

ill be 

will be 

ow is 

mple 

color 

down 

)  and 

 

a bit 

 

s are 

have 

Page 13: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

 

The 

belo

dow

if  th

‘r1=

 

In ba

mea

whic

user

As m

diffe

following ex

ow  the  result

wn regulated a

he  term has  s

1e‐10’ means

ar chart gene

an  of  the  val

ch presents t

r can set two 

mentioned be

erent colors w

xample prese

t.  There  are 

and purple p

same  regulat

s the q‐value

eration part, Z

ue  of  all  ent

the change o

color values 

efore, Z‐score

which set by u

nts two rows

three  color 

resents the t

ted direction

 of the term 

Z‐score is the

tries  in  the  r

f expression 

for up‐regula

e which  is bi

user. 

s  in one grap

systems:  red

erm is regula

  in both  row

in row1 is 1e

e statistical va

row. Mean  c

when compa

ation terms a

igger  than 0 

ph. You can c

d means  up 

ated in differe

ws,  it will hav

‐10, and ‘zs’ 

alue in PAGE 

change  is me

aring to the w

nd down‐reg

or smaller  th

 

check the an

regulated  te

ent direction 

ve double bo

presents Z‐sc

calculation, 

ean minus  st

whole row b

gulation term

 

han 0 will be

 

notation diag

erms,  blue m

 in tow rows.

orders.  In  the

core. 

mean value i

tandard  devi

ackground. W

ms. 

e presented u

gram 

means 

. And 

e box 

 

s the 

ation 

While 

using 

Page 14: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

But 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

if you choosee mean valuee, they are in tthe same color since all mmean is bigger

 

r than 0. 

Page 15: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

C. The 

Tran

anno

To u

shou

Gen

The 

notif

 

The 

 

Dow

 

 

 

 

 

 

 

 

 

 

 

How to useBLAST4ID too

nsfer  your  ID

otate your se

use BLAST4ID

uld  be  corre

erally speaki

process  ma

fication. 

result interfa

wnloadable te

e BLAST4ID ol is not an a

Ds which  are 

equences with

D, user should

ctly  selected

ng, all array s

y  take  a  lon

ace is a bit sim

ext result: 

tool? nalysis tool, 

not  availabl

h GO. 

d set target d

d  based  on  s

sequences ar

ng  while  thu

mple☺, but e

but an associ

le  to  agriGO 

database at f

sequence  typ

re nucleotide

us  the  E‐mai

enough for us

iated one use

to  available

first, and the

pes  of  user’s

 and other ge

l  address  sh

sage.   

ed mainly for

e  ones,  2.  us

n E‐value cut

s  input  and 

enome seque

hould  be  giv

 

r two purpose

e  blast  searc

toff. The prog

target  datab

ences are pro

en  for  the  E

es: 1. 

ch  to 

gram 

base. 

otein. 

Email 

 

Page 16: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

D. Sear

1. U

2. Th

3. In

4. Yo

5. In

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

How to userch tools in ag

nless you con

here is a shor

n advance sea

ou can either

nput IDs are c

e search toogriGO are eas

ntact me and

rt‐cut at top‐r

arch, you hav

r search single

case insensitiv

ol? sy to underst

 ask for elong

right corner f

ve to define th

e one or a list

ve, but will be

tand and use.

gation, the jo

for job search

he species fir

t (no more th

e agriGO's fo

. Here are som

ob ID is availa

hing. 

rstly. 

han 100) of se

rmat in the o

me tips: 

able within 3 

equence iden

output. 

 

days. 

ntifiers. 

Page 17: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

6. FAQ  

What is agriGO? 

The  agriGO  is  designed  to  automate  the  job  for  experimental  biologists  to  identify 

enriched  Gene  Ontology  (GO)  terms  in  a  list  of  microarray  probe  sets  or  gene 

identifiers  (with  or  without  expression  information)  and  it  is  also  a  GO‐related 

database. The agriGO specially focus on agricultural species.   

  

What is GO? 

"The Gene Ontology  (GO) project provides  a  controlled  vocabulary  to describe  gene 

and gene product attributes in any organism. The GO project is a collaborative effort to 

address the need  for consistent descriptions of gene products  in different databases. 

The  GO  collaborators  are  developing  three  structured,  controlled  vocabularies 

(ontologies)  that  describe  gene  products  in  terms  of  their  associated  biological 

processes,  cellular  components  and  molecular  functions  in  a  species‐independent 

manner. There are  three separate aspects  to  this effort:  first, we write and maintain 

the ontologies  themselves;  second, we make  cross‐links between  the ontologies and 

the  genes  and  gene  products  in  the  collaborating  databases,  and  third, we  develop 

tools that facilitate the creation, maintainence and use of ontologies." Definition from 

http://www.geneontology.org/   

  

What is updated in agriGO compare with EasyGO? 

The  agriGO  is  a  successor  of  EasyGO,  and  it  go  further.  1. We  create  new website 

interface.  The  database  structure  and  scripts  of  agriGO  are  redesigned.  Both  page 

loading speed and analysis speed of agriGO now are improved because of the change. 

2. The agriGO service  is especially  focus on agricultural species.  It supports species  is 

extended to 35 including as much as 280 datatypes. 3. We added new analysis tools for 

new  agriGO,  such  as  PAGE  analysis  and  BLAST4ID  tool.  4.  The  result  output  and 

information are  richer compare with EasyGO. 5. The agriGO could also work as a GO 

database with search and download service.   

  

What are the unique features of agriGO compare with other GO webserver/database? 

The  agriGO  provides  heavy  support  to  agricultural  species. Not  only  limited  to  SEA 

analysis, GSEA which is achieved using PAGE method is also available. Furthermore we 

have  BLAST4ID  tool  for  ID  transfer  or  annotation.  And  search  as well  as  download 

function  is accessible. The agriGO  can give out  rich outputs  like graphical  result, bar 

chart  result  and  hierical  tree  which  composing  a  comprehensive  understanding  of 

biological meaning of user's input data.   

  

 

 

Page 18: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

What is SEA analysis? 

SEA analysis means Singular enrichment analysis which is tranditional but widely used. 

SEA  analysis  is  designed  to  identify  enriched Gene Ontology  (GO)  terms  in  a  list  of 

microarray probe sets or gene  identifiers. Finding enriched GO  terms corresponds  to 

finding  enriched  biological  facts,  and  term  enrichment  level  is  judged  by  comparing 

query list to a background population from which the query list is derived.   

  

Which statistics method should I choose in SEA tool? 

When  the  input  list  is  compared with  the  previously  computed  background,  or  is  a 

subset  of  reference  list,  choose  hypergeometric  or  fisher,  for  latter  only when  your 

query number  is quite small. When the  input  list has few or no  intersections with the 

reference list, the Chi‐square tests are more appropriate.   

  

What is PAGE analysis? 

PAGE is Parametric Analysis of Gene Set Enrichment [Kim et. 2005 BMC Bioinfomatics]. 

PAGE method  is using Central  Limit Theorem  in  statistics,  this method  is  simple and 

efficient. Different  to SEA,  it  takes expression  level  into account, and can deal with a 

long  list  of  genes/probesets.  PAGE  use  a  two‐tailed  test  to  count  Z  score,  and  the 

caculation of p‐value will be: 

if Z score >= 0: p‐value is 2 * (1 ‐ x) 

if Z score < 0: p‐value is 2 * x   

  

What is BLAST4ID? 

The BLAST4ID tool  is not an analysis tool, but an associated one used mainly  for two 

purposes: 1. Transfer your  IDs which are not available to agriGO to available ones, 2. 

use blast search to annotate your sequences with GO.   

  

Which tool should I choose? 

It will  depend  on what  data  you  have.  If  you  only  have  a  list  of  identifiers  or  only 

interested about  them, SEA will be your choice. And  if you  like  take expression data 

into  count  and  would  like  compare  several  dateset  then  you  may  try  PAGE.  The 

BLAST4ID is only an associated tool, use it if you really need it.   

  

Why graphical/chart image does not display on my PC? 

The bar chart result need flash player to browse correctly. And you may need different 

tool  to  display  different  format  graphical  result,  for  example:  Adobe  reader,  SVG 

brower. Contact me if you install related tool but still can not see the results.   

  

 

 

 

Page 19: manual - cau.edu.cnbioinfo.cau.edu.cn/agriGO/download/manual.pdfthe manual ? e right side nge depend by using HE e validity of y e analysis pr the work lat After 3 days lts of differe

How many datatypes are supported by agriGO? 

We  currently  support  on  35  species  including  280  datatypes.  Please  check  the  data 

statistics  page  for  detail  information.  We  will  continue  adding  more  species  and 

datatypes.   

  

How agriGO obtains its data source? 

Raw GO annotation data  is generated using BLAST, Pfam,  InterproScan by agriGO or 

obtained  from B2G‐FAR  center  or  from Gene Ontology. Arabidopsis  genome  data  is 

from TAIR. Rice TIGR genome data is from Rice Genome Annotation Project. Rice KOME 

data  is  from  KOME  database.  Rice Gramene  data  is  from Gramene  center.  Populus 

genome data  is  collected  from  JGI.  Soybean  and  Sorghum  genome data  is  compiled 

from phytozome. Grape genome data is compiled from Genoscope. Medicago genome 

data  is  from Medicago  truncatula  sequencing  resources. Maize genome data  is  from 

MaizeSequence.org. Castor bean genome data is from Castor Bean Genome Database. 

Brachypodium distachyon genome data  is from Ensembl. Bovien genome data  is from 

Bovine Genome Database.  Silkworm  genome data  is  from  SilkDB. M.  grisea  genome 

data  is  from  Magnaporthe  grisea  Database.  affymetrixmetrix  CSV  files  and  array 

sequences are from NetAffx.   

  

How often does agriGO update? 

Normally we will update our database every 3 months, but if we will update agriGO if 

some  important data source  is newly available.  Improvement and updating to agriGO 

tools are irregulated.   

  

Can I check result from old version by new agriGO ? 

Sorry,  but  no.  Because we  reconstructed  the  database  and  redesigned  the website 

organization, analysis result from EasyGO is not supported in agriGO.   

  

How to make agriGO add new customized datatype? 

User  can  contact  the  agriGO  administrator  by  email  ([email protected])  to 

discuss more details.