protein secondary structure prediction ((((단백질단백질...
Post on 24-Aug-2020
2 Views
Preview:
TRANSCRIPT
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein Secondary Structure PredictionProtein Secondary Structure PredictionProtein Secondary Structure PredictionProtein Secondary Structure Prediction
((((단백질단백질단백질단백질 2222차구조차구조차구조차구조 예측예측예측예측))))
Bioinformatics Lecture By Prof. Keun Woo Lee
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
단백질구조의 필요성
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조 예측: Methods
Basic Procedure
A. 이미알려진 단백질의 구조와 정보 활용B. 물리-화학적 특성활용
• C-F (Chou-Fasman) Method : Q3=50~55%• GOR (Garnier-Osguthorpe-Robson) Method: Q3=~63% • Lim’s Method: Q3=~65%• Neural Network Method: Q3=~75%
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조예측: C-F Method
1978년 Chou와 Fasman에 의하여 제안됨.
Basic Procedure
Step1. 각 아미노산의 발생빈도 분석후 도표화. (도표이용)
Step2. 주어진 서열의 helix 와 sheet 가능성을 판별하고 양방향으로 확장.
Step3. 같은 위치에 두구조가능성이 겹칠경우 P(helix) 와 P(sheet) 의평균치를 비교하여 높은것으로 할당.
Step4. Turn의 경우 연속되는 4개의 아미노산을 중심으로 2단계 개별확률치로 수치화.
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조예측: C-F Method
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Example: 다음과 같은 서열의 2차 구조를 예측하여라?
Step1. 도표를 이용하여 각2차구조의 가능성을 표시한다.
Protein 2차구조예측: C-F Method
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
α-Helix 의 최소구성단위인 아미노산 6개 부터 시작
P(나선)이 100보다 큰지점에 멈추어 평균을 구한다.
이경우 3가지 서열이 가능하다.
C-F Method: Procedures
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
최종 선정 부위: 노란색
Helix와 sheet이 둘다 가능한 경우:
Sheet으로 판정: P(sheet) > 105 and P(sheet) > P(helix)
Helix로 판정: 앞의 조건이 아닐때
C-F Method: Procedures
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
C-F Method: Procedures
TurnTurnTurnTurn Structure Determination (턴 구조 결정)
Condition 1 : P(f4) > 0.75 X 10-4 ( P(f4)=f(i)f(i+1)f(i+2)f(i+3) )
Condition 2 : P(턴/Turn) > 100
Condition 3 : P(턴/Turn) > P(나선/Helix)
Condition 4 : P(턴/Turn) > P(평판/Sheet)
C-F / GOR Method program can be download athttp://fasta.bioch.virginia.edu/o_fasta/cgi
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조예측: GOR Method1978년 Garnier-Osguthorpe-Robson 이 개발
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
GOR Method: Parameter Table
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조예측: 그외 방법들
-Lim’s Method (1974년): C-F나 GOR 같은 확률통계에 의존한 수치적 접근과는 달리아미노산 잔기의 물리화학적 특성에 기초한 2차구조 예측법.
-Sweet’s Method (1986)
-Nishikawa-Ooi Method (1986)
-Levin’s Method (1986)
-GGBCM Method (1988)
(강의페이지에 주어진 참고 논문 참조)
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Protein 2차구조예측: Neural Network Method
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
2차 구조 예측도, Q3
Q3 = 100 x ( NPred / NObs)
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Hydropathy Analysis
1982년 Kyte-Doolitle 개발
Dividing amino acids by hydrophobicity/hydrophilicity
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Hydropathy Analysis: Example
Is it a Trans Membrane Protein (TMP) ? Ex) Testing for a protein sequence from R. solanacearum
Threshold to be TMP:>2.0 with w=19
“Window를 19 (W=19)로 하여 색인지수 2를 넘는지역이 존재하면 강력한 알파나선이 존재하므로그 단백질은 TMP일 가능성이 매우 높다.”
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Hydropathy Analysis: Example
Validation using secondary structure predictions:앞에서 Hydropathy Analysis법으로 예측한 결과대로 알파나선이 진짜 존재하는 지알아보기 위하여 그 부분 서열을 대상으로 2차구조예측법을 적용하여 보았다.
“Compatible with Hydropathy analysis result”
생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr
Trans Membrane Protein: Nin-Cin
Most TMPs show Nin-Cin condition(except for C. elegans).
“So number of α-helix should be even.”
top related