1. 패턴인식과기계학습 -...

30
1. 패턴인식과 기계학습

Upload: others

Post on 02-Feb-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

1. 턴인식과 계학습

Page 2: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

강의 개요

턴인식 및 계학습의 본 개념 소개

턴인식과 계학습

처리 과

본 요소

개념

응용 분야

데이터 데이터 분포특징과 특징추출분류 결 경계분류 과 차

분류 군집화교사학습과 교사학습분류 복잡도 과다 합

Page 3: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

주어진 입 데이 ( )를 어떤 에 라 몇 개의

의 그룹(클래스)로 나 고, 각 데이 가 어떤 그룹에

해당하는 지를 결 하는 것

Person 1

Person 2

Person 3

Normal

Smile

Surprise

Anger

자인식

얼굴인식표 인식

1) 턴인식이란?

Page 4: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

( 법1) 구조 특징에 의한 의 인식

얼굴인식/표 인식을 해필요한 구조 특징 ?

(구조 법의 한계)

2) 턴인식의 본 근 방법 1

Page 5: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

( 법2) 탬 릿 매칭

d1

d2

d3

d4

d3=min{di}

입 데이

클래스

1

2

3

4

원 상(template)

3

3) 턴인식의 본 근 방법 2

Page 6: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

조명변

표변

타변

원 상(template)

패턴의 변형

4) 턴인식의 어 움

Page 7: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

인간이 갖고 있는 고 의 지능 능인 학습

능 을 계를 통해 구 하는 법

의 다양한 변 이 존재

보다 교한 법이 필요

“ 계학습”

주어진 데이 들을 분 하여 그로부 일 인

규칙이나 새로운 지식을 자동 로 추출해 내는

법론 개

인식을 어 게 하는 주요 원인

5) 계학습의 필요

Page 8: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

평균 상

자 “5”의 다양한 변

통계 보(평균량)의 활용

6) 데이터를 이용한 학습

Page 9: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

2. 턴인식의 처리과

Page 10: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

분류/인식Classification /

Recognition

인식결과

학습데이 집합

처리Preprocessing

특징추출Feature extraction

결 경계Decision boundary

테스트데이

학습(데이 분 )Learning classifier /

Data analysis

인식단계 (Recognition Stage)

학습단계 (Learning Stage)

1) 턴인식의 처리과

Page 11: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

데이 집Data collection

데이 처리Data

preprocessing

데이 분Data analysis

능 평가Performance evaluation

특징 추출분류 개

Development offeature extractor

& classifier

/보완

2) 턴인식의 개발 단계

Page 12: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

3. 턴인식의 본 요소

Page 13: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

데이 분포 특 :

- 가우시안 분포를 름

- 평균 [3,3]

- 공분산 [[1,0]T,[0,1]T]

- 데이 (샘 ) 개 : 50개

n차원 열벡터

x1

x2

데이 의 표

2차원 데이 집합의 분포 태

1) 데이터

Page 14: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

(a) 모집단의 확률 도함 (b) 등고 로 표시 도함

2) 데이터 분포

Page 15: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

(c) 모집단의 데이 분포 (d) 4개의 표본 집합

2) 데이터 분포

Page 16: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

± 입 데이 를 그 로 사용하는 신 각 의 특 을

잘 표 해 있는 핵심 보만 추출하여 사용

± 비용(계산, 메모리)의 증가 잡음 등 로 인한 해

결의 어 움을 감소시키는 효과

(b) 격자특징12x12

(d) 향특징(a) 원 상 (c) 직히스토그램

3) 특징추출

Page 17: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

± 사 에 의한 특징추출

u

à 차원 감소의 목 이 아닌 인식을 한 핵심 보를 추출하는 것이 요

à 주어진 데이 의 분포 특 을 가장 잘 나타낼 있는 향을

어떤 향 로 사 하는 것이 좋 가?

x (데이터)

xTu (특징값)

3) 특징추출

Page 18: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

분류(classification)

결 경계(decision boundary)

클래스를 구분해주는 직 /곡 /면

데이 집합 X={x1, x2,…, xN}가 주어졌을 때, 각 데이 xi에 해당하는 클래스 라벨 y(xi)를결 하는 것

별함 g(x)=0과 같 함 식 로 의 는입 공간상의 경계면

4) 분류

Page 19: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

C1

C2

분류데이터

결 경계

g(x1, x2) = x1-x2 = 0

x2

x1

5) 결 경계

Page 20: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

± 능 평가 척도

체 데이 개분류 실 데이 개

분류 차(%) = x 100

체 데이 개분류 공 데이 개

분류 (%) = x 100

학습 차

테스트 차

6) 분류 과 차

Page 21: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

® 이론 능 분 을 해 는 요

® 실 응용에 는 계산 불가

∵ 체 데이 집합의 확률 도함 를 모름

® 테스트 차 à “경험 차”

® 테스트 차는 일 화 차의 경험 근사에 불과

일 화 차

6) 분류 과 차

Page 22: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

Ecv

X1 X2 X3 X4 X5 Etest(X5)Etrain(X-X5)

X1 X2 X3 X5 X4 Etest(X4)Etrain(X-X4)

X1 X2 X4 X5 X3 Etest(X3)Etrain(X-X3)

X1 X3 X4 X5 X2 Etest(X2)Etrain(X-X2)

X2 X3 X4 X5 X1 Etest(X1)Etrain(X-X1)

mean

5-분 교차검증법의 처리 과 의

교차검증

6) 분류 과 차

Page 23: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

4. 턴인식과 개념들

Page 24: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

분류(classification) 군집화(clustering)

주어진 데이 집합을 이미 의몇 개의 클래스로 구분하는

입 데이 의 분포 특 (입 값의 사 )을 분 하여 임의의 복

개의 그룹 로 나 는 것

입 데이 각 데이 의 클래스 라벨이 함께 공 à {xi, y(xi)}

클래스에 한 보 없이 단 히입 값만 공 à {xi}

자인식, 얼굴인식 등 상분리

Bayes classifierK-Nearest Neighbor method Multilayer perceptronsSupport Vector Machine

K-means clusteringLearning Vector QuantizationHierarchical clusteringSelf Organizing feature Map

1) 분류 군집화

Page 25: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

C1

C3

C1

C3

분류군집화

1) 분류 군집화

Page 26: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

교사학습(supervised learning)

비교사학습(unsupervised learning)

학습시에 인식 가 내야 할 원하는 출 값을 미리 알주는 교사가 존재하는 태

학습시 인식 의 원하는 출 값에 한 보 없이 학습이 이루어지는 태

6장 최소 곱법, 퍼셉트론 학습11장 다 퍼셉트론을 한 류역 학습 알고리즘

10장 가우시안 합모델을 한 EM 학습법11장 자 조직화 특징맵의 학습법

분류

군집화

2) 교사학습, 교사학습

Page 27: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

(a) (b)

(c) (d)

C1

C2

C1

C2

C1

C2

C1

C2

Linear decision Boundary g(x)

Nonlinear decision Boundary

g(x)

Mis-classified area

학습데이

테스트데이

비 결 경계결 경계

3) 분류 복잡도 과다 합

Page 28: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

과다 합(overfitting)

분류 가 학습데이 에 해 만 지나치게 합한태로 결 경계가 는 람직하지 못한 상

학습데이 의 확률 잡음과 학습데이 개 의 부족에 인

분류 의 복잡도를 히 조 하는 법이 필요

학습의 조 종료 법

규화항을 가진 차함 를 사용하는 법

모델 택 법

3) 분류 복잡도 과다 합

Page 29: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

5. 턴인식의 응용

Page 30: 1. 패턴인식과기계학습 - knou.ac.krgradlms.knou.ac.kr/weblms/grad/contents/108424/2011_week...응용 분야 문자인식/ 문서인식 생체인식 뇌신호처리 생물정보학

응용분야

자인식/인식

생체인식

뇌신 처리

생 보학

로 비

의료 보

데이 분

자인식, PDA, 자사 , ATM 등

생체 보(지 ,얼굴,홍채)à 신원확인

MEG, EEG, BCI

마이크로어 이, 염 열 분

객체인식, 음 / 외 신 분

임상 데이 , MRI, CT, 음

홈쇼핑, 주식 데이 , 보험회사 등

1) 턴인식의 응용