음성인식 기술 및 활용 트렌드 (2013)

49
음성인식 기술 및 활용 트렌드 2013년 5월 윤훈주 [email protected] http://www.facebook.com/firehj 유비유넷 (http://www.ubiu.net)

Upload: -

Post on 10-Jun-2015

7.127 views

Category:

Technology


6 download

DESCRIPTION

음성인식, 음성합성에 대한 기술 소개와 활용 드렌드에 대해 다루고 있음

TRANSCRIPT

Page 1: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 기술 및 활용 트렌드

2013년 5월

윤 훈 주[email protected]

http://www.facebook.com/firehj

유비유넷 (http://www.ubiu.net)

Page 2: 음성인식 기술 및 활용 트렌드 (2013)

영화 및 드라마에서의 음성인식

<1982년: 전격 제트 작전><1977년: 스타워즈>

영화와 드라마를 통해 음성인식 기술에 대해 친숙해졌다.

음성인식기술 및 활용 트렌드1/48

3PO R2D2

Page 3: 음성인식 기술 및 활용 트렌드 (2013)

<LG>

휴대폰 음성 다이얼링 적용사례

<삼성>

1997년에 음성인식 기술은 휴대폰에 적용이 되었다.

음성인식기술 및 활용 트렌드2/48

Page 4: 음성인식 기술 및 활용 트렌드 (2013)

<스마트폰> <스마트 TV> <스마트자동차>

폰, TV, 자동차가 스마트화되면서,쉽고편리하게사용할수있는 Natural User Interface가필요해짐

왜 다시 음성인식이 뜨는가?

음성인식기술 및 활용 트렌드3/48

Page 5: 음성인식 기술 및 활용 트렌드 (2013)

모바일 음성인식의 진화

검색 지능형 에이전트

• 음성인식 성능의 향상

- 스마트폰 단말의 성능 진화

- 클라우드 기반의 음성인식 시스템: 대용량 데이터 처리

• 제품기능의 복잡 다양화- 인공지능 기술의 발전

- 지식 검색 기술

정형화된 명령어 인식 자연어 이해, 지능형 검색

음성인식기술 및 활용 트렌드4/48

Page 6: 음성인식 기술 및 활용 트렌드 (2013)

명령어 음성인식

특정 명령어를 기반으로 인식

음성인식기술 및 활용 트렌드5/48

Page 7: 음성인식 기술 및 활용 트렌드 (2013)

자연어 음성 인식

일상생활의 대화처럼 자연스럽게 이야기

음성인식기술 및 활용 트렌드6/48

Page 8: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 기술

음성인식기술 및 활용 트렌드7/48

Page 9: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 기술의 어려움

• 동일한 화자인 경우에도 다양한 변이

- Pitch(놀람, 화남, 기쁨 등)

- 발성 속도

- 주변 잡음의 영향

음성인식기술 및 활용 트렌드8/48

•동일한 단어라도 화자별로 발성이 다름

- 강세, 명료성

•문맥에 따라 발성이 달라짐

- 음운 변화

Page 10: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 기술의 분류

사용자 범위

인식 대상어휘

화자 종속 화자 독립 화자 적응

소어휘 대어휘

발전 방향

특정화자의 음성만을 인식 불특정화자의 음성을 인식 특정화자의 음향학적 성질에 적응

음성인식기술 및 활용 트렌드9/48

발성의 자연성

인식 단위

고립단어인식

연결단어인식

연속음성인식

대화체인식

단어단위 인식 음소단위 인식

발음된 단어의 시작과 끝을알 수 있는 인식

연결된 단어를 인식 일상적인 대화체 문장을 인식

Page 11: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 언어 이해

대화 관리

데이터베이스

음성 대화 시스템

자연어 처리 지능형 검색/처리

음성인식기술 및 활용 트렌드10/48

음성 합성 언어 생성

대화 관리음파

Page 12: 음성인식 기술 및 활용 트렌드 (2013)

인식구간

추출잡음 처리 특징 추출 비교 인식 결과

전처리부 인식부

음성인식 기술의 원리

음성모델 DB

음성인식기술 및 활용 트렌드11/48

Page 13: 음성인식 기술 및 활용 트렌드 (2013)

음성 특징 추출

음성인식기술 및 활용 트렌드12/48

Page 14: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 시스템

음성인식기술 및 활용 트렌드13/48

Page 15: 음성인식 기술 및 활용 트렌드 (2013)

• 사용자가 원하는 것이 무엇인지 알아내는 기술

“ 오늘 날씨 어때? 오늘 우산이 필요할까? “à 지역 날씨 조회

“ 내일 아침 6시에 깨워줘 “à 알람 설정

• 사용자의 상황과 대화 문맥을 이해

“ 내일 오전 10시 회의를 오후 4시로 연기해”

언어 이해

음성인식기술 및 활용 트렌드14/48

“ 이미 다른 회의가 잡혀 있습니다.”

“ 대구에 비가 오니?”

“ 아닙니다. 맑은 날씨입니다.”

“ 서울은 어때?”

“ 비가 조금 내립니다.”

Page 16: 음성인식 기술 및 활용 트렌드 (2013)

형태소 분석 구문 분석 의미 분석 담화 분석

입력된 문장을 형태소 단위로

분할하고 품사를 부착

주어, 목적어, 서술어와 같은

구문단위를 찾음

문장이 의미적으로 올바른

문장인지를 판단

대화 흐름상 어떤 의미를 가지는

지를 찾음

- 문맥구조 분석

일상생활 언어를 처리

자연어 처리

음성인식기술 및 활용 트렌드15/48

(문장들의 연관 관계),

- 의도분석

(전후관계를 통한 실제 의도)

1) 나는

- 나+는

- 날(다)+는

- 나(다)+는

2) 과학자들에게

- 과학자 + 들 + 에게

1) 사람이 사과를 먹는다. (o)

2) 사람이 비행기를 먹는다. (x)

3) 비행기가 사과를 먹는다. (x)

1) 철수는 어항을 떨어뜨렸다. 그는 울고 말았다.

2) 철수는 우승을 했다. 그는 울고 말았다.

Page 17: 음성인식 기술 및 활용 트렌드 (2013)

심심이 채팅 메신저

• 지능형 채팅 로봇 심심이가 음성인식과 결합한다면 어떤 것들이 가능해질까?

<카카오톡 플러스 친구><심심이 대화>

음성인식기술 및 활용 트렌드16/48

Page 18: 음성인식 기술 및 활용 트렌드 (2013)

지능형 검색/수행

음성인식기술 및 활용 트렌드17/48

Page 19: 음성인식 기술 및 활용 트렌드 (2013)

지능형 에이전트

음성인식기술 및 활용 트렌드18/48

<지식 검색 기술>

•사용자가 원하는 답을 찾는 기술

•일반적인 검색엔진 결과 대신 가장 관련있는 웹 서비스 활용

•울프럼 알파의 지능형 검색 서비스

•엘프의 지역검색/리뷰 서비스

•야후의 날씨/주가 조회 서비스

- 세상에서 가장 큰 동물은? à울프럼 알파에 질의

- 이 근처에서 중국식당 좀 찾아줘 à 엘프에 질의

Page 20: 음성인식 기술 및 활용 트렌드 (2013)

지능형 검색: 울프럼 알파

• 계산 능력을 갖춘 지식 검색 엔진

- 각종 지식들을 재구성하여 보다 의미있는 결과로 제시

- 백과사전식의 구조화된 검색결과

- 실시간으로 계산된 결과

- 복잡한 공학 수식 계산

• 애플 시리 및 삼성 S보이스의 검색엔진으로 사용

• 수학 소프트웨어인 매스매티카에 사용된 엔진

http://www.wolframalpha.com

음성인식기술 및 활용 트렌드19/48

Page 21: 음성인식 기술 및 활용 트렌드 (2013)

<구글 예측 API>

지능형 검색: 구글 지식 그래프

<지식 그래프>

음성인식기술 및 활용 트렌드20/48

Page 22: 음성인식 기술 및 활용 트렌드 (2013)

구글 Now

사용자가 검색했던 내용들, 소위 로그(log)를 기억해 사용자에게 필요한 정보를 스스로 전달

음성인식기술 및 활용 트렌드21/48

Page 23: 음성인식 기술 및 활용 트렌드 (2013)

구글 음성 검색

음성인식기술 및 활용 트렌드22/48

Page 24: 음성인식 기술 및 활용 트렌드 (2013)

음성인식 활용

음성인식기술 및 활용 트렌드23/48

Page 25: 음성인식 기술 및 활용 트렌드 (2013)

특징 활용 유형 활용 분야

편리함 별도의 학습이나 훈련없이도 쉽게 사용 TV등의 가전 제품게임기

상시 입력가능

손이 자유롭지 않은 상황에서도 정보를 입력할수 있기 때문에, 이동시에도 기기 사용이 가능함

모바일 기기물류와 같은 업무 작업

음성인식의 특징

음성인식기술 및 활용 트렌드24/48

고속 입력 입력 속도가 타이핑보다 빠르기 때문에 고속 또는 실시간으로 정보처리

콜센터, 방송, 통번역 등

화자의 고유 정보 전달

화자의 음성을 통해 신원, 심리, 건강상태, 언어능력 등을 파악할 수 있어 개인 맞춤형 서비스제공 가능

보안, 금융, 의료, 교육 등

Page 26: 음성인식 기술 및 활용 트렌드 (2013)

걸어 다닐때 사용하는 음성인식

<메모 작성><트위터/페이스북><빠른 입력>

음성인식기술 및 활용 트렌드25/48

<메모 작성><트위터/페이스북><빠른 입력>

Page 27: 음성인식 기술 및 활용 트렌드 (2013)

<애플 시리> <늬앙스 드래곤> <MS Ask ziggy>

모바일 음성인식 서비스

<구글 음성검색>

음성인식기술 및 활용 트렌드26/48

•늬앙스의 음성엔진•시리의 자연어 처리•울프럼알파의 지능형 검색

<늬앙스>•업게 1위의 음성인식 솔루션 회사•2011년 매출액: 14억불•1994년 SRI에서 뉘앙스 창업•Apple, IBM과 협력관계•구글, MS와 경쟁관계

Page 28: 음성인식 기술 및 활용 트렌드 (2013)

애플 시리

<시리> 똑똑한 가상 개인 비서

- 자연어 음성 대화 서비스

- 생활정보 검색 서비스(지역정보, 날씨, 주식, 교통상황 등)

- 개인 비서(일정 체크, 음성 SMS 등)

음성인식기술 및 활용 트렌드27/48

<Eyes Free>

Page 29: 음성인식 기술 및 활용 트렌드 (2013)

<Reminder> <문자보내기> <날씨> <정보검색> <스케줄> <이메일>

시리: 폰 기능 제어

<주소록> <알람> <지도> <주식> <타이머> <도움말>

Page 30: 음성인식 기술 및 활용 트렌드 (2013)

<스포츠> <영화> <식당> <페이스북, 트위터>

시리: 검색 / 서비스

음성인식기술 및 활용 트렌드29/48

Page 31: 음성인식 기술 및 활용 트렌드 (2013)

시리: 채팅

음성인식기술 및 활용 트렌드30/48

<2011년> 영어, 프랑스어, 독일어, 일본어

<2012년>중국어, 한국어, 이탈리어, 스페인어

Page 32: 음성인식 기술 및 활용 트렌드 (2013)

LG Q보이스

음성인식기술 및 활용 트렌드31/48

Page 33: 음성인식 기술 및 활용 트렌드 (2013)

LG Q보이스: UI

Floating App 기능: Q보이스를 웹브라우저, 갤러리 등의 화면과 겹쳐서 사용

스포츠 뉴스찾아줘

이 페이지트위터에 올려

음성인식기술 및 활용 트렌드32/48

이사진엄마한테보내줘

강남역찾아줘

이사진페이스북에 올려

Page 34: 음성인식 기술 및 활용 트렌드 (2013)

LG Q보이스: 채팅

음성인식기술 및 활용 트렌드33/48

Page 35: 음성인식 기술 및 활용 트렌드 (2013)

운전중에 음성으로 안전하게 차량 정보 시스템 사용

자동차에서의 음성인식

음성인식기술 및 활용 트렌드34/48

Page 36: 음성인식 기술 및 활용 트렌드 (2013)

<음성인식 Home> <음성인식 TV>

홈에서의 음성인식

음성인식기술 및 활용 트렌드35/48

<음성인식청소기> <음성인식세탁기> <음성인식에어컨>

Page 37: 음성인식 기술 및 활용 트렌드 (2013)

장애인의 음성인식 사용

음성인식기술 및 활용 트렌드36/48

Page 38: 음성인식 기술 및 활용 트렌드 (2013)

개인 인증

음성인식기술 및 활용 트렌드37/48

Page 39: 음성인식 기술 및 활용 트렌드 (2013)

헬스케어

음성인식기술 및 활용 트렌드38/48

Page 40: 음성인식 기술 및 활용 트렌드 (2013)

번역/통역

<동영상 번역> <모바일 통역>

음성인식기술 및 활용 트렌드39/48

Page 41: 음성인식 기술 및 활용 트렌드 (2013)

<물류센터>

기타 활용분야

<PC제어>

음성인식기술 및 활용 트렌드40/48

<영어학습><게임>

Page 42: 음성인식 기술 및 활용 트렌드 (2013)

음성 합성

음성인식기술 및 활용 트렌드41/48

Page 43: 음성인식 기술 및 활용 트렌드 (2013)

음성 스타일

<낭독형> <대화형>

음성인식기술 및 활용 트렌드42/48

•일반영역ARS, •안내/경보방송, •텔레매틱스, •웹낭독, •audio-book 등

•지능형 로봇, •컬러링 서비스, •채팅, •게임, •동화낭독, •대화형 서비스 등

Page 44: 음성인식 기술 및 활용 트렌드 (2013)

<고품질 무제한 음성합성><제한된 단어, 문장>

음성 합성의 요구 성능

음성인식기술 및 활용 트렌드43/48

Page 45: 음성인식 기술 및 활용 트렌드 (2013)

<녹음된 음성 재생> <편집합성>

음성 합성 방법

• 미리 녹음된 문장이나 단어를 그대로 재생 • 고정된 문구에 특정 단어만 변경하여 합성• 114서비스• 예금조회, 거래내역 조회, 증권, 길안내, 열차시간 등

음성인식기술 및 활용 트렌드44/48

<음편 조합> <파라메터 방식>

• 소리를 음소단위로 녹음하여 문장 합성• 모든 소리를 합성할 수 있음• 음소간의 결합 경우를 고려해야 하므로DB의 용량이 크다.

• 대표 음소를 통계적 기법으로 추출한 후, 파라메터를 조절하여 소리를 합성

• DB의 양을 줄일수 있음

Page 46: 음성인식 기술 및 활용 트렌드 (2013)

활용분야

• 화면제공이 어려운 상황

• 사용자가 화면에 집중하기 어려운 상황: 다른 일을 하고 있을때

• 음성인식과 결합하여 인터랙티브한 기능을 제공할때

• 장애인/고령자

음성인식기술 및 활용 트렌드45/48

Page 47: 음성인식 기술 및 활용 트렌드 (2013)

활용분야

<시각장애인><전자책 읽어주기> <문자/이메일 읽어주기>

음성인식기술 및 활용 트렌드46/48

<고령자><웹 페이지 읽어주기>

<제품 홍보 동영상>

Page 48: 음성인식 기술 및 활용 트렌드 (2013)

활용분야

음성합성을 이용한 사이버 가수

<일본: 하츠네 미쿠> <한국: SeeU>

음성인식기술 및 활용 트렌드47/48

Page 49: 음성인식 기술 및 활용 트렌드 (2013)

감사합니다

48/48

윤훈 주(유비유넷대표 운영위원)

[email protected]://www.facebook.com/firehj

유비유넷 (http://www.ubiu.net)