sparklingsoda & nakedsoda …4 *thomas h. davenport 인용 2.0 big data...
TRANSCRIPT
4
*Thomas H. Davenport 인용
Big Data2.0
►복잡하고 대규모의 비정형분석을 시작
►데이터 사이언티스트 등장
►데이터 기반 제품 및 서비스
Fast Business Impact for the Data Economy
3.0
►기존 분석과 대용량 데이터의발전된모습
►모든 비즈니스에서 데이터 및분석 기반 제품생산
►대규모의 의사결정 기반 산업
Cognitive4.0
►자동의사결정을 위한 분석
►인지기술의 부상
►디지털/물리적으로 인간업무대체
1.0Traditional Analytics
►비교적 작은형태의 조직이정형 분석 위주로 내부 의사결정을 위한 Report 제공
Data Analytics Service Enhance
Analytics 4.0
5
“모델이 많아지니 개발된 모델의 버전 관리가복잡해졌어요 무엇인가 관리체계가 필요해요”
- 분석 팀장
“저희는 Open S/W 버전관리 어렵고 데이터분석팀은 한가지 버전만 사용 했으면 해요”
- IT 관리자
“다양한 최신의 기술들을 회사내에서 공유해서업무에 도움이 되었으면 좋겠어요”
- 분석 리더
“Machine Learning 분석을 GPU, CPU 충분히활용해서 빠르게 분석하고 싶어요"
- 분석가
Our Customer
6
“협업 기반의 개발과 운영적용이 원활한알고리즘 자산화”
빠르게 변화하는 환경에 즉시 대응하며다양한 알고리즘 개발이 용이한 관리환경 필요
I. 분산환경의 빠른 분석 시스템 지원
▪ 분산서버 환경을 지원하는 아키텍처 구성▪ CPU, GPU 기반의 병렬처리가 가능한 시스템 구성
II. 다양한 오픈S/W의 관리 효율성 확보
▪ 오픈소스 S/W 기반의 머신(딥)러닝 분석 체계를 지원하며다양한 확장 패키지 사용을 위한 버전 관리체계 확보
III. 학습 모델관리 표준화
▪ 모델의 형상관리를 위한 분석가별 계정관리 및 각 알고리즘별 성능비교 및 배포 자동화를 위한 표준관리 체계 마련
해결 과제
▪ 분산처리 환경 내에서의 팀별/부서별 작업공유
▪ 개발자(Developer), 운영자(DevOps) 및 데이터처리부서의 역할 정의 및 결과물의공유
1
협업 지원
▪ 개발된 코드나 알고리즘을 오브젝트로관리함
▪ 개발 결과인 code와 함께 개발보고서, 데이터및 교육 material이 하나로 관리
2
알고리즘
자산관리
▪ 개발된 알고리즘이나 모델은 운영 시스템혹은 웹에 seamless하게 연동되어야 함
▪ 결과물에 관계된 라이브러리 간의dependency에 대비(isolation)
▪ 그 성능을 계속 모니터링하고 튜닝 혹은재개발 시점 등을 판단함
3
Deployment
용이성 강화
AI 분석 포탈 도입 방향
AI 분석 포탈 도입 방향
7
AI Design
Project
AI Develop
Dataset
AI Build
Model
AI Operation
DeployData
Scientist
EndUser
Define EDA Train & Test Monitor
AI Model Life Cycle
Algorithm Asset Management
AI DevOps
AI Model Service Flow
8
Docker
…
Account
Packages
Source
Data
AI Development & Build AI Operation
Test
Service
Deploy
Docker Image
Docker Image
Open API
SparklingSoDA Architecture
SparklingSoDA Service Flow
9
Project 생성
■ 계정별 로그인
■ 기존 Project 목록
■ 신규 Project 생성
- Resource Pool
(Local, Cluster,
CPU, GPU …)
- Package Add
- Dataset info
- GitLab info
DataSet 선택
■ DataSet 목록
■ 신규 DataSet 생성
- Description
- Summary
- Data View
- Plot View
Model
개발/등록
■ Model Develop
- R, Python, …
- Version
- Athorization
■ Model Assets
- Summary
- Evaluations
- Comparison
Model 배포
■ AIOps
- Model List
- Model Life Cycle
- Model
Monitoring
SparklingSoDA 특장점
10
기업용 즉시
분석 환경제공
▪ 계정별 접근 권한관리로 기업내의 다양한 분석 지원
▪ 오픈 소스 및 패키지 배포관리를 내부망에서 관리 지원
▪ 오픈 소스 기반의 분석을 버전 충돌없이 자유로운 분석 환경 제공
▪ 고객개인정보 조회시 로그 기능을 활용하여 조회 이력관리 제공 (Rstudio Server Pro 기업용 버전 활용)
서비스지향
분석체계 제공
▪ 분석환경에서부터 AI 모델 배포까지 관리체계 제공으로 One-Stop기반의 서비스 지향 포탈 제공
▪ Docker기반의 환경 제공으로 개발과 운영의 환경을 Seamless하게 제공하여 실시간 서비스 제공
▪ 서비스별 모니터링 기능으로 서버 자원의 Scale Out/Up을 간편히 제공
AI Model
자산관리화
▪ 개발된 모델의 History 제공으로 AI Model의 Life Cycle 관리 제공
▪ 서비스 운영 모델의 성능 모니터링 및 비교 모델의 성능 비교 Report로 모델의 최적화 관리 제공
▪ 중앙 집중화된 AI 모델의 자산관리 분석 기술의 자산화 관리 제공
• NakedSoDA란? 이미지 분석 문제를 Deep Learning의 다양한 기술을 이용하여 해결하는알고리즘 기반 서비스로 문자 인식 알고리즘과, 차량 이미지 분석 알고리즘 등의알고리즘 Asset
Image 분석 알고리즘
12
OCRSoDA
DamiSoDA
NakedSoDA
• OCRSoDA란? Deep Learning을 이용하여 OCR기술을 접근하여 이미지의 좌표값으로 한글자의위치를 찾고 그 위치의 글자를 인식하여 글자값을 분류하는 알고리즘
• DamiSoDA란? 차량의 파손 사진을 분석하여 파손부위 인식과 파손 정도를 분류해주는 알고리즘
Copyright ⓒ 2077 by AgileSoDAThis report is soly for the use of client personnel. No part of it may be circulated, quoted, or reproduced for distribution outside the client organization without prior written approval from AgileSoDA. This document provides an outline of a presentation and is incomplete without the accompanying oral commentary and discussion.
㈜애자일소다www.agilesoda.ai
Thank you