국가서지정보 open public data platform 구축

48
공공공공 공공 공공공 공공 공공공 - 공공 1 공공공공공공 Open Public Data Platform 공공 2013.3.29. 공공공공공공공 공공공 공공공공공 ([email protected])

Upload: jinho-park

Post on 15-May-2015

508 views

Category:

Documents


6 download

DESCRIPTION

2013년 3월 29일 대전시청. 공공정보보활용전략세미나 발표자료.

TRANSCRIPT

Page 1: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

1

국가서지정보 Open Public Data Platform 구축2013.3.29. 국립중앙도서관 박진호 전문연구관 ([email protected])

Page 2: 국가서지정보 Open Public Data Platform 구축
Page 3: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

3

우리가 공유하고 있는 것 . 한국어 ?

Page 4: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

4

사과

ap-ple

상징 , Symbol

Page 5: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

5

쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매 .[ 출처 ] 사과 | 두산백과

붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는 과일

색 모양 분류

누군가 사과를 바라보는 시각

Page 6: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

6

도서관 데이터 (Library Data)

• 표제 / 책임표시사항 : 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음

• 발행사항 파주 : 사계절출판사 , 2011• 형태사항 346 p. : 천연색삽화 ;23 cm• 표준번호 / 부호 ISBN: 978-89-5828-534-2

 03100 • 분류기호 : 한국십진분류법 -> 104   

한국십진분류법 -> 001.3    듀이십진분류법 -> 102    듀이십진분류법 -> 001.3

• 주제명 : 철학 에세이 [ 哲學 --]   인문 과학 [ 人文科學 ]  

Page 7: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

7

• 표제 / 책임표시사항 : 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음• 발행사항 파주 : 사계절출판사 , 2011• 형태사항 346 p. : 천연색삽화 ;23 cm• 표준번호 / 부호 ISBN: 978-89-5828-534-2  03100 • 분류기호 : 한국십진분류법 -> 104    한국십진분류법 -> 001.3    듀이십진분류법

-> 102    듀이십진분류법 -> 001.3• 주제명 : 철학 에세이 [ 哲學 --]   인문 과학 [ 人文科學 ]  

서지 정보 / 데이터

저자명 정보 / 데이터

주제명 정보 / 데이터

도서관 데이터 (Library Data) 는

Page 8: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

8

서지 정보 / 데이터 저자명 정보 / 데이터주제명 정보 / 데이터

객체 , 서브젝트 ,

개념

도서관 데이터 (Library Data) 를 공공정보로 개방한다는 것은

속성

제목저자

출판사발행년

용어상위어하위어

이름생몰년연락처

특정 객체 , 개념과 속성과 속성이 갖는 값 ( 강신주 , 철학 ) 을

누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것

Page 9: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

9

공공정보 , 데이터 활용 ?

Page 10: 국가서지정보 Open Public Data Platform 구축

공공정보 개방 ?

Page 11: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

11

Check Point1. 여러분 입장에서 공공정보를 개방하고 있다는 곳에서

• 어떤 객체 , 개념을 가지고 있는 지 알 수 있는가 ?

• 그 객체 , 개념을 어떤 속성으로 관리하고 개방하고 있는지 알

있는가 ?

• 개방하고 있는 정보가 정말 가지고 있는 모든 것인가 ?

• 범용적인 , 혹은 내가 놀고 있는 플랫폼에서 활용 가능한가 ?(

표준 )

• 나도 ( 개발능력이 없는 ) 활용할 수 있는 플랫폼인가 ?

• 나에게 어떤 노력을 기울이고 있는가 ?

Page 12: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

12

공공정보로서 서지정보의 가치

Page 13: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

13

공공정보로서 서지정보의 가치

인류의 지식

문자의 역사

인류의 기록

Page 14: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

14

현재까지 국립중앙도서관의 데이터 공개

MARC, OAI, Open API

Page 15: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

15

국가서지기반 데이터 플랫폼 구축

• 문서 중심의 현재 웹 생태계에 RDF 기반의 데이터 플랫폼을

구축

하고 사람들이 활용할 수 있도록 하는 활동

• 데이터 변환 : MARC2RDF

• 데이터 플랫폼 구축 : 데이터 검색 , 다운로드 등

• 데이터 활용 교육 (Data Literacy) 및 해커톤

Page 16: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

16

"The Semantic Web is an extension of the current web

in which information is given well-defined mean-ing, better enabling computers and people to work in coop-

eration."

Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001

Page 17: 국가서지정보 Open Public Data Platform 구축

아직까지 웹의 문서들은 HTML 로 작성 , HTML 은 문법으로 숨겨진 의미 (Meaning, Semantics) 를 표현하지는 못함

만약 컴퓨터가 , 우리처럼 Meaning 을 이해할 수 있다면 , 우리 ( 사람 ) 의 정보검색 ( 탐색 ) 은 더 풍요로워질 것임

Page 18: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

18

[ 출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]

struc-tured

unstruc-tured

Page 19: 국가서지정보 Open Public Data Platform 구축

Wikipedia Vs Dbpediahttp://en.wikipedia.org/wiki/Samul_nori

http://dbpedia.org/page/Samul_nori

Page 20: 국가서지정보 Open Public Data Platform 구축
Page 21: 국가서지정보 Open Public Data Platform 구축
Page 22: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

22

인간에 대한 예의 공지영

isWrittenBy

소설

type

문학

subClassOf

소설가

type

문학인

subClassOf

시인

subClassOf

isWrittenBy

domain

range

Page 23: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

23

British Library Data Model - Book

Page 24: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

24

BIBFramework

Page 25: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

25

BIBFramework

Page 26: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

26

BIBFramework

Page 27: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

27

Page 28: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

28

도서관 데이터 플랫폼 구축의 특징

• 개념적 접근과 기술적 접근이 동시에 진행

• 개념적 접근 = FRBR, RDA, BIBFRAME

• 단순히 가지고 있는 데이터를 표준언어 , 프로토콜에

맞추어 개방하는 것이 아니라 ‘책’ ‘서지’라는 객체가 갖는

데이터모델로 접근

Page 29: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

29

FRBR

Page 30: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

30

http://dbpedia.org/page/Gwanghwamun

http://ja.dbpedia.org/resource/ 光化門

http://ko.dbpedia.org/resource/ 광화문

http://fr.dbpedia.org/resource/Gwanghwamun

http://es.dbpedia.org/resource/Gwanghwamun

freebase: 광화문

핵심연구과제 : URI 정합성 연구

Page 31: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

31

핵심연구과제 : URI 정합성 연구

Page 32: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

32

ISNI

ISNI

ISNI

ISNI

ISBN

ISAN

ISRC

created-by/creates

ISTCRole: Creator/Author

Role: Adaptor

Role: Performer

Role: Contributor

wri

tten

-by

perf

orm

ed

-by

perf

orm

ed

-by

adapted-by/adapts

performed-by/performs

contributed-by/contributes

abstraction-of/manifestation

contained-in/contains

abstraction-of/performance

핵심연구과제 : URI 정합성 연구

Page 33: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

33

ISNI

ISAN

ISWC

ISRCISTC

ISBN

ISSN IPI

IDA

CSI

ISAN

IPI

VIAF

IPDA

핵심연구과제 : URI 정합성 연구

Page 34: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

34

국립중앙도서관 데이터 플랫폼 구축의 기본 원칙

• Open 이 먼저• 국립도서관의 데이터는 기본적으로 누구나 자유롭게 활용할 수

있는 공공데이터 (Public Data)

• 어떤 형태 , 방식으로든 Open

• Open 하되 되도록이면 개방형 표준을 활용• Linked Data Principle 준수

• Information Ecosystem 에 기여• Web 은 가장 보편화되고 일반적인 Platform 이자 Ecosys-

tem

• Linked data 로 얻는 이득보다 글로벌 데이터베이스 (Web) 세계에 기여한다는 마음이 우선• 개방으로 직접적으로 얻을 수 있는 이득 보다 우리의 데이터가 살아서 누군가에게 새로운 “가능성”을 열어 줄 수 있음을 우선 고려

Page 35: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

35

국립중앙도서관 데이터 플랫폼 구축의 기본 원칙

• 이용자를 생산자로• 단순한 데이터의 개방과 서비스를 넘어 , 데이터를 만들고

자유롭게 활용할 수 있는 Data Literacy 교육

• 도서관 데이터의 시각화가 아니라 ‘이용자’가 갖고 있는 데이터의 조합과 시각화

Page 36: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

36

국립중앙도서관 Data Platform

서지 MARC

저자명 전거 MARC

주제명 DB

디지털서지 (XML) 기타 ( 웹 등 )

구조화된 데이터 비구조화 데이터

RDB API RDF filesRDF Store

국립중앙도서관 데이터 플랫폼

Page 37: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

37

국립중앙도서관 Data Platform

MARC

OAIOpen API

RDFODat

aJA-

SONXML

FOAF, FRBR, SKOS, SIOC, DC, MODS, PREMIS, BibFrame, EDM…

국립중앙도서관 데이터 플랫폼

• 원하는 데이터를 원하는 형태로 , 원하는 Vocabulary/Data Model 로 활용할 수 있도록

Page 38: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

38

기술적 배경 지식 없이 자유롭게 자신의

데이터와 조합하고 Publishing 할 수 있도록

http://www.viewshare.org

국립중앙도서관 데이터 플랫폼

Page 39: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

39

1

2

3

4

국립중앙도서관 데이터 플랫폼

Page 40: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

40

조합 ? Mash-Up?

내 Data

Know-What

Know-How

Know-Where

Know-Why

Know-Who

Know-When

+ ?

Page 41: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

41

조합 ? Mash-Up?

Context

Page 42: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

42

내가 활용하고 싶은 객체의 속성은 무엇인가 ?내가 표현하고 싶은 객체의 속성은 무엇인가 ?다른 사람들은 어떻게 부르고 어떻게 표현하는가 ?

Page 43: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

43

내가 활용하고 싶은 객체의 속성은 무엇인가 ?내가 표현하고 싶은 객체의 속성은 무엇인가 ?다른 사람들은 어떻게 부르고 어떻게 표현하는가 ?

Page 44: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

44

Check Point2. 시맨틱 웹 공공정보 활용에 대한 정확한 시선 필요

• 개방된 공공정보를 활용하면

• 누구나 ‘서울버스’ 앱을 만들 수 있다 ?

• 1 인 기업 , 수익창출 소위 대박의 주인공이 될 수 있다 ?

• 개방만 되면 당장 새로운 세상이 열릴 것이다 ?

• 데이터 서비스 플랫폼에서 누구나 유익한 정보를 얻을 수 있다 ?

• ‘ 내’가 주인공이 되는 정보 세상이 열릴 것이다 ?

Page 45: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

45

서지정보의 미래 : 구조화된 데이터

• 국립도서관의 중요한 역할

• 국립도서관은 정보를 영구보존 합니다 .

책 , 전자책 , CD, DVD, Web Site, Digital File

이 전자책의 제목은 , 저자는 , 출판년도는 , 출판사는 , 주제분야

는 ..

어떤 SW 로 만들어졌고 , 어떤 OS 에서 돌아가고 ,

그 SW 의

업데이트는 언제 이루어졌고 ...

어디에 위치해있고 , 현재 상태는 어떠하고 ...

Page 46: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

46

서지정보의 미래 : 구조화된 데이터

• 도서관이 바라보는 전자책

정보객체(Information Object)

Epub 해석규칙(Epub

Reader)

001011100000111101111110110101010110

표현정보 데이터 객체

Page 47: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

47

서지정보의 미래 : 구조화된 데이터

• Epub, Microsoft 2007 이상• 구조화된 형태로 (XML) 표준 메타데이터를 활용 (DublinCore 등 )

하여

플랫폼 , 애플리케이션 독립적으로 활용이 가능한 디지털 정보 객체

Page 48: 국가서지정보 Open Public Data Platform 구축

공공정보 활용 사업화 전략 세미나 - 대전

48

참고자료

• http://www.flickr.com/photos/taylorsloan/5539665800• http://www.flickr.com/photos/shareconference/5422273956• http://www.flickr.com/photos/eole/2349202525• http://www.flickr.com/photos/gingerkitty/906756839• http://www.flickr.com/photos/charlestilford/2552654321/• http://www.flickr.com/photos/robgallop/514764284• http://www.parentsociety.com/parenting/7-things-parents-say-youll-say-

them-too/

이미지 출처

박진호 , [email protected]

• Kevin Ford, LC’s Bibliographic Framework Initiative: An Updatehttp://3windmills.com/kefo-swib12-bfi/kefo-swib12.pdf

• Sam Oh. 2011. Invited Speech - ISO/TC46 & ISO/IEC JTC1/SC34. 『 LaRC 2011 』 , June 10-11, 2011. [Seoul, Korea : Seoul Olympic Park-tel] www.istandard.or.kr/_custom/ksa/download.jsp?file_id=16779

• 박진호 . ISO Identifier & UCI. 『국가디지털콘텐츠식별체계 (UCI) 세미나 및 활용전략 발표회』 , 2012.10.31. [ 서울 , 한국저작권위원회 ]