교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

12

Upload: han-woo-park

Post on 08-Jan-2017

242 views

Category:

Data & Analytics


5 download

TRANSCRIPT

Page 1: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

Journal of the Korean Data Analysis Society (August 2016)Vol. 18, No. 4 (B), pp. 2067-2078

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원1, 석상일2, 박한우31)

요 약

정부가 생산하고 보유한 데이터를 수집하여 활용하는 기업들이 많아지고 있다. 미국은 플래그

쉽 프로젝트인 ‘오픈 데이터 500’을 통하여 공공 데이터로부터 부가가치를 창출하는 기업들을

발굴하여 적극 홍보하고 있다. 한국에서도 정부 3.0을 통해 공공데이터의 개방과 공유를 추진하

고 있다. 특히 한국에서는 교육관련 데이터의 생성과 축적이 활발하다. 그러나 이렇게 축적된 교

육 관련 데이터를 새로운 가치 창출로 이어가고 있지는 못한 실정이다. 따라서 이 논문은 교육

분야에서 공공 데이터를 선도적으로 활용하는 미국 기업을 국내에 소개하여 우리나라가 새로운

성장 동력을 창출하는데 기여하고자 한다. 연구방법은 홈페이지 피쳐 분석과 코멘션 네트워크

분석이다. 웹 피쳐를 보면, 미국 기업들은 학교 대학 브랜드네임이나 교육의 핵심내용인 커리큘

럼 보다 수요자 맞춤형 장학금 정보나 주변 복지시설과 같은 현실적 정보를 많이 제공하고 있었

다. 네트워크 분석에서는 고등학급의 웹 사이트가 중심에 위치하고 초등학급 사이트는 중심부에

서 벗어나 주변으로 밀려 있었다. 중등학급 사이트는 고등학급과 초등학급을 연결해 줌과 동시

에 고등학급 사이트간의 연결을 해주는 허브역할을 하고 있었다.

주요용어 : 오픈 데이터 500, 공공 데이터, 미국, 교육 기업, 피쳐 분석.

1. 서론

세계적으로 스마트기기의 발달과 온라인망의 확산은 인터넷의 보편화를 가져왔다. 이러한 인터

넷의 보편화와 정부의 행정업무 전산화는 각종 정보의 데이터(data)화를 가능하게 만들었다. 기존에

는 데이터화된 자료들을 단지 저장하는 것에 그쳤으나, 각 선진국에서는 이러한 데이터를 활용하

여 부가가치를 창출하기에 이르렀다. 현재 영국과 미국을 중심으로 유럽 각국에서 오픈데이터 운

동이 활발하게 진행 중인데, 오픈데이터는 정부에 축적된 각종 자료들을 민간에서 다양하게 활용

할 수 있도록 공개한 데이터라 할 수 있다. 각종 자료들과 행정절차의 공개가 미국에서는 오픈 거

버먼트(open government), 오픈 액세스(open access), 오픈 이노베이션(open innovation), 오픈 에듀케이

션(open education), 오픈 날리지(open knowledge)로 나타나고 있으며, 이들은 각각의 전략적 목표에

따라 각 영역에서 실현되고 있다(Davies, Bawa, 2012). 현재 한국에서는 이러한 세계의 흐름과 함께

정부3.0의 핵심가치인 소통, 개방, 공유, 협력을 통해 정부의 공공데이터를 국민에게 개방하고 있

다. 이러한 데이터는 공공데이터 포털(data.go.kr)에서 국민 누구라도 쉽게 접근할 수 있다.

정부를 통해 생성되고 제공되는 교육 영역의 데이터는 상당하며 이러한 데이터들은 한국의 사

교육 및 공교육에서 다양한 가치를 발현할 수 있다. 특히 한국의 사교육 시장은 2012년을 기준으

로, 국가예산의 10%를 넘는 연 34조원으로 상당한 수준인 것으로 나타났다. 이런 한국 교육시장의

1712-749 경북 경산시 대동 214-1, 영남대학교 언론정보학과 박사수료. E-mail : [email protected] 경북 경산시 대동 214-1, 영남대학교 사회학과 박사수료. E-mail : [email protected](교신저자) 712-749 경북 경산시 대동 214-1, 영남대학교 언론정보학과·디지털융합비즈니스학과 교수.E-mail : [email protected][접수 2016년 7월 20일; 수정 2016년 8월 17일; 게재확정 2016년 8월 20일]

Page 2: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2068

비장성적인 성장은 한국인들의 높은 교육열에서 원인을 찾을 수 있다. 수학능력시험의 고득점이

유명대학에 진학할 수 있는 중요한 수단이며, 유명대학으로의 진학이 직업선택과 취업에 유리할

것이라는 사회적 믿음에 그 원인이 있다. 교육열이 높음에 따라 교육관련 데이터들은 교육 데이터

수요자들에게 상당한 가치를 지니고 있으며, 자료의 양도 무수히 증가하고 있으며 이러한 교육 관

련 데이터를 활용할 수 있는 기회 또한 커지고 있는 것이다. 다만 데이터를 활용할 수 있는 환경

과 달리 데이터를 현실적으로 제대로 활용하는 것은 다른 차원의 문제이며 한국에서의 교육 데이

터는 기회에 비해 활용의 정도는 낮다고 볼 수 있다.

Gurin(2014)은 미국 정부에서 제공하는 데이터를 활용한 데이터기업 500곳을 선정한 바 있다. 미

국은 이미 영국과 함께 민간에 데이터를 오픈하여, 적극 활용하고 있는 국가로 볼 수 있다. 미국

공공데이터 기업 중 교육데이터를 활용한 기업의 웹 사이트에 대한 분석은 한국사회에 생성되고

있는 가치 높은 교육데이터의 활용방안을 시사해 줄 것으로 기대된다.

2. 문헌 검토 및 연구문제

2.1. 공공데이터

공공데이터란 정부나 각 기관에서 공개한 오픈데이터이며, 오픈데이터란 웹상에 공개되어 모든

사람이 그 데이터를 자유롭게 사용, 재사용, 재배포가 가능한 데이터를 말한다(open data white

paper: unleashing the potential). 이러한 오픈데이터는 2009년 Tim Benners-Lee의 TED 강연을 통해

주목받기 시작했고, 정부 및 다양한 기관들도 자신들이 보유한 가공하지 않은 원시 데이터(raw

data)를 웹상에 공개하는 것의 중요성을 인식하기 시작하였다(Do, Han, 2013).

공공데이터는 기관·단체 혹은 개인들이 소유하고 있는 데이터를 공개하는 것도 중요하지만 그

목적에 맞게 다양한 출처의 신뢰할 수 있는 데이터를 통합하여 재사용할 수 있게 하고 상호 운용

성을 높여 효과적으로 활용할 수 있도록 해야 한다(Kim, Choi, 2011). 한국은 현재 공공데이터 포

털(data.go.kr)을 통해 정부의 공공데이터를 오픈하고 있으나, 저장된 데이터의 포맷(format)은 각 부

처마다 다소 차이를 보이고 있다. 즉, 데이터의 재사용을 위한 표준화(standardization) 작업이 필요

하며, 이러한 표준화가 진행되지 않으면 축적되는 데이터들을 통합, 활용하기는 쉽지 않다. 여기에

더하여 데이터의 표준화 뿐 아니라 데이터를 어떻게 사용하느냐는 공공데이터 정책의 중요한 이슈

가 될 수 있다. 이러한 표준화와 데이터의 활용에 대한 시사점을 얻기 위해서 공공데이터의 활용

에 적극성을 보이고 있는 국가들의 온라인 웹 사이트의 특성을 분석할 필요가 있으며 이를 통해

한국에서 공공데이터가 앞으로 활용될 수 있는 방향을 찾아 볼 수 있을 것이다.

2.2. 교육 분야 공공데이터 연구동향 및 연구문제

교육 분야 데이터의 강점은 양질의 데이터가 꾸준히 축적된다는 점이며, 이렇게 수집된 데이터

는 정책에서 실질적으로 반영될 수 있다는 점이다. 이에 Kwon(2013)은 학교에서 발생하는 빅데이

터를 활용하여 맞춤형 교육서비스 활성화 방안에 대한 연구를 실시하였으며, 이러한 데이터를 효

율적으로 활용할 수 있도록 각 기관에서 발생하는 교육데이터를 Open API서비스로 구현하는 방법

에 대한 연구(Park, Kim, 2015)도 시작단계에 있다. 또한 스마트 교육에서 발생하는 교육 빅데이터

활용방안에 대한 연구(Choi, Park, Choi, Jeong, Kim, Yoon, 2012)와 공공 데이터와 SNS기반 교육 프

로그램 개발에 관한 연구(Jeong, Kim, Kim, Yoon, Yoo, 2015)도 진행 중이다.

체육교육과 빅데이터를 이용하고자 하는 노력으로 Kim(2014)은 체육 분야의 공공데이터 개방 및

Page 3: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석 2069

무료 체육 시설, 학생체력평가제도 등의 추가가 필요하며, 체육선수이면서 학업을 병행하는 학생선

수들의 학업관리시스템 구축과 일반학생을 위한 체육활동 활성화를 위한 웹로그 분석 및 트렌드

분석이 필요함을 언급하였다. 여기에 빅데이터를 교과목 수준이 아닌 보다 거시적 차원에서 교육

분석(education analytics)에 활용하고자 하는 연구 또한 진행되고 있다. 이와 관련된 연구는 Jeong

(2015)의 연구가 있고 이 연구에서는 교육 분석의 주요한 목적인 학습자의 학습 효율성을 증대하

기 위한 학습 분석(learning analytics)과 교육기관의 효과적 운영을 위해 빅데이터를 이용하는 교육

관리분석(academic analytics)과 같은 빅데이터 분석을 제시하였다. Song(2015)은 빅데이터를 기반으

로 한 STEAM 융합 교육에 대해 연구하였고, Ko, Choi, Park(2014)은 빅데이터를 수학교육에 활동

하는 방법에 대해서 연구하였는데 이상과 같이 교육 분야에서의 빅데이터 및 공공데이터 활용 방

법은 이미 생성된 빅데이터를 교육 분야에 활용하는 빅데이터 기반 교육에 관한 연구에 해당한다

고 볼 수 있다. 결국 이미 다양하게 생성된 교육관련 자료들을 교육적 관점에서 사용하는 교육 자

료로서의 역할에 관심을 가지고 있는 것이다. 다만 Choi, Park, Choi, Jeong, Kim, Yoon(2012)은 스

마트 교육에서 발생하는 빅데이터를 활용하여 다시 학습 분석에 활용하는 방법에 대해서 연구하였

다는 점에서 기존의 연구와 달리 교육현장에서의 데이터 생성 및 활용에도 관심을 가진 연구라 할

수 있다. 이와 같이 현재 한국에서의 연구는 주로 교육 자료로서의 빅데이터에 관심을 가지고 있

거나 교육 분야에서 생성된 데이터를 다시 교육 분석에 활용하는 것에 머문 것으로 교육부분에서

생성된 데이터를 활용하여 수익구조를 형성하는 기업적 활용에는 이르지 못한 것으로 판단된다.

따라서 이러한 현상을 바탕으로 다음의 연구문제를 제기한다.

연구문제 1. 교육데이터를 활용한 미국기업의 웹 사이트는 주로 어떠한 정보를 제공하는가?

연구문제 2. 교육데이터를 활용한 미국기업의 웹 사이트 관계망은 어떻게 나타나는가?

3. 연구방법

3.1. 자료수집

Gurin(2014)은 미국 정부와 협력하여 오픈 데이터를 이용한 미국의 500개 회사를 선정한 바 있다

(opendata500.com). 이 500개 기업 중 교육관련 데이터 기업은 총 19곳으로 나타났다. 하지만 이 논

문에서는 이중 서비스를 중단하거나 폐쇄된 사이트를 제외한 14개 기업 웹 사이트를 분석한다. 미

국의 오픈 데이터에 기반을 둔 기업들에 대한 분석은 학술적 의미뿐만 아니라 정책수립과 비즈니

스 맥락에서도 중요하다. 이런 연유로 선행연구들 가운데 특히 Lee, Park(2015)과 Shin, Park(2015)도

“오픈 데이터 500 기업”을 연구대상으로 선정한 바 있다. 그러나 이 논문은 Table 1에서 제시된 바

와 같이 기존 연구와 차별성이 있다.

앞서의 언급과 같이 연구를 위하여 오픈데이터를 활용하는 14개의 미국 교육관련 기업을 선정

하였으며 사이트는 아래의 Table 2와 같다.

Table 1. Comparing prior studies on open data 500 and current research

Item Research method Sub category

Lee, Park (2015)Qualitative case study on business strategies, T-test for betweennesscentralities and the complexity of business model

Data & Technology

Shin, Park (2015)Infographics based on GIS mapping and visualization, Ego-networkbased on web impact analysis

Health-related

Current ResearchWeb feature analysis on homepages, Network diagram based onco-mentions

Education service

Page 4: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2070

Table 2. Site URL

Company name Url Year founded

Alltuition alltuition.com 2009

BetterLesson betterlesson.com 2008

Cappex cappex.com 2006

CollegeBoard collegeboard.org 1900

ConnectEDU connectedu.com 2002

GreatSchools greatschools.org 1998

How's My Offer hmo.launchrock.com 2014

KidAdmit, Inc. kidadmit.com 2012

Peterson's corporate.petersons.com 1966

PossibilityU possibilityu.com 2010

Ranku goranku.com 2013

SimpleTuition simpletuition.com 2006

U.S. News Schools usnews.com 1983

Unigo unigo.com 2008

3.2. 웹 공간 분석

웹 공간 분석에는 온라인 에스노그래피, 웹 공간 가시화, 웹 콘텐츠 분석, 하이퍼링크 분석, 네

트워크 분석, 피쳐 분석 등이 있다. 이 중 피쳐분석은 웹 사이트 운영자가 전개하는 다양한 사이버

활동에 대한 온라인 구조를 파악할 수 있으며, 다양한 분야에서 웹 사이트의 특성을 파악하기 위

하여 자주 사용되는 방법이다(Park, Han, Choi, Kim, Mirandilla, 2006; Ha, Kim, Park, 2012).

Park, Han, Choi, Kim, Mirandilla(2006)는 2004년 필리핀의 선거 웹 사이트를 대상으로 웹 공간을

피쳐 분석하여 웹 사이트 운영자의 활동에 대한 온라인구조를 확인하였다. 또한 Ha, Kim, Park

(2012)은 한국 일본 신문사 사이트를 웹 피쳐 분석하여, 일본의 신문사 웹 사이트에 비해 한국 신

문사 웹 사이트가 독자들과의 소통 뿐 아니라 소셜미디어, 블로그를 적극 활용하고 있다는 사실을

알아내었다. Kim, Choi, Park, Tkach-Kawasaki(2007)는 한국과 일본의 정치인 웹 사이트를 웹 피쳐

자료를 통하여 비교 분석하였다.

교육 분야 웹 사이트 분석의 코딩을 위해 기존 연구들(Park, Han, Choi, Kim, Mirandilla, 2006;

Kim, Choi, Park, Tkach-Kawasaki, 2007)을 토대로 교육과 관련된 정보들을 각 항목으로 재구성하였

다. 대상 웹 사이트 코딩 날짜는 2015년 6월 13일이며, 두 명의 코더가 해당 웹 사이트에서 확인할

수 있는, 아래의 Table 3에 분류된 해당항목에 대한 적당한 정보가 있을 경우 1, 없을 경우 0으로

표시하는 빈도분석을 실시하였으며, 두 코더의 빈도분석의 결과 코더 간 일치도는 100%로 나타났

다.

3.3. 웹보메트릭스 분석

웹 사이트간의 연결 관계를 통해 각 사이트간의 관계를 확인할 수 있다. 이러한 연결망 분석은

대표적으로 웹보메트릭스 분석을 이용한다. 웹보메트릭스 분석은 웹에서 나타난 실제적 데이터를

수집하여 연구대상에 대한 자료를 계량적으로 측정 하는 것으로, 웹상에서 나타난 동시언급을 분

석하기 위해 영국의 Thewall(2014)교수가 개발한 것이다. 사이버 공간에서의 두 행위자 간의 직접

적, 간접적 관계로부터 찾을 수 없었던 숨겨진 네트워크를 분석하는 것에 효과적인 방법이다. 즉,

이러한 네트워크 분석을 통해 각 개체들 사이에 맺고 있는 관계나 메시지, 정보의 흐름 등의 패턴

Page 5: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석 2071

이나 규칙성을 찾아낼 수 있다(Park, Park, 2014). Park, Lee(2008)는 17대 대통령 선거에 나타난 인

터넷의 역할과 이용에 대해 웹 계량 분석과 네트워크 분석을 통해 연구하였고, Nam, Lim, Park

(2011)은 지난 2010년 6월 지방선거에서 정치운동 기간 동안 온라인 플랫폼에 따른 웹 가시성 계

량분석을 실시하였다.

Table 3. Cording category

Cording category Detail

Location

It means geographical information of education institution, The locationinformation refers to a service that provides visitors with physical presence(Noh, Min, 2011). Address and location information are offline contactsbetween business objects and customer(Jang, 2010),

Admission fee & ScholarshipScholarship information that may be required when applying for admissionor enrollment fee information for each institution

Registered student & Teacherpresent condition

Status information for the teachers to educate students that are currentlyenrolled or students of each institution .

Studying supportEducational information provided to learn directly from each institution

through online

A teaching method Information about the teaching of educators

School review Preview or rating information for each institution.

School class

Elementary school Elementary school before graduation (Up to 12 years)

Junior high school Attending junior high school (13 to 16 years)

High school After attending high school (after 17 years)

본 연구에서 교육기업들의 네트워크 분석을 위해, 웹 사이트 주소가 동시에 언급된 사이트를 찾

아내고, 각 기업의 사이트들 간의 연결정도를 조사한다. Co-mention 분석에서는 기업들의 웹 사이

트가 서로 동시에 언급될수록 강한 연결을 가지고 있다고 볼 수 있으며 이에 이 논문은

Co-mention 분석을 통하여 각 교육관련 웹 사이트 간의 연결망을 살펴보고자 한다. Co-mention 네

트워크와 사용된 중심성 개념은 Table 4에 정리되어 있다.

Table 4. Co-mention network analysis and centralities

Item Explanation

Co-mention networkanalysis

Network diagrams and their indicators based on the number of external sites referringto a pair of target sites. The co-mentions show something important in common butare not directly related to each other. Co-mention does not have a direction.

Degree centralityThe number of nodes (in this case, websites) adjacent to a given node (website) insymmetric network is the degree of that node

Eigenvector centralityOne of several nodal metrics that characterize the global prominence of a node in anetwork

Betweenness centralityGeodesics linking node j and node k which pass through node i counts the numberof shortest paths between i and k that actor j resides on

Source: compiled table based on Srijana, Park(2016) and Lee, Park(2015).

4. 연구 결과

첫째, Table 5에 정리되었듯이 피쳐분석 결과 교육데이터를 활용한 웹 사이트의 대부분은 입학

금 및 장학정보를 가장 많이 제공하고 있었다. 두 번째로 재학생 및 교사현황에 대한 정보를 제공

하고 있었으며, 학교평가 위치정보를 그 다음으로 많이 제공하고 있었다. 그에 비해 학습지원이나

교수방법정보 등에 대한 정보 제공은 현저히 떨어졌다. 즉 교육데이터를 활용한 웹 사이트에서 제

Page 6: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2072

공하는 피쳐는 교육 콘텐츠에 대한 정보가 아니라 학교의 입학과 관련된 정보가 주로 나타났다.

또한 초등이나 중등에 비해 고등교육에 관련된 정보에 대한 자료를 현저하게 많이 제공하고 있었

다. 따라서 미국 사이트의 경우 고등교육 입학정보 활용에 치우쳐 있음을 발견하였다.

Table 5. Cording result

Cording category Frequency

Location information 7

Admission fee & Scholarship 10

Registered student & Teacher present condition 8

Studying support 1

A teaching method 1

School review 7

School class

Elementary school 1

Junior high school 2

High school 11

구체적으로 각 사이트의 위치정보는, 해당 학교의 학교명을 검색하면 학교의 구체적 주소와 함

께 지도위에 위치가 표시되어 나타나도록 구성되어 있었다. 입학금 및 장학정보, 재학생 및 교사현

황 또한 학교명을 검색하면 학교의 기본정보로 제공되었다. 마찬가지로 학교평가도 학교명을 검색

할 경우에 나타나게 된다. 이 학교평가는 각 사이트가 제공하는 평가항목에 사용자가 응답하는 방

식으로 작성되어 평점으로 나타나 있다.

Cappex의 경우 사이트 방문 후 본인의 GPA, ACT/SAT Score를 입력하고 성별과 주소를 입력하

면, 대출 가능한 회사를 추천받고 난 다음 회원가입이 완료된다. 가입완료 후에는 본인의 지망 대

학의 합격여부를 나타내주는 Scattergram을 제공해 준다. 대학교의 위치정보는 구글 지도 API를 이

용하여 제공하고 있으며, 재학생 현황과 교직원 현황, 입학금 정보가 제공되고 있다. 장학정보는

학교나 정책별로 제공되는 것과 Cappex자체에서 제공하는 장학금으로 분류되어 있다. Student

Review란을 통해 별점으로 학교를 평가하고 코멘트를 자유롭게 남길 수 있어, 학교에 지원하고자

하는 누구라도 확인 가능하게 되어있다. 특히 교육 데이터 이외에도 대학교의 현재 기온과 평균

기온, 본인 거주지의의 현재 기온과 평균 기온을 막대그래프 형태로 제공하고 있으며, 대학교 주변

의 레스토랑 전화번호 및 주소와 평가·쇼핑·피트니스클럽·지역의 밤 문화에 대한 정보도 함께 제

공하고 있다. 캠퍼스의 사이즈와 남녀 간 스포츠 활동 비율도 제공한다.

BetterLesson은 교육과 관련된 교수법이나 학습방법을 제공한다. 각 아이템은 샘플형태로 제공되

며, 이를 원할 경우 데모를 요청할 수 있다. 제공되는 자료들은 동영상과 글·그림 등 다양한 형태

이며, 동영상의 경우 유튜브(youtube.com)에 업로드 되어 사이트에 연동되는 방식이었다.

CollageBoard의 경우 위치정보를 구글 지도 API를 통해 제공하고 있으며, 주변에 있는 대학의 위

치도 함께 보여주는 기능도 제공한다. 캠퍼스 사이즈와 학생 현황을 인종·성비·출신지·평균나이 등

으로 세분화하여 나타내고 있다. 입학점수를 제공하며, 입학금 및 장학금 정보를 제공한다. 또한

학교 간 간략한 정보들을 한 번에 비교할 수 있는 메뉴를 따로 제공하고 있다. ConnectEDU는 학

교를 개인적인 사정으로 다니지 못하게 되거나 출석미달로 졸업장을 받지 못하고 사회로 나가게

된 인력에 대해 다시 학습할 수 있는 기회와 졸업장을 다시 받을 수 있는 회생 방법을 소개하는

사이트이다. 멘토링 및 각종 회생 프로그램과 연계할 수 있는 통로 역할을 한다. GreatSchools는 유

치원·초등학교 정보로 학교 평가와 학교의 주소, 근처 학교를 쉽게 찾을 수 있도록 구성되어 있다.

Page 7: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석 2073

학교 내 수학과 영어 시험 성적 등을 제공하며, 학년별 수업에 사용하는 학습 자료를 출력 가능하

도록 제공하고, 학년별 과목별 교육법도 마찬가지로 저장이나 출력이 가능하게 제공하고 있다.

Ranku는 시애틀의 정보를 기반으로 온라인 학위등록을 도와주는 소프트웨어 회사이다.

SimpleTuition은 대학교 장학금과 학자금대출 전문 사이트로 대학 입학의 경제적인 지원 부분에 집

중되어 있는 사이트이다. 본인의 정보인 거주지, 학점 등의 상세내역을 입력할 경우 이에 해당하는

학교와 장학정보를 제공해 준다. U.S. News Schools는 각종 뉴스를 다루는 사이트로 교육 분야는

한 섹션으로 분류되어 있으며. 최고의 고등학교나 대학교를 선정하고 학교의 순위를 매긴다. 순위

권 대학교의 입학금 정보와 재학생 비율을 제공하며, 로그인할 경우 입학성적 정보와 같은 고급정

보를 추가로 제공한다. 또한 교직원 비율과 재학생 정보, 스포츠 활동 정보를 제공하고 있다. 각

학교의 위치정보는 구글 지도 API를 이용해 나타내고 있다. 특히 학교 내외부에서 발생하는 범죄

정보를 상세히 제공하고 있다. UniGo는 관심 대학을 검색하면 학교의 리뷰와 캠퍼스 사이즈, 학교

연락처, 입학금 및 장학정보, 재학생정보인 학생 수, 학생성비와 구글 지도 API를 이용한 학교위치

정보, 입학성적 정보를 제공한다.

두 번째로 웹 사이트 간의 연결망을 파악하기 위하여 웹보메트릭스를 활용한 Co-mention 분석을

실시하였다. Co-mention 분석은 Figure 1과 같은 과정을 거쳐 이루어지며 이 과정을 통해 분석된

결과는 Figure 2와 같다.

1. List up websites underinvestigation per line

2. Choose option, “Text NetworkDiagram” in Webometric Analyst 2.0

3. Co-mention diagram isautomatically shown. One canconduct many networkanalyses using .net files.Please familiarize yourselfwith Pajek, UciNet, NodeXL,Gephi, etc.

Figure 1. Visual flow of collecting co-mentions between a pair of sites

Figure 2는 각 웹 사이트별 Co-mention 관계를 시각화한 것으로, 노드(node)는 14개이며 총 유니

크(unique) 링크는 104개로 나타났다. 각 사이트별로 많은 연결이 있을수록 선이 굵고, 노드의 크기

도 크다. 노드의 색깔과 크기는 학교 급에 따라 다르게 나타내었다. 파란색이며 네모 모양은 고등

학급, 연두색이며 세모 모양은 중등학급, 주황색이면서 원 모양은 초등학급 교육 자료를 바탕으로

한 사이트이다. 사이트의 네트워크를 나타낸 결과 CollegeBoard, UniGo, Cappex, USnews는 서로 강

하게 연결되어 있음을 확인할 수 있었다. 이 네 개 사이트들은 모두 고등학급 정보를 제공하고 있

었으며, 다른 고등학급 정보제공 사이트들보다도 사용자 측면에서 사용하기 편리하고, 각종 데이터

들을 매쉬업(mash up)하여 사용자의 흥미를 유발하고 있었다. 유일하게 초등학급의 정보를 제공하

Page 8: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2074

는 KidAdmit, 초·중등학급 정보를 제공하는 GreatSchools와 BetterLesson과의 연결만을 확인할 수 있

었다. 중등학급은 초등학급과 고등학급을 연결해주는 중간자인 동시에, 의무교육에서 자율교육형태

로 넘어가는 전환점 역할을 하고 있었다. 특히 GreatSchools는 고등교육으로 넘어가는 발판이 되고

있음을 확인할 수 있다.

Figure 2. Co-mention network

Table 6. Values of centrality

Site Degree Betweenness Eigenvector

alltuition.com 2.600 0.160 0.015

betterlesson.com 4.600 4.647 0.020

cappex.com 47.600 0.900 0.439

collegeboard.org 77.800 0.527 0.573

connectedu.com 7.400 0.900 0.055

greatschools.org 24.600 7.952 0.227

kidadmit.com 0.400 0.000 0.001

corporate.petersons.com 16.400 0.000 0.169

possibilityu.com 2.600 0.160 0.017

simpletuition.com 13.200 0.900 0.115

usnews.com 61.200 0.900 0.480

unigo.com 40.800 0.900 0.389

Table 6을 보면, 사이트별 Betweenness는 GreatSchools가 가장 높고, 그 다음으로 BetterLesson이었

다. 이것은 두 사이트가 다른 사이트들을 상호 매개하는 역할을 한다는 것을 의미한다. 네트워크상

에서도 나타나듯이 중등학급 교육정보는 초등학급이나 고등학급을 연결해주는 허브역할을 하고 있

Page 9: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석 2075

다. 분석대상이 된 웹 사이트가 초등교육이 아니라 고등교육 분야에 특화됨에 따라 KidAdmit가 네

트워크로부터의 고립되는 것에 영향을 준 것으로 보인다. Degree와 Eigenvector는 CollegeBoard와

USnews가 가장 높게 나타났다. 이것은 코멘션 관계가 방향성이 없는 네트워크이므로 크게 놀랄만

한 현상은 아니다. 즉 Degree 값은 직접적으로 이웃을 맺은 노드-여기에서는 동시에 언급된 웹 사

이트가 많을수록 높아지는 속성이 있다. 그리고 Eigenvector 값은 비대칭적 매트릭스에서 위세 중심

성을 나타내는 지표이기 때문에, Degree 값과의 상관성이 높은 경향이 있다.

Table 7. Correlation between network centrality values

Item Degree Betweenness Eigenvector

Degree 1.000 -.052 .988**

Betweenness 1.000 -.037

**Significant at p < 0.01

다음은 네트워크 중심성 값을 이용하여 통계분석을 실시하였다. Table 7에 정리된 분석결과를

보면, Degree-Eigenvector의 Pearson 상관계수 값이 통계적으로 유의한 수준에서 .988로 나타났다.

Eigenvector의 계산방식이 Degree가 높은 사이트와 직·간접적으로 연결된 정도에 기초하므로 크게

놀라운 현상은 아니다. 그렇지만 Betweenness가 Degree, Eigenvector와 유의한 상관성을 보이지 않은

것은 흥미롭다. 왜냐하면 Co-mention 네트워크에서 다른 사이트로 가는 통로 역할을 하는 중개자

사이트가 마당발인 것은 아니기 때문이다.

5. 결론 및 논의

본 논문에서는 교육데이터를 활용한 미국의 사이트들은 어떻게 활용하고 있는지 살펴보고, 사이

트 간 연결을 확인해 보았다. 그 결과 미국의 경우 진학에 있어서 수요자 맞춤형 입학정보와 장학

정보를 상당량 제공하고 있다는 것을 확인했다. 특히 대학교 스포츠 활동과 주변 복지 시설 등의

정보를 상세히 제공하는 것으로 보아, 대학 진학 시 개인의 생활 만족도에 비교적 높은 비중을 두

고 있다는 것을 알 수 있었다. 사이트 연결에서는 고등학급 간 연결이 두꺼웠는데, 이는 사용자가

사용하기 쉽고 편리한 사이트 중, 고등교육 정보에 높은 관심을 두고 있다는 것을 나타낸다. 중등

교육사이트는 상대적으로 그 수가 적었지만, 고등교육과 초등교육을 연결해주고, 같은 고등교육 사

이트들을 연결해주는 허브 역할을 하고 있었다.

정부 3.0 개방정책으로 다양한 데이터들이 공개되고 있다. 빅데이터의 중요성을 강조하며, 정부

에서도 빅데이터 분석·활용센터를 구축하였다. 하지만 기술적 인프라만을 구축하는 데만 초점을

맞추고 있다면 우려스러운 일이다(Park, 2013). ‘오픈’된 데이터를 분석할 수 있는 지식을 교육하고,

균등한 기회를 보장하여, 미국과 같은 교육데이터를 활용한 기업이 등장해야 한다.

정부가 보유·관리하던 데이터의 빗장을 단순히 열어놓는다고 해서 정부 3.0이 실현되지 않는다

(Park, 2013). 데이터의 가치를 파악하고, 다양한 사례를 확인함으로써, 데이터 활용에 대한 통찰력

을 키워야 한다. 특히 교육을 중시하는 한국에서의 교육데이터는 더 없이 중요한 가치를 지닌다.

따라서 앞으로 교육데이터 활용에 대한 다양한 사례를 더욱 다양하게 살펴보아야 할 것이다.

References

Choi, J. Y., Park, C. S., Choi, K. S., Jeong, E. S., Kim, S. J., Yoo, I. S. (2012). Applications of educational bigdata generated in smart education, Korea Intelligent Information Systems Society, 144-148. (in Korean).

Page 10: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2076

Davies, G. T., Bawa, A. Z. (2012). The promises and perils of open government data (OGD), The Journal ofCommunity Informatics, 8(2), http://www.ci-journal.net/index.php/ciej/article/view/929/955.

Do, S. K., Han, S. E. (2013). A study on linked data publishing of open data in Seoul museum of history, KoreaSociety for Information Management, 119-122. (in Korean).

Gurin, J. (2014). The open data 500: Puttting research into action, Open Data Now.

Ha, Y. J., Kim, J. Y., Park, H. W. (2012). A comparative study of newspaper websites between South Korea andJapan, Donga Humanities, 21, 255-273. (in Korean).

Jang, T. W. (2010). A study on integration and application plans of address and location information, Society fore-Business Studies, 15(2), 93-105. (in Korean).

Jeong, Y. H. (2015). Education analytics, Journal of Media & Education, 5(1), 44-49. (in Korean).

Jeong, Y. W., Kim, J. H., Kim, H. J., Yoon, J. W., Yoo, D. Y. (2015). Smart education data analysis based onSNS utilizing big data, Korean Institute of Information Scientists and Engineers, 1515-1517. (in Korean).

Kim, J. S. (2014). Research on the application methods of big data within school physical education, The KoreanJournal of Physical Education, 53(4), 555-563. (in Korean).

Kim, H. L., Choi, J. H. (2011). The state of the art : Open government data - the semantic web perspective, Thee-Business Studies, 12(3), 371-393. (in Korean).

Kim, H. D., Choi, K. H., Park, H. W., Tkach-Kawasaki, M. L. (2007). A comparative analysis of politicianwebsites in Japan and South Korea using website feature data, Journal of the Korean Data Analysis Society,9(5), 2507-2520. (in Korean).

Ko, H. K., Choi, Y. W., Park, S. J. (2014). Study on big data utilization plans in mathematics education,Communications of Mathematical Education, 28(4), 573-588. (in Korean).

Kwon, Y. O. (2013). Data analytics in education : Current and future directions, Journal of Intelligence andInformation Systems, 19(2), 87-100. (in Korean).

Lee, J. S., Park, H. W. (2015). Case study of open data companies in the United States and their businessnetworks, Journal of the Korean Data Analysis Society, 17(5B), 2525-2536. (in Korean).

Nam, Y. J., Lim, Y. S., Park, H. W. (2011). Web visibility quantitative analysis of the online platform duringpolitical campaigning, Internet Social Media Institute. (in Korean).

Noh, D. J., Min, S. H. (2011). A study on the state of the service-based library 2.0 through web site analysis ofKorean university libraries, Journal of Information Management, 42(4), 195-223. (in Korean).

Park, H. W. (2013a). Government 3.0 prerequisites for success, Imaeil. (in Korean). http://www.imaeil.com/sub_news/sub_news_view.php?news_id=41164&yy=2013

Park, H. W. (2013b). Right direction of big data analysis and utilization center, Imaeil. (in Korean). http://www.imaeil.com/sub_news/sub_news_view.php?news_id=26193&yy=2013

Park, H. W., Han J. E., Choi, K. H., Kim, H. D., Mirandilla, A. K. (2006). Web space analysis on the 2004Philippine elections website, Information Policy, 13(1), 17-31. (in Korean).

Park, P. W., Kim, W. Y. (2015). A study on government 3.0 based method for implementing open API service ofeducation data, Journal of Security Engineering, 12(1), 97-108. (in Korean).

Park, H. W., Lee, Y. O. (2008). Examining the role of the internet during the 2007 presidential election of SouthKorea - on the basis of webometrics and network analysis-, Information Policy, 15(3), 45-64. (in Korean).

Park, J. W., Park, H. W. (2014). Social network analysis among Facebook fanpage co-commenters:Daegu-Gyeongbuk’s mayor·governor candidates, Journal of the Korean Data Analysis Society, 16(6),3243-3253. (in Korean).

Shin, H. K., Park, H. W. (2015). Ego network analysis of open data in United States healthcare companies, Journalof the Korean Data Analysis Society, 17(6B), 3107-3118. (in Korean).

Song, D. J. (2015). Based big data STEAM fusion education, Industrial Engineering Magazine, 22(2), 48-50. (inKorean).

Srijana, A., Park, H. W. (2016). Open data in Nepal: A webometric network analysis, Quality & Quantity, DOI

Page 11: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석 2077

10.1007/s11135-016-0379-1

Thelwall, M. (2014). Big data and social web research methods. University of Wolverhampton. http://www.scit.wlv.ac.uk/~cm1993/papers/IntroductionToWebometricsAndSocialWebAnalysis.pdf.

www.opendata500.com

Page 12: 교육 오픈 데이터를 활용한 미국 기업의 웹 사이트 분석

박지원, 석상일, 박한우2078

Web Feature and Co-mention Analyses of Open Data 500

on Education Companies

Ji Won Park1, Sang Il Seok2, Han Woo Park32)

Abstract

Open data in a digital and machine readable format has been increasingly used for

business purpose because it is free of restriction on use or redistribution and can be

combined together with other data in order to produce a new service and product. Current

study examines the education companies identified in the U.S. list of open data 500 using

both web feature and co-mention analyses. It differs from previous open data 500 studies

(Lee, Park, 2015; Shin, Park, 2015) in terms of research method and sub-category. As

results, U.S. companies provided their visitors with more financial information (e.g., tuition

and scholarship), sport facilities, and welfare services than educational curriculum and school

reputation. University-related sites including ranking companies occupy more central positions

than other sites in co-mention network. The results suggest that policy makers responsible

for Korean government 3.0 programs should seek to develop some both value-added public

service and private business from open government data campaign. By doing so, (venture)

companies in Korea are more likely to take a risk in order to take advantage of open data

on the operation of universities.

Keywords : Open data 500, Public data, United States of America, Education company,

Feature analysis.

1Ph.D. Candidate, Dept of Media & Communication, YeungNam University, 214-1, Dae-dong,Gyeongsansi, Gyeongsangbuk-do 712-749, South Korea. E-mail : [email protected]

2Ph.D. Candidate, Dept of Sociology, YeungNam University, 214-1, Dae-dong, Gyeongsansi,Gyeongsangbuk-do 712-749, South Korea. E-mail : [email protected]

3(Corresponding Author) Professor, Dept of Media & Communication and Digital Convergence Business,YeungNam University, 214-1, Dae-dong, Gyeongsan-si, Gyeongsangbuk-do 712-749, South Korea.E-mail : [email protected][Received 20 July 2016; Revised 17 August 2016; Accepted 20 August 2016]