‘저비용 고효율’ sns로 여론 읽기download.kpf.or.kr/mediapds/ljzhqhstpqefxcb.pdf ·...

5
084 ‘저비용 고효율’ SNS로 여론 읽기 박한우 영남대 언론정보학과 교수, 사이버감성연구소장 소셜 여론조사의 실제와 과제 소셜미디어의 확산과 함께 시민은 제도 정치의 주요 한 과정인 선거뿐만 아니라 국가 정책 및 사회 현안 전반에 직·간접적으로 막대한 영향력을 미칠 수 있게 되었다. 특히 스마트폰과 SNS의 대중화는 ‘네트워크 화 된 개인’의 출현을 가능하게 했다. 이 새로운 시민 계층이 소셜미디어를 통하여 형성한 이른바 ‘소셜 여 론’은 정치 체제를 흔드는 집합행동의 촉매제가 될 뿐 아니라 기업의 평판을 좌우하는 나침반이 되었다. 소 셜 여론은 현실 사회에 실질적인 영향력을 발휘하는 능동적 담론으로 기능한다. 소셜 데이터 어떻게 수집할까 소셜 미디어라는 플랫폼이 가지는 여러 기술적 특성 상 소셜 공간에서 유통되는 사회·문화적 담론을 파악 하기 위해서는 새로운 조사도구와 분석기법이 필요 하다(이석수, 2011). 영남대 WCU웹보메트릭스사업 단 및 사이버감성연구소에서 발간한 ‘인터넷 소셜미 디어 개론’(박한우, 2011a)은 소셜미디어 조사·분석 의 이론적 관점뿐만 아니라 상세한 절차와 구체적 사 례를 담고 있어 참고할 만하다. 여기에서는 이 책에서 소개한 내용을 바탕으로 최근의 국내외 자료를 추가 하여 소셜미디어 조사·분석 방법을 말하되, 주요 이 슈를 중심으로 설명하기로 한다. 소셜 여론 분석의 구 미디어 포럼 소셜미디어 조사·분석의 이론적 관점뿐만 아니라 상세한 절차와 구체적 사례를 담고 있는 ‘인터 넷 소셜미디어 개론’

Upload: others

Post on 30-Aug-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ‘저비용 고효율’ SNS로 여론 읽기download.kpf.or.kr/MediaPds/LJZHQHSTPQEFXCB.pdf · nodexl.codeplex.com). XL은 우리에게 친숙한 마이 크로소프트사 엑셀

084

‘저비용 고효율’ SNS로 여론 읽기

박한우 영남대 언론정보학과 교수, 사이버감성연구소장

소셜 여론조사의 실제와 과제

소셜미디어의 확산과 함께 시민은 제도 정치의 주요

한 과정인 선거뿐만 아니라 국가 정책 및 사회 현안

전반에 직·간접적으로 막대한 영향력을 미칠 수 있게

되었다. 특히 스마트폰과 SNS의 대중화는 ‘네트워크

화 된 개인’의 출현을 가능하게 했다. 이 새로운 시민

계층이 소셜미디어를 통하여 형성한 이른바 ‘소셜 여

론’은 정치 체제를 흔드는 집합행동의 촉매제가 될 뿐

아니라 기업의 평판을 좌우하는 나침반이 되었다. 소

셜 여론은 현실 사회에 실질적인 영향력을 발휘하는

능동적 담론으로 기능한다.

소셜 데이터 어떻게 수집할까

소셜 미디어라는 플랫폼이 가지는 여러 기술적 특성

상 소셜 공간에서 유통되는 사회·문화적 담론을 파악

하기 위해서는 새로운 조사도구와 분석기법이 필요

하다(이석수, 2011). 영남대 WCU웹보메트릭스사업

단 및 사이버감성연구소에서 발간한 ‘인터넷 소셜미

디어 개론’(박한우, 2011a)은 소셜미디어 조사·분석

의 이론적 관점뿐만 아니라 상세한 절차와 구체적 사

례를 담고 있어 참고할 만하다. 여기에서는 이 책에서

소개한 내용을 바탕으로 최근의 국내외 자료를 추가

하여 소셜미디어 조사·분석 방법을 말하되, 주요 이

슈를 중심으로 설명하기로 한다. 소셜 여론 분석의 구

미디어 포럼

소셜미디어 조사·분석의 이론적

관점뿐만 아니라 상세한 절차와

구체적 사례를 담고 있는 ‘인터

넷 소셜미디어 개론’

Page 2: ‘저비용 고효율’ SNS로 여론 읽기download.kpf.or.kr/MediaPds/LJZHQHSTPQEFXCB.pdf · nodexl.codeplex.com). XL은 우리에게 친숙한 마이 크로소프트사 엑셀

신 문 과 방 송 2012 07 085

체적 절차를 그림과 함께 살펴보려면 책을 참고하기

바란다.

소셜 여론조사에서 가장 많은 사람이 질문하는

것이 어디에서 데이터를 수집하는가이다. 대답은 의

외로 간단하다. 우리가 매일 사용하는 검색엔진이다.

검색엔진을 이용한 소셜 데이터 수집의 방법은 크게

세 가지로 구분된다.

첫째, 특정한 소셜미디어를 제공하는 서비스

사업자가 이용자의 편의를 위해서 마련한 검색메

뉴에서 특정한 검색어를 가지고 데이터를 수집하

는 것이다. 예를 들어 트위터 본사는 현재 어떤 정

보가 유통되는지 알려주는 사이트 https://twitter.

com/#!/search-home를 운영한다. 고급검색 메뉴

인 https://twitter.com/#!/search-advanced에 가

면 불리언(boolean) 연산자를 이용한 검색어 조합뿐

만 아니라 언어별, 이용자별, 장소별, 감성별 세부 검

색도 가능하다. 페이스북은 http://www.facebook.

com/search/results.php에서 이용자, 페이지, 장

소, 그룹, 애플리케이션, 이벤트, 친구 포스트, 공개 포

스트, 그룹 포스트 등을 수집할 수 있다. 미투데이도

http://me2day.net/search에서 포스트, 태그, 사진,

동영상, 기간, 위치별로 검색기능을 제공한다.

둘째, 서비스 사업자가 제공하는 검색메뉴가 아

니라 전문검색엔진을 이용하는 것이다. 네이버 검

색엔진으로는 국내 200여 개 언론사 뉴스를 실시간

으로 검색할 수 있다. 또한 네이버가 운영하는 블로

그 이외에도 RSS로 작성된 한글 블로그 포스트를 광

범위하게 수집할 수 있다. 데이터 수집이 상대적으

로 어렵다고 알려진 SNS 데이터는 Google과 Bing

에서 특정 웹사이트 검색기능을 활용하면 된다. 즉,

‘소녀시대’를 언급한 트윗이나 페이스북 포스트를 찾

기 원하면 ‘소녀시대 site:twitter.com’ 혹은 ‘소녀시

대 site:facebook.com’에 입력하면 된다. 특정 페

이스북 계정에서 정치인 박근혜와 관련된 동향을 파

악하기를 원할 때는 ‘박근혜 site:facebook.com/

smarthannara’라고 검색하면 관련 데이터를 수집할

수 있다. 사회연결망분석(Social Network Analysis)

소셜 분석도구 ‘트리움’ 홈페이지(위) 트위터는 현재 어떤 정보가 유통되는지

알려주는 사이트를 운영한다(가운데). 미투데이는 포스트, 태그, 사진,

동영상, 기간, 위치별로 검색기능을 제공한다(아래).

Page 3: ‘저비용 고효율’ SNS로 여론 읽기download.kpf.or.kr/MediaPds/LJZHQHSTPQEFXCB.pdf · nodexl.codeplex.com). XL은 우리에게 친숙한 마이 크로소프트사 엑셀

086

소셜미디어는 진화하는 기술이다. 따라서 다양한 데이터 수집기법이 존재한다.

소셜 데이터마다 접근의 범위와 깊이가 다르고 언어별로 데이터의 색인화 수준도

차이가 있다. 인터넷이 지닌 정보의 확장성은 소셜 여론조사의 측정을

더욱 어렵게 만든다. 그러므로 데이터 수집 및 해석에 주의를 기울여야 한다.

을 위해서 소녀시대와 원더걸스를 동시에 언급한 트

윗을 수집하려면 ‘소녀시대 원더걸스 site:twitter.

com’라고 하면 된다. 이것은 페이스북 검색에도 마찬

가지로 유효하다. 특히 검색엔진을 이용하면 조사목

적에 맞는 기간을 설정할 수 있어 특정 여론의 변화를

추적하는 종단분석에 용이하다.

전문 조사도구도 등장

셋째, 전문적인 소셜미디어 조사도구를 활용하는 경

우이다. 먼저 영국의 털월(M. Thelwall) 교수가 개

발한 ‘웹보메트릭 애널리스트’(WA: Webometric

Analyst)가 있다. WA는 http://lexiurl.wlv.ac.uk에

서 무료로 다운로드받을 수 있다. WA에는 다양한 기

능이 있다. 가장 큰 장점은 소셜미디어에서 API를 이

용하여 데이터를 자동으로 수집할 수 있다는 점이다

(박한우, 2009, 2010a). 연구자는 분석목적에 맞게

수집된 데이터를 정제한 후 ‘웹영향력보고서’(Web

Impact Report) 기능을 통해 결과를 정리 및 분석할

수 있다. WA는 Bing을 비롯하여 기존 검색엔진이 저

장한 웹 정보를 수집·처리할 뿐만 아니라 유튜브, 페

이스북, 트위터, 플리커 등 여러 소셜미디어에서 특정

이슈의 빈도 및 상호연결망을 보여주는 데이터를 수

집·처리할 수 있는 종합적 도구이다. 영어 메시지는

감성분석도 가능하다. 하지만 영어로만 간단한 매뉴

얼을 제공하기 때문에 활용에 어려움이 많다.

다음으로 미국의 스미스(M. Smith) 박사팀이

개발한 ‘노드엑셀’(XL: NodeXL)이 있다(http://

nodexl.codeplex.com). XL은 우리에게 친숙한 마이

크로소프트사 엑셀 프로그램에 추가로 무료 설치할

수 있는 소프트웨어이다. WA와 마찬가지로 XL도 트

위터, 페이스북, 유튜브, 플리커 등 다양한 소셜 채널

에 접근하여 필요한 데이터를 자동적으로 수집할 수

있다. XL의 가장 큰 장점은 수집된 데이터를 이용하여

사회연결망 분석을 동시에 수행할 수 있다는 점이다.

나아가 네트워크 차트 기능이 탑재되어 있어서 시각

화가 용이하다. 최근에는 의미연결망분석(Semantic

Network Analysis) 기능을 추가하여 사회적 이슈를

담론 관계망으로 표현하는 것도 가능해졌다. XL의 단

점은 마이크로소프트 체제에서만 구동되며 시각화

등 여러 기능을 동시에 사용하면 많은 메모리가 소요

된다는 점이다.

이외에도 소셜미디어 조사도구로 ‘디스커

버텍스트닷컴’(http://discovertext.com), ‘이슈

크롤러’(https://www.issuecrawler.net), ‘DMI

Page 4: ‘저비용 고효율’ SNS로 여론 읽기download.kpf.or.kr/MediaPds/LJZHQHSTPQEFXCB.pdf · nodexl.codeplex.com). XL은 우리에게 친숙한 마이 크로소프트사 엑셀

신 문 과 방 송 2012 07 087

Tools’(https://wiki.digitalmethods.net/Dmi/

ToolDatabase) 등이 있다. 이러한 도구는 대개 무료

거나 약간의 비용으로 이용할 수 있으므로 소셜미디

어 데이터를 수집하여 여론을 분석하려는 사람에게

유용하다.

위의 방법대로 소셜 데이터를 직접 수집·처리

하기 위해서는 관련 지식의 습득과 훈련이 필수적이

다. 이를 위해서는 소셜 데이터를 가공한 한글 서비

스를 이용하는 것도 좋은 방법이다. ‘트윗몹’(http://

www.tweetmob.co.kr), ‘소셜메트릭스’(http://

pub.some.co.kr/index.html) 등 여러 상용 서비

스에서 특정 계정 및 이슈에 대한 빈도 분석 및 추

이를 제공한다. 이 가운데 주목할 만한 최근 서비

스는 ‘더아이엠씨’(The IMC)의 ‘소셜 하이브리드

리서치’(Social HR:Social Hybrid Research), ‘트

리움’(TREUM)의 ‘심플’(SimPL:Social Influence

Monitoring Platform), 지우닷컴의 ‘트윗리서치’가

있다. SHS의 장점은 트위터와 페이스북 이용자를 대

상으로 설문조사, 심층면접, SNS 콘텐츠 분석을 결합

하여 소셜에서의 관심을 파악하는 데 있다. 트윗리서

치는 휴대폰 본인인증을 결합하여 가짜 혹은 중복 계

정으로 인한 소셜 여론의 왜곡을 방지한다는 점이 흥

미롭다. 심플은 트위터 데이터의 정량 및 정성분석 결

과를 1개의 그래픽으로 보여주어 소셜미디어의 담론

생성과 확산 과정을 모니터링한다는 강점이 있다.

전통적 여론조사와 비교하여 소셜 조사의 차이

점을 정리하면 <표1>과 같다. 가장 큰 차이점은 조사

의 비강제성(unobtrusiveness)이다. 전통조사의 큰

결함은 조사자가 응답자에게 보상 등을 제공하면서

답변을 간청한다는(soliciting) 데 있다. 이것은 자기응

답식 조사에서 과장된 답변을 이끌어내어 허위적 인

과성이나 상관성을 보고하는 결정적 오류를 지닌다

<표1> 전통 여론조사와 소셜 여론조사의 비교

※출처 : 박한우 외(2009), 박한우(2010ab, 2011ab), Zhu et al.(2011, 2012), Skoic(2012)을 바탕으로 필자가 재구성함

항목 전통 여론조사 소셜 여론조사

모집단 알려져 있음 매체에 따라 다름

표본대상 일반인 전체 인터넷 및 SNS 이용자

표본방식 확률적 샘플링 매체에 따라 다름 (대개 비확률적, 편의적·전문가 샘플링)

조사 주제 모든 이슈 가능 사회적 흥미를 끌거나 주목받는 이슈

분석 단위 개인단위의 조사 (자기 응답식 데이터) 개인보다 집합적(aggregated) 수준 (이용자가 남긴 메시지 및 링크 데이터)

분석데이터 특성 객관식 응답이 많음 대화형부터 링크까지 다양한 형태

조사대상의 특성 알려져 있음 매체에 따라 다름

대상별 가중치 동등함 조사 목적 및 분석 기법에 따라 다름

대상자의 수집 조사자가 선별함 (Top-down) 매체에 따라 다르나, 자발적 참여자가 많음 (Bottom-up)

조사방법 집 전화 위주 (휴대전화 보완 시도) API를 이용한 데이터의 자동수집 (최근에는 설문조사로 보완 시도)

여론 수집방식 조사자의 요청 응답자의 자발적 동기 (Word of Mouth)

조사의 비강제성 낮음 높음

조사 비용 높음 낮음

조사 규모 수백 명 최대 수십억 개의 메시지 및 링크

조사 간격 월별~연도별 일별~주별

Page 5: ‘저비용 고효율’ SNS로 여론 읽기download.kpf.or.kr/MediaPds/LJZHQHSTPQEFXCB.pdf · nodexl.codeplex.com). XL은 우리에게 친숙한 마이 크로소프트사 엑셀

088

(Kobayashi & Boase, 2012; Okumura, 2007). 반면

에 소셜 조사는 자발적으로 작성된 짧은 대화형 메시

지를 소프트웨어를 이용해서 자동적으로 수집한다.

전통조사는 인구통계조사 덕분에 확률적 표집이 가

능하지만, 소셜 조사는 인터넷의 속성상 모집단의 파

악이 어려우므로 편의적 혹은 전문가 판단을 통해 표

집한다. 그렇지만 소셜 분석은 체계적 방법으로 데이

터를 대량 수집하여 오차를 무작위화(randomized)

한다. 소셜 조사의 큰 장점은 쟁점이 되는 주제에 대

해서 적은 비용을 들여 거의 실시간으로 여론의 동향

을 파악할 수 있다는 점이다. 나아가 시간과 지역을

넘어선 데이터 수집을 통해 여론의 시기적 추이와 공

간적 확산을 탐지할 수 있다. 또 본질적으로 교류형

매체의 속성을 지닌 소셜미디어의 특성상 여론의 실

질적 내용뿐만 아니라 관계적 구조를 찾을 수 있다.

이러한 장점에도 불구하고 소셜 여론조사는 풀

어야 할 숙제가 있다. 소셜미디어는 여전히 진화하는

기술이다. 따라서 다양한 종류의 데이터 수집기법이

존재한다. 트위터는 세 종류의 API가 있는 등 소셜 데

이터마다 접근의 범위와 깊이가 다르다. 언어별로 데

이터의 색인화 수준도 차이가 있다. 인터넷이 지닌 정

보의 확장성(scalability)은 소셜 여론조사의 측정을

더욱 어렵게 만든다. 검색엔진에서 한국어판과 영어

판의 검색 결과가 차이가 나기도 해서 데이터 수집 및

해석에 주의를 기울여야 한다.

SNS는 변화하는 시대의 ‘광장ʼ

소셜미디어가 생활에 스며들면서 여론 생성 및 확산

의 새로운 공간이 창출되고 있다. 소셜 여론조사도

‘웹보메트릭스’ 분야에서 1990년대 후반부터 관련 연

구가 진행되면서 성장 중이다. 이는 SNS의 세계적 확

산과 함께 시대에 맞는 새로운 사회연구방법으로 각

광받고 있다. 선거 캠페인, 영화 마케팅, 질병 확산, 주

가 예측 등 학계, 정치계, 언론계, 산업계의 의사결정

과정에서 기초자료로 활용되기도 한다. 소셜 조사는

전통적 여론조사가 지닌 문제점을 보완하면서 사회

조사분석을 업그레이드한다. 따라서 정교하고도 과

학적인 연구를 위한 지원이 지속적으로 이루어져야

한다.

참고 문헌

• 박한우 편저 (2011a). 인터넷 소셜미디어 개론. 경산: 영남대 출판부.

• 박한우 (2011b). 소셜미디어의 확산, 조사분석의 실제와 사례.

영대신문. 2011년 11월 2일.

• 박한우 (2010a). e-사이언스 시대의 인문사회학 연구하기-

인터넷 연구방법을 중심으로. 사회과학연구. 30권, 2호, 195-211.

• 박한우 (2010b). 웹보메트릭스의 변화 그에 따른 미래는? 인터넷 시대의

새로운 사회 연구 방법: 웹보메트릭스. 영대신문. 2010년 6월 3일자. 11면.

• 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한

검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹

가시성 분석과 신종플루 관련단어의 연관성 분석.

Journal of the Korean Data Analysis Society.

11권 6호 (B). 3427-3440.

• 이석수 (2011). 네트워크 분석에 기반을 둔 웹보메트릭스 효용성 커질 것.

박한우 영남대 교수 인터뷰. 매일신문 2011년 11월 21일.

• Kobayashi, T., & Boase, J. (2012). No Such Effect?

The Implications of Measurement Error in Self-Report Measures

of Mobile Communication Use. Communication Methods and

Measures, 6, 1–18. DOI: 10.1080/19312458.2012.679243

• Okumura, M., Motegi, T., Kobayashi, T., Oyama, K., Suzuki, T. (2007).

Can we predict political poll results by using blog entries?

IEEE 2012 45th Hawaii International Conference on System Sciences.

DOI 10.1109/HICSS.2012.145.

• Skoric, M. M. (2012). Social media messages as indicators of public

opinion: Opportunities and challenges. A Keynote talk at New Media

and Citizenship in Asia: Social Media, Politics, and

Community-Building, International Communication Association

2012 Preconference. Pheniox, AZ: USA.

• Salganik, M.J., & Levy, K.E.C. (2012). Wiki surveys: Open and

quantifiable social data collection. http://arxiv.org/abs/1202.0500

• Zhu, J.H., Wang, X., Qin, J., & Wu, L. (2012). Assessing Public

Opinion Trends based on User Search Queries: Validity, Reliability,

and Practicality. A paper presented at the annual conference of the

World Association for Public Opinion Research, Hong Kong,

June 14-16, 2012.

• Zhu, J.H., Q. M., Wang, F., & Lu, H. (2011) A Random Digit Search

(RDS) Method for Sampling of Blogs and Other User-Generated

Content, Social Science Computer Review, 29 (3), 327-339.