dlab big data issue report 002

6
Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. In the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited. 초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 궁금했던 것들 (소셜 분석의 개념과 분석 개요) Issue 002 April 15, 2014 DLAB Co., LTD. | HK-Tower 7F.,18, Digital-ro 32ga-gil Guro-gu, Seoul ,152-779 Korea | +82-2-3453-8124 | [email protected] | www.dlab.co.kr

Upload: dlab

Post on 27-Jun-2015

1.190 views

Category:

Data & Analytics


0 download

DESCRIPTION

일반인과 초보자를 위해 빅데이터의 이해를 돕기 위해서 DLAB에서 작성한 두번째 Issue Report를 공개합니다. 본 자료 "빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들"는 비전문가와 일반인들이 가장 궁금해 할만한 내용을 선별해서 빅데이터 전략 및 사업 기획을 제안하는 전문가와 빅데이터 분석 전문가 그리고 빅데이터 IT 컨설턴트의 감수를 거친뒤에 배포가 됩니다. 이번 주제는 소셜 데이터를 이해하기 위한 가장 첫단계, 소셜 분석의 개념과 분석 개요편입니다. 아무쪼록, 빅데이터를 이해하는데 조금씩 도움이 되었으면 하는 바이며 지속적인 컨텐츠 제공으로 평소 빅데이터에 관심을 가지고 있었던 많은 분들에게 도움이 되었으면 합니다.

TRANSCRIPT

Page 1: DLAB Big Data Issue Report 002

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. In the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.

 

                                                                             

 

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

 

Issue 002 April 15, 2014

DLAB Co., LTD. | HK-Tower 7F.,18, Digital-ro 32ga-gil Guro-gu, Seoul ,152-779 Korea | +82-2-3453-8124 | [email protected] | www.dlab.co.kr  

Page 2: DLAB Big Data Issue Report 002

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. in the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.  

2

국내 빅데이터 업체들을 살펴보면 저마다 특성 있는

방법으로 소셜 미디어를 분석하고 있음을 확인할 수 있습니다. 이러한 특징은 국내 뿐 아니라 해외에서도 쉽게 찾아볼 수 있는데 현재는 미국과 영국뿐만이 아닌 중국, 일본, 인도 등 정말로 많은 소셜 분석 업체들이 포진되어 있음을 확인할 수 있습니다.

그렇다면 소셜미디어 분석 업체란 모두 빅데이터 분석 업체를

뜻하는 것인지 소셜 분석과 빅데이터 분석의 차이점이 무엇인지 그리고 소셜 분석을 하는 이유는 무엇인지 다양한 궁금증에 사로잡히게 됩니다. 물론, 소셜 분석 (Social Analytics)의 다양하고 전문적인 분석 방법에 대한 이해를 위해서는 소셜 미디어라는 매체와 흔히 마케터들이 말하는 TGIF (Twitter, Google, Iphone, Facebook)에 대한 기초적인 이해가 선행되어야 할 것입니다.

그럼, 이제 빅데이터와 소셜 분석은 어떠한 차이점과 유사점이 있는지 비전문가들도 쉽게 이해할 수 있도록

<초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들>을 시작하려 합니다. 본 편은 소셜 분석의 개념과 분석 개념에 대한 이해를 돕고자 만들어졌습니다.

빙산 이론 (Iceberg Theory)을 이해하면 쉽게 미디어와 커뮤니케이션의 특징을 이해할 수 있습니다. (*빙산 이론을 이용한 다양한 컨셉과 모델이 있지만, 이번에는 미디어를 이해하기 위한 도표로 활용했습니다.) 빙산 이론은 수면을 중심으로 눈에 보이는 수면 위에 올라온 빙산과 눈에 보이지 않는 수면 아래에 잠겨 있는 빙산으로 나뉠 수 있습니다.

미디어의 관점에서 수면 위에 올라온 빙산을 대중 매체 (Mass Media)라고 볼 수 있으며 이는 텔레비전, 라디오, 신문 등의 전통적인 방식의 매체를 활용한 경우를 말하고 있습니다. 이러한 대중 매체의 경우 기업 또는 단체가 의도하고자 하는 메시지와 광고를 일반 대중을 상대로 대량으로 전파시킬 수 있는 파급력을 가지고 있으며 정보를 전달해주는 제공자 (Producer)와 정보를 받아들이는 소비자 (Consumer)의 역할이 뚜렷하게 정해져 있다는 특징을 가지고 있습니다. 예를들어 정보 제공자는 신문 기자, 앵커, 아나운서, 방송인, 광고인

등을 생각할 수 있으며 정보 소비자는 신문 구독자, 라디오 애청자, 방송 시청자 등을 생각해 볼 수 있습니다. 수면 아래에 잠겨 있는 빙산의 경우 대인관계에서 오는 커뮤니케이션을 뜻하며 미디어의 관점에서는 최근에는 자주

언급되는 소셜 미디어가 해당 영역에 해당하기도 합니다. 예를들어 친구 또는 지인들과의 소통, 옆집 아주머니 또는 미용실에서 오가는 수다 등 일반적인 소통을 통한 커뮤니케이션을 포함하기도 하지만 개인 블로그나 트위터를 통한 소통도 포함됩니다. 대중 매체와 달리 소셜 미디어는 정보 제공자와 정보 소비자가 혼합된 형태의 특징을 가지고 있는데 이렇게 누구나 뉴스를 만들어 낼 수 있고 누구나 파급력 있는 정보를 제공하고 공유할 수 있는 사람들을 프로슈머 (Prosumer: Producer + Consumer)라고 합니다.

전통적인 대중매체는 불특정 다수를 상대로 대량으로 홍보하기에 매우 탁월했던 반면에 높은 광고료를 지급해야 하는

단점을 가지고 있었습니다. 하지만 최근 마케터들은 비교적 낮은 비용으로 소셜 분석을 통해 기존에는 확인하기 어려웠던 일반 여론을 확인할 수 있게 되었으며 불특정 다수가 아닌 정확하게 기업과 단체가 원하는 고객을 상대로 홍보 및 마케팅을 할 수 있는 소수 지향적인 타겟 마케팅과 실시간 마케팅이 가능해졌다는 특징을 가지고 있습니다.

소셜미디어란 무엇이며 도대체 어디서 부터 시작해야 하는가?

소셜미디어가 아닌 미디어와 커뮤니케이션을 먼저 이해하자

Page 3: DLAB Big Data Issue Report 002

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. in the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.  

3

소셜 분석을 이해를 위해서는 가장 먼저 입소문 (WOM: word-of-mouth)라는 개념과 기본적인 커뮤니케이션 모델을 이해하는 것이 매우 중요합니다. (*마케터들은 입소문이라는 단어를 WOM이라고 축약해서 쓰기도 하며 상황에 따라 Buzz 또는 Viral 이라고 쓰기도 합니다. )

커뮤니케이션 관점에서 대중 매체는 광고주 또는 기업의 의도가

반영된 성향을 가지고 있다고 보지만 소셜 미디어의 경우 자발적으로 사람들을 통해 확산하는 성향을 가지고 있다는 차이점이 있습니다. 기업과 각종 단체에서는 자사 제품과 서비스 그리고 브랜드에 대해서 사람들이 어떠한 이야기를 나누고 있는지 사람들의 입소문을 이해하고자 했으며 이러한 필요 때문에 소셜 분석을 본격적으로 활용하게 되었다고 볼 수 있습니다.

조금 복잡할 수 있지만, A에서 C로 변화되는 커뮤니케이션 모델을

간단하게 요약하자면 기업과 단체에서는 (A) 전통적인 방식의 홍보에서 탈피해 (B) 진정한 대중 여론에 참여하고자 (수면 아래의 빙산 영역에 접근하기 위해) 노력했고 (C) 효과적인 커뮤니케이션 모델을 구축하기 위해 저마다의 방식으로 블로그와 페이스북 그리고 각종 SNS 담당자를 채용하면서 적극적으로 자사의 제품과 브랜드를 홍보하는 데 역점을 두었다고 설명할 수 있습니다.

마케팅 관점에서 본다면 텔레비전과 신문 등의 매중

매체를 활용한 직접 광고 방법을 뜻하는 전통적인 방식의 ATL (Above the Line) 마케팅에서 전시, 판촉물, 스폰서쉽, 이벤트, 간접광고 등을 활용하는 BTL (Below the Line) 마케팅으로 활동을 전개하였다가 최근에는 소비자 간에 자사의 제품과 브랜드에 대해서 언급할 수 있도록 소셜 담당자와 온라인 홍보 담당자를 통한 OTL (Out of the Line) 마케팅 방법이 동원 되었다고 할 수 있습니다.

입소문 또는 여론이란 두 개의 관점에서 나뉠 수 있으며 간단하게 설명을 하자면 자사의 브랜드나 제품에 대해서 긍정적인 내용의 글이 있으면 긍정 여론 (PWOM/ Positive WOM) 반대로 부정적인 내용의 글이면 부정 여론 (NWOM/ Negative WOM) 으로 분류할 수 있습니다.

참고로 긍정 여론과 부정여론의 확산 모델에 대한

수많은 자료와 실험들이 있지만, 긍정 여론보다는 부정적인 여론에 대한 정보가 훨씬 더 빠르게 확산된다는 사실은 이미 잘 알려진 사실입니다. ‘입소문을 만드는 100가지 방법’의 저자인 조지실버만이 제시한 입소문 모델에 의하면 만족 스러운 경험은 3명씩 전파가 되는 반면에 불만족스러운 경험은 평균 11명씩 전파가 된다니 부정적 여론의 파급력이 얼마나 대단한지 아래의 인포그래픽을 통해 쉽게 이해할 수 있습니다.  

마케팅과 커뮤니케이션으로 보는 입소문의 중요성

※ 100명의 사람이 있을때 1명은 만족스러운 경험을 했으며 또 다른 1명은 불만족스러운

경험을 가지고 있는 사람이 있다.

※ 각자 긍정적인 경험과 부정적인 경험을 타인과 공유했을 경우의 첫 번째 확산 그래프로 긍정적 여론은 4명에게 부정적인 여론은 12명으로 확산.

※ 두 번째 확산 그래프로 긍정적인 경험은 총 16명에게 확산 되었으며 부정적인 여론은 나머지 84명에게 모두 전파되었으며 추가로 48명에게 더 확산하였다. 즉, 부정적인 여론은 긍정적인 여론보다 훨씬 더 빠르게 전파되는 것을 알 수 있다.

Page 4: DLAB Big Data Issue Report 002

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. in the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.  

4

기업과 단체들은 오래전부터 콜센터 및 홈페이지를 운영해 왔으며 시장 조사와 여론조사를 수행하는 등 다양한 방법을 동원해 고객의 불만사항을 접수하고 현황을 파악하고 문제점을 개선하고자 노력해 왔습니다. 어느 정도 규모가 있는 기업이라면 체계적인 고객 관계 관리 (CRM: Customer Relationship Management)를 도입해 멤버십 등을 통한 고객 정보 관리 및 쿠폰 발행, 소비 패턴 및 불만 접수 내용 등을 관리하고 분석해 왔습니다. 기존의 CRM 전문가들은 소셜 분석을 전통적인 CRM 영역에서 확장된 형태의 Social CRM으로 명칭하고 그에 따른 방법론을 제시하고 있기도 합니다.

즉, 소셜 분석이라는 개념은 전혀 새로운 것은 아닙니다. 고객의 성향과 의견을

모니터링하고 고객이 제공하는 정보를 바탕으로 기존의 마케팅 방향을 수정하거나 고객의 의견을 토대로 개선책을 마련하는 등 이미 기업이 오래전부터 수행하던 CRM의 연장선 이라고 볼 수 있습니다. 다만, 최근 트렌드인 빅데이터라는 키워드와 함께 소셜 모니터링과 소셜 분석이라는 단어가 자주 언급되고 있는 것도 사실입니다. 그럼, 소셜 분석이란 어떻게 이루어 지고 있는지를 간단하게 살펴보겠습니다.

분석 방법과 구체적인 분석기술을 일반인들의 입장에서 이해하기에는 다소 무리가 있는 것이 사실입니다. 하지만 소셜 분석 방법을 간단하게 정리하자면 키워드 (Keywords), 채널 (Channels) 그리고 청중 (Audience)을 분석한다는 세 가지 카테고리로 요약할 수 있습니다.

키워드 분석은 단어 또는 문장을 분석하는 데 쓰일 수

있는 방법으로 특정 단어의 빈번 도를 조사해 트렌드를 찾아 내거나 언어 표현과 어휘를 분석해 고객의 감정을 분석할 때 쓰이는 방법입니다. 예를들어 스마트폰이라는 단어의 추이를 살펴보면 어느 특정 기간에 가장 트렌드가 높고 낮았는지를 살펴볼 수 있겠고 스마트폰과 관련된 특정 브랜드를 언급하는

횟수를 찾아내 가장 인지도가 있는 브랜드를 찾아낼 수 있겠으며 성향 분석기를 통해 해당 브랜드에 대한 긍정과 부정 또는 중립적인 성향을 파악하는 용도로 쓰일 수 있습니다. 채널 분석은 출처와 매체를 분석하는 데 쓰일 수 있는 방법으로 트위터에서 나오는 여론과 페이스북에서 형성된 여론 그리고 블로그나 기타 온라인 매체에서 나오는 성향들을 매체별로 상세하게 분리해 분석하는 방법입니다. 예를 들어 애플 제품을 좋아하는 커뮤니티 또는 블로그에서 정보를 수집해 분석한다면 애플 제품과 브랜드에 매우 호의적인 결과가 나올 수밖에 없는데 이것은 자칫 왜곡된 트렌드 정보를 보여줄 수 있기 때문에 모든 매체를 다양하게 골고루 수집해 분석하고 전체적으로 나오는 트렌드와 다른 성향을 가지고 있는 매체를 찾아내거나 매체별 특징을 찾아내는데 쓰일 수 있습니다.

청중 분석은 고객 또는 사람을 분석하는 데 쓰일 수 있는 방법으로 특정 자사 또는 타사 브랜드와 관련해 브랜드 충성심이 높거나 낮은 특정 고객을 찾아내서 관리하거나 가장 인터넷에서 영향력이 높은 사람을 찾아내서 입소문을 분석할 때 쓰이는 방법입니다. 예를 들어 가장 효율적인 입소문 마케팅을 위해 가장 인지도가 높은 유명 블로거를 찾아내서 홍보 효과를 분석한다거나 상습적으로 회사 브랜드 또는 제품 이미지를 훼손시킬 수 있는 유언비어를 유포하는 사람을 찾아내는 데 쓸 수 있습니다.

이렇게 쉽게 설명할 수 있는 정보를 얻기 위해서는 시맨틱, 온톨로지, 자연어처리, 형태소 분석, 통계 분석, 네트워크 분석

등 다양하고 광범위한 지식과 기술력이 필요한 것이 사실입니다. 무엇보다 취합된 모든 정보를 바탕으로 유용하고 가치있는 정보를 찾아낼 때 데이터 분석가들은 그리스의 철학자 아르키메데스가 유레카 (Eureka)를 외쳤을때와 비슷하게 통찰력을 뜻하는 인사이트 (Insight)를 찾아냈다고 표현합니다.

CRM vs Social CRM

소셜 분석의 기본적인 형태

Page 5: DLAB Big Data Issue Report 002

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. in the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.  

5

데이터 분석 목적이 그러하듯 소셜 분석의 목적 역시 의사 결정에 쓰일 수 있는 유용한 정보와 가치를 전달하는 데 진정한 의미를 두고 있다고 요약할 수 있습니다. 한편, 소셜 데이터의 양은 날이 갈수록 증가하고 있으며 예측되는 트렌드는 빠르게 변화되기 마련입니다. 한편으로 빅데이터에 대한 환상과 잘못된 정보로 인해 대용량의 데이터를 분석하면 모든 궁금증이 해소될 것이라는 다소 편협된 생각을 하는 사람들이 많은 것도 사실입니다.

하지만 유용하고 가치 있는 인사이트를 발굴했다는 것은 문제가 해결되었다는 것을 뜻하기보다는 진지하게 고민할

가치가 있는 소중한 정보가 발굴되었다고 보는 것이 더 정확한 표현이라고 볼 수 있습니다. 그렇기에 분석가의 분석 결과에 전적으로 의지하기보다는 발굴된 인사이트를 통해 또 다른 시나리오를 만들어내고 구체적인 활용 방안을 제시할 수 있는 데이터 큐레이션이 함께 수행되어야 할 것입니다.

이번에는 빅데이터와 함께 자주 언급되는 소셜 분석의 개념과 분석에 대해 간단하게 설명해 보았습니다. 다음에도

누구나 빅데이터에 관해 늘 궁금했던 내용을 쉽게 알려드리도록 하겠습니다.

Spicy Thinker Contact Info: [email protected] Kakao Talk: spicythinker Twitter: spicythinker 캘리포니아 주립대학교에서 비즈니스 마케팅을 전공했습니다. 현재 DLAB 에서 마케팅과 비즈니스 컨설팅을 담당하고 있습니다.

주로 빅데이터 분석 플랫폼 활용방안 및 사업화 제안을 하고 있습니다.

About Author

About DLAB 데이터 분석을 위한 분석

The End

1. Data Collection 데이터 수집

2. Data Analysis 데이터 분석

3. Data Insight 인사이트 도출

4. Decision Making! 의사결정!

Page 6: DLAB Big Data Issue Report 002

초보자를 위한 빅데이터 이해하기: 빅데이터에 관해 늘 궁금했던 것들 (소셜 분석의 개념과 분석 개요)

Copyright © 2014. All Rights Reserved. DLAB logo is trademark or registered trademark of Data Engineers Lab Co., Ltd. in the Republic of Korea and other countries. Any reproduction of this document in part or in whole is strictly prohibited.  

6

데이터엔지니어스랩(DLAB)은 데이터를 기반으로 한 모든 애프리케이션 개발과 서비스를 제공하며, 특히 CRM/ BI/ Advanced Analytics 등 다양한 분야의 IT 컨설팅과 솔루션 개발을 주 업무로 하고 있습니다.

최근 주요사업 분야로는 에너지 모니터링 시스템 (Photovoltaic Monitoring, Smart Grid Monitoring), 빅데이터 분석 시스템 (Social Media Analytics [SMA] LG CNS와 공동개발)이 있으며 대용량 데이터 수집과 분석 그리고 시각화 서비스를 다년간 제공하고 있습니다.

안 광종 대표이사 수석 컨설턴트 겸 Technology Leader Drexel University 경영학 석사 (1997) Drexel University 정보공학 석사 (2002) Suntek Systems, Inc. R&D 이사 (1998 – 2005)

Contact Info: [email protected] Twitter: kwangahn

디랩은 세계최고의 Intelligence Solutions 조직을 목표로 하며, Intelligence for Everyone을 모토로 모든 사람이 보다 쉽게 정보를 저장하고 활용할 수 있도록 기업솔루션에서 개인의 정보관리/ 의사결정지원 솔루션을 제공하고자 합니다.

E2P2C = Efficiency + Effectiveness + People + Process + Communication 입니다.

효율과 효과를 강조하면서 동시에 프로젝트를 수행하는 사람들을 Process와 Communication으로 지원하는 그립입니다.  

About DLAB