Сборник научных трудов корреспондента...

91
УПРАВЛЕНИЕ ИНФОРМАЦИОННЫМИ РИСКАМИ И ОБЕСПЕЧЕНИЕ БЕЗОПАСНОСТИ ИНФОКОММУНИКАЦИОННЫХ СИСТЕМ Сборник научных трудов Под редакцией член-корреспондента РАН В.И. Борисова Выпуск 3 (13), 2016 Воронеж Издательство «Научная книга» 2016

Upload: others

Post on 21-May-2020

25 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

УПРАВЛЕНИЕ

ИНФОРМАЦИОННЫМИ РИСКАМИ

И ОБЕСПЕЧЕНИЕ БЕЗОПАСНОСТИ

ИНФОКОММУНИКАЦИОННЫХ СИСТЕМ

Сборник научных трудов

Под редакцией член-корреспондента РАН

В.И. Борисова

Выпуск 3 (13), 2016

Воронеж

Издательство «Научная книга»

2016

Page 2: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

УДК 004.42

ББК

У

Управление информационными рисками и обеспечение безопасности

инфокоммуникационных систем: Сб. науч. тр.; под ред. чл.-корр. РАН

В.И. Борисова. Вып. 3 (13), 2016. – Воронеж: Издательство «Научная

книга». 2016. – 91 с.

ISBN

Статьи посвящены широкому кругу вопросов, связанных с

исследованиями в области обеспечения безопасности процессов,

протекающих в инфокоммуникационных системах, посредством оценки и

регулирования их рисков.

Издание предназначено для специалистов в области обеспечения

безопасности информационных систем и процессов различных классов.

Редколлегия: А.Г. Остапенко (ответственный редактор),

Е.В. Субботина (ответственный секретарь),

А.В. Бабурин, В.И. Белоножкин, В.Н. Деревянко, С.А. Ермаков,

В.Л. Каркоцкий, А.О. Калашников, Д.О. Карпеев, А.Н. Мокроусов,

Е.А. Москалева, И.П. Нестеровский, Г.А. Остапенко, О.А. Остапенко,

А.С. Пахомова, О.В. Поздышева, Н.М. Радько, К.А. Разинкин,

Д.Н. Рахманин, А.Ю. Савинков, Н.М. Тихомиров, Н.Н. Толстых,

О.Н. Чопоров, Е.Ю.Чапурин, В.Б. Щербаков, Ю.К. Язов.

Статьи сборника издаются в авторской редакции.

УДК 004.42

ББК

У

©Коллектив авторов, 2016

Page 3: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

3

ОГЛАВЛЕНИЕ

СОЦИАЛЬНАЯ СЕТЬ 4PDA: СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЕ

ОСОБЕННОСТИ РАСПРОСТРАНЕНИЯ КОНТЕНТА

В.С. Лысиков, А.В. Паринов .............................................................................. 4

СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ СПЕЦИФИКА

РАСПРОСТРАНЕНИЯ КОНТЕНТА В СОЦИАЛЬНОЙ СЕТИ ДЛЯ

КОЛЛЕКТИВНЫХ ОБСУЖДЕНИЙ REDDIT

А.И. Небольсин, А.В. Паринов ........................................................................ 23

СОЦИАЛЬНАЯ СЕТЬ SCIENTIFIC COLLABORATION: СТРУКТУРНО –

ФУНКЦИОНАЛЬНЫЕ ОСОБЕННОСТИ РАСПРОСТРАНЕНИЯ

КОНТЕНТА

Е.А. Шварцкопф, С.А. Щеглов, А.В. Паринов............................................... 45

СОЦИАЛЬНАЯ СЕТЬ SOUNDCLOUD: СТРУКТУРНО –

ФУНКЦИОНАЛЬНЫЕ ОСОБЕННОСТИ РАСПРОСТРАНЕНИЯ

КОНТЕНТА

Д.В. Ракшин, А.В. Паринов .............................................................................. 70

Page 4: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

4

УДК 004.056.57

СОЦИАЛЬНАЯ СЕТЬ 4PDA: СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЕ

ОСОБЕННОСТИ РАСПРОСТРАНЕНИЯ КОНТЕНТА

В.С. Лысиков, А.В. Паринов

Вступление мировой цивилизации в ХХI в. характеризуется стреми-

тельной диффузией информационно-коммуникационных технологий. В

2000 г. в мире насчитывалось всего 246 млн. пользователей интернета, к 1

января 2016 г. их количество составляет около 3,5 млрд. Не секрет, что

большое скопление людей привлекает не только маркетологов и реклам-

ные агенства, но и всевозможных злоумышленников: начиная от мелких

мошенников и заканчивая террористами. Любое воздействие через интер-

нет связано с распространением и поглощением контента [9,18,16].

4PDA - IT-форум, где преобладает тематика гаджетов и приложений.

Проект основан в 2005 году и пользуется огромной популярностью среди

владельцев мобильных устройств. Читатели 4PDA – это профессиональные

разработчики, руководители отделов IT-компаний, представители мобиль-

ной индустрии и рядовые пользователи мобильных устройств. Всех их

объединяет интерес к мобильным устройствам [15,19].

Необходимо отметить, что наиболее остро проблема распростране-

ния вредоносного контента стоит в социальных сетях. Связано это с их вы-

сокой плотностью, что говорит о высокой скорости распространения ин-

формации. Учитывая тот факт, что количество пользователей огромно и

постоянно растет, социальные сети являются превосходным местом для

публикации вредоносного контента [17,14].

Для начала анализа необходимо провести классификацию субъектов

сети (рис. 1), существующих в данном сетевом пространстве. Субъектами

сети 4PDA являются:

Page 5: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

5

Рис. 1. Субъекты сети 4PDA

Пользователям форума 4PDA предоставляются следующие возмож-

ности:

Создавать, редактировать, управлять своим профилем в рамках

возможностей платформы;

Просматривать, сохранять, создавать, комментировать темы,

повышать рейтинг других пользователей, подписываться на интересные

темы [19].

Все действия обобщены и структурированы (рис. 2).

Администрация форума устанавливает шаблоны для создания тем и

постов, делегирует полномочия для модераторов. Модераторы, обычно,

выбираются из наиболее активных пользователей сети, и за ними прикреп-

ляется определенный вид ресурса. Модератор получает право редактиро-

вать весь контент во вверенном ему ресурсе, но для других ресурсов он

остается обычным пользователем. Для пассивных пользователей есть воз-

можность просматривать новостную ленту, но для просмотра тем форума

необходимо пройти регистрацию. У зарегистрированных пользователей

есть возможность обмениваться личными сообщениями [19, 22].

Page 6: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

6

Рис. 2. Действия в сети 4PDA

Следующим шагом будет определение ресурсов сети, их можно

представить в виде следующей схемы (рис. 3).

При рассмотрении социальной сети одним из важнейших критериев

является анализ циркулирующего контента в сети. Любой контент можно

разделить на положительный и негативный [12].

Рис. 3. Ресурсы сети 4PDA

Page 7: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

7

Негативный контент можно разделить по формам его представления

и влияния на пользователей:

информация, приводящая к порче имущества либо нарушению

конфиденциальности, целостности и доступности данных пользователя,

нарушению авторских прав;

информация, оказывающая информационно-психологическое

воздействие на пользователей [2];

программы с встроенным вредоносным кодом, либо не

декларированными возможностями, например, отслеживание

местоположения пользователей;

ссылки на фишинговые или фарминговые ресурсы.

Рассмотрим контент с точки зрения его представления на форуме

4PDA. Отличительной особенностью форума 4PDA является распростра-

нение приложений как вида контента. Пользователи выкладывают прило-

жения и в ходе обсуждения получают пожелания других пользователей для

их доработки, либо просто следят за их обновлениями (рис 4) [19].

Рис. 4. Классификация контента сети 4PDA

Page 8: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

8

Обобщив вышеприведенные данные, получим структурно-

функциональную схему сети коллективных обсуждений 4PDA (рис 5).

Рис. 5. Структурно-функциональная схема сети 4PDA

Page 9: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

Для анализа данных сети 4PDA воспользуемся статистикой, выло-

женной на сайте Стенфордского Университета (Stanford Large Network

Dataset Collection – Большая Стенфордская Коллекция Сетевых Данных)

по социальной сети 4PDA. Для начала представим ее в виде таблицы [11]:

Таблица 1 – Статистические данные сети 4PDA

Параметр Значение

Узлов 26475

Ребер 53381

Средняя степень 4,033

Средняя взвешенная степень 11,085

Диаметр сети 13

Плотность сети 0

Модулярность 0,689

Средняя длина пути 4,04

Статистические данные социальной сети 4PDA, показанные в табли-

це 1 можно представить в виде трехместного предиката, в котором на пер-

вом месте располагается узел сети, из которого исходит ребро, подтвер-

ждающее связь между пользователями сети, на втором месте – узел, в ко-

торый входит это же самое ребро, и на третьем – вес ребра, отражающий

силу связи между вершинами. Фрагмент такого предиката, представленном

в текстовом формате, изобразим в таблице 2 [11,21,22].

Формат статистических данных, по своей структуре соответствует

трехместному предикату - формула (1):

(1)

где i и j – номера вершин и в сети;

– вес дуги , связывающей и , и направленной от i к j.

Page 10: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

10

Таблица 2 – Фрагмент трехместного предиката социальной сети

4PDA

Узел источник Узел цель Вес

1 2 2

1 3 10

1 4 5

2 30 4

2 43 5

2 82 8

2 90 2

2 95 8

2 292 6

2 618 1

2 642 7

2 699 2

2 706 10

Таблица 3 – Фрагмент звездной матрицы социальной сети 4PDA

Номер узла 1 2 3 … 10172 … 23455

1 0 2 10 … 0 … 0

2 0 0 0 … 6 … 9

3 0 0 0 … 0 … 0

… … … … … … … …

10172 0 0 0 … 0 … 0

… … … … … … … …

23455 0 0 0 … 0 … 0

Вес дуги в рассматриваемых статистических данных можно предста-

вить формулой (2) [11, 21]:

(2)

где - количество комментариев в постах пользователя i на записи

пользователя j за определенный период времени (1 год);

- количество тем, созданных пользователем j и прочитанных

пользователем i.

Далее необходимо определить диагональную матрицу, определяю-

щую степени вершин сети. Заметим, что степенью вершины будем назы-

вать количество исходящих из вершины дуг, без учета их веса. Данная

Page 11: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

11

матрица необходима в частности для построения матрицы взвешенной

центральности элементов сети. Каждое значение веса необходимо норми-

ровать по сумме всех степеней вершин (3):

(3)

Так как необходимо учитывать не только исходящие из вершины ду-

ги, но и дуги входящие в неѐ, поэтому формулу выше можно записать в

виде (4):

(4)

Величина характеризует удельный вес трафика, проходящего

через рассматриваемую вершину 𝑥𝑠 в сети, относительно суммарного тра-

фика во всей сети. Это позволяет свести значение к отрезку [0,1].

Часть матрицы взвешенной центральности элементов исходной мат-

рицы представлена в таблице 4.

Таблица 4 - Матрица взвешенной центральности социальной сети

4PDA

Номер

узла 1 2 3 … 10321 … 23242

1 5,61*10-5

6,018*10-12

0 … 0 … 0

2 1,2*10-10

0,0043 0 … 0 … 0

3 0 0 3,75*10-5

… 0 … 0

… … … … … … … …

10321 0 0 0 … 7,49*10-5

… 0

… … … … … … … …

23242 0 0 0 … 0 … 3,74*10-5

Page 12: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

12

Воспользовавшись формулой (5), построим диагональную матрицу

удельного баланса трафика в вершинах сети:

(5)

В отличие от предыдущей формулы (4), это значение характеризует

роль вершины в сети. Например:

при >0 – это генератор контента;

при <0 – это аккумулятор контента.

Заметим, что выше рассмотрены лишь предельные случаи, описыва-

ющие степень принадлежности вершины к одному или другому типу. Та-

ким образом, вершины первого типа в сети 4PDA являются либо модера-

торами, либо авторами, а вершины второго типа можно причислить к

обычным, либо к незарегистрированным пользователям.

Таблица 5 - Диагональная матрица удельного баланса трафика в сети

4PDA

Номер

узла 1 2 3 … 1025 1026 … 16888 … 26475

1 0.0001 0 0 … 0 0 … 0 … 0

2 0 -0.004 0 … 0 0 … 0 … 0

3 0 0 -0.007 … 0 0 … 0 … 0

… … … … … … … … … … …

1025 0 0 0 … 0.0005 0 … 0 … 0

1026 0 0 0 … 0 -0.0021 … 0 … 0

… … … … … … … … … … …

16888 0 0 0 … 0 0 … -0.002 … 0

… … … … … … … … … … …

26475 0 0 0 … 0 0 … 0 … -0.0004

Очевидно, что невозможно произвести детальный анализ графа сети

с заданным количеством вершин связей. Для выполнения поставленной за-

дачи необходимо из исходного графа G(E,V)сделать выборку G'(E',V'),

причем V'⊆V. Заметим, что новый граф сети должен сохранять структур-

Page 13: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

13

ные особенности исходного графа, закон распределения степени его вер-

шин, а также компоненты связности, присущие исходному графу G.

Для осуществления непосредственно выборки воспользуемся алго-

ритмом, представленным ниже, реализованным совместно с партнерами по

комплексной работе.

Рассмотрим диагональные элементы матрицы взвешенной централь-

ности, полученной выше. Далее произведем сортировку вершин, по убы-

ванию оценки взвешенной центральности . Будем считать, что допу-

стима потеря не более 5% трафика для усеченной модели сети.

Таблица 6 – Степени взвешенной центральности вершин

Номер узла Степень Номер узла Степень

1 0.00015 … …

2 0.00008 11835 0.00003

3 0.00013 11836 0.00002

4 0.00021 11837 0.00007

5 0.00036 11838 0.00005

6 0.00052 11839 0.00004

7 0.00004 11840 0.00011

8 0.00014 11841 0.00002

9 0.00013 … …

… … 26475 0.000003

Проранжируем степени узлов матрицы по убыванию и запишем в

таблицу 7. Это необходимо для подтверждения репрезентативности вы-

борки. В соответствии с поставленной задачей необходимая точность вы-

борки составляет 95%.

Таблица 7 - Ранжированные по убыванию степени взвешенной цен-

тральности вершин

Номер узла Степень Номер узла Степень

82 0.00420 … …

4 0.00354 23486 0.00000683

5123 0.00301 8951 0.00000684

Page 14: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

14

Продолжение таблицы 7

122 0.00284 3520 0.00000685

815 0.00251 847 0.00000685

320 0.00224 512 0.00000685

45 0.00203 … …

… … 26475 0

На следующем этапе просуммируем починные значения для получе-

ния необходимого результата (точности модели). В нашем случае до зна-

чения 0.95, так как для нас допустима 5% потеря трафика, полученная

сумма должна быть не меньше 0,95. Этим критерием и ограничится репре-

зентативная (с точки зрения трафика) выборка:

. (6)

На основе полученных данных, воспользовавшись программой для

визуализации и исследования графов Gephi [20], построим усеченный граф

социальной сети (рис. 6).

Стоит отметить отсутствие явной кластерности в данном графе. Это

говорит о том, что все ресурсы социальной сети общедоступны и о том,

что пользователи не объединяются в какие-либо группы или сообщества.

Произведем оценку параметров графа выборки и занесем получен-

ные данные в таблицу 9.

Page 15: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

15

Рис. 6. Визуализация графа выборки

Последний этап алгоритма состоит в формировании итоговой матри-

цы в виде, удобном для последующего моделирования информационной

диффузии. Данная матрица выглядит следующим образом:

- недиагональные элементы равны ±1, так как интересует лишь факт

смежности вершин истоков (+1) и стоков (-1). В некоторой степени это

возврат к формату матрицы смежности;

- диагональные элементы имеют вес k, равный сумме элементов (+1)

столбца.

Таким образом, определилось ожидаемое количество зараженных

элементов сети. Полученные данные занесем в таблицу 8.

Page 16: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

16

Таблица 8 - Модифицированная матрица смежности графа выборки

Номер

узла 2 4 7 … 2853 2895 … 11585 11852 12542

2 3 0 0 …

1 … 0 0 0

4 0 2 0 … 0 0 … 0 0 0

7 0 0 0 … 0 0 … 0 0 0

… … … … … … … … … … …

2853 0 0 0 … 0 0 … 0 0 0

2895 -1 0 0 … 0 0 … 0 0 0

… … … … … … … … … … …

11582 0 0 0 … 0 0 … 0 0 0

11852 0 0 0 … 0 0 … 0 1 0

12542 0 0 0 … 0 0 … 0 0 1

Получив усеченную выборку для сети, необходимо доказать ее по-

добие основной сети. Приведем параметры выборки для социальной сети

4PDA в таблице 9. Далее, основываясь на этих данных, построим график

распределения степеней (рис. 7) и гистограмму распределения вершин по

степеням (рис. 8).

Таблица 9 – Параметры выборки для социальной сети 4PDA

Page 17: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

17

Далее представлена гистограмма распределения вершин для гене-

ральной совокупности и полученной выборки (рис. 8).

Для того, чтобы доказать подобие выборочной совокупности гене-

ральному распределению воспользуемся критерием Пирсона [13]. Это

один из наиболее распространенных способов доказательства принадлеж-

ности совокупности закону распределения. В нашем случае будем доказы-

вать принадлежность к степенному закону.

Выдвинем гипотезы H0 = (Выборочная совокупность принадлежит

степенному закону распределения) и H1 = (Выборочная совокупность не

принадлежит степенному закону распределения).

Посчитаем критерий Пирсона для выборки сети 4PDA по фор-

муле (7).

где n – объем выборки;

pi – вероятность попадания случайной величины X.

Следуя представленной выше формуле получим значение χ2. В дан-

ном случае χ2 = 23.6521. Число степеней свободы для данной выборки рав-

но 26.

Далее выберем уровень значимости α=0.05, тогда p=1-α=0.95.

Найдем табличное значения для критерия Пирсона (χ2-критерия). Оно рав-

но 38,89. Так как табличное значение больше наблюдаемого имеет место

гипотеза H0. Выборочная совокупность принадлежит степенному распре-

делению, что и требовалось доказать.

Page 18: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

18

Рис. 8. Распределение количества вершин по степеням

k – степень вершины;

P(k)- вероятность попадания вершины со степенью k в заданный ин-

тервал.

Для доказательства репрезентативности выборки вычислим парамет-

ры, описывающие связность значений исходного распределения долей и

значений выборочной совокупности. Рассчитаем значения среднеквадра-

тичного отклонения (СКО) по формуле (6) значений двух совокупностей и

коэффициент корреляции (6-9) [13].

(6)

(7)

(8)

Page 19: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

19

(9)

где: n – общее число вершин;

– i-ый элемент выборки;

– среднее арифметическое выборки;

– среднеквадратическое отклонение для совокупностей X

и Y соответственно;

– среднеквадратичное отклонение значений выборочной

совокупности от генеральной;

– коэффициент ковариации совокупностей X и Y;

– коэффициент корреляции.

Запишем рассчитанные результаты (табл. 10).

Таблица 10 - Рассчитанные значения сравнения совокупностей

Значения СКО и коэффициент корреляции являются допустимыми и,

следовательно, имеет место репрезентативная выборка.

Таким образом, беря за основу передовые исследования отечествен-

ных и зарубежных ученых [4-9,10,17,18], после применения предложенных

алгоритмов преобразования исходных данных сети и нахождения репре-

зентативной выборки была получена визуальная модель усеченной соци-

альной сети 4PDA и соответствующие матрицы, способные в полной мере

охарактеризовать распространение контента в данной социальной сети.

Коэффициент Значение

СКО 0,0469897

Коэффициент корреляции 0,7521432

Page 20: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

20

После была доказана принадлежность выборки степенному распре-

делению и ее подобие генеральной совокупности с отклонением не более

5% для социальной сети коллективных обсуждений – форум 4PDA.

Литература:

1 Analytical estimation of the component viability of distribution auto-

mated information data system / G.A. Ostapenko, D.G. Plotnicov, O.Y

Makarov, N.M. Tikhomirov, V.G. Yurasov // World Applied Sciences Journal. –

2013. – 25 (3). – P. 416-420.

2 Analytical models of information-psychological impact of social in-

formation networks on users / G.A. Ostapenko, L.V. Parinova, V.I. Belonozh-

kin, I.L. Bataronov, K.V. Simonov // World Applied Sciences Journal. – 2013. –

25 (3). – P. 410-415.

3 Assessment of the system's EPI-resistance under conditions of infor-

mation epidemic expan ion / N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A.

Ostapenko, D.V. Gusev // Biosciences Biotechnology Research Asia. – 2014. –

Vol. 11 (3). – P. 1781-1784.

4 Bob Cross, Andrew Parker. The Hidden Power of Social Networks:

Understanding How Work Really Gets Done in Organizations. – М.: Harvard

Business School Press, 1. – P. 304.

5 Discreet risk-models of the process of the development of virus epi-

demics in non-uniform networks / V.V. Islamgulova, A.G. Ostapenko, N.M.

Radko, R.K. Babadzhanov, O.A. Ostapenko // Journal of Theoretical and Ap-

plied Information Technology. – 2016. – P. 306-315.

6 Flood-attacks within the hypertext information transfer protocol: dam-

age assessment and management / A.G. Ostapenko, M.V. Bursa, G.A. Ostapen-

Page 21: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

21

ko, D.O. Butrik // Biosciences Biotechnology Research Asia. – 2014. – Vol. 11

(Spl.End). – P. 173-176.

7 Optimization of expert methods used to analyze information security

risk in modern wireless networks / S.A. Ermakov, A.S. Zavorykin, N.S. Kolen-

bet, A.G. Ostapenko, A.O Kalashnikov // Life Science Journal. – 2014. – №

11(10s). – P. 511-514.

8 Peak risk assessing the process of information epidemics expansion /

N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, A.S. Avdeev //

Biosciences Biotechnology Research Asia. – 2014. – Vol. 11 – P. 251-255.

9 Абрамов К.Г. Распространение нежелательной информации в со-

циальных сетях Интернета / К.Г. Абрамов //Медиа индустрия и информа-

ционная безопасность. – № 3. – C. 40-50.

10 Алферов А.Г. Устойчивость инфокоммуникационных систем в

условиях информационного конфликта [Текст]/ А.Г. Алферов, И.О. Тол-

стых, Н.Н. Толстых, О.В. Поздышева, А.И. Мордовин // Информация и

безопасность. – 2014. – Т. 17. – № 4. – С. 558-567/

11 Большая Стенфордская Коллекция Сетевых Данных - Электрон.

Дан. – Режим доступа: http :// tanford.edu/data/

12 Губанов Д.А., Новиков Д.А., Чхаратишвили А.Г. Социальные

сети: модели информационного влияния, управления и противоборства /

Под ред. чл.-корр. РАН Д.А. Новикова. – М.: Издательство физико-

математической литературы, 2010. – 288 с.

13 Гмурман В.Е., Теория вероятностей и математическая статистика.

Учебное пособие. Высшее образование. – Москва, 2006 – С. 243.

14 Дешина А.Е. Атака на серверы резервного копирования: оценка

жизнестойкости [Текст]/ А.Е. Дешина, Д.Г. Плотников, Д.С. Каребин, Я.М.

Каценко, Э.Д. Поликарпов // Управление информационными рисками и

обеспечение безопасности инфокоммуникационных систем: Сб. науч. тр.;

Page 22: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

22

под ред. чл.-корр. РАН В.И. Борисова. – Воронеж: Издательство «Научная

книга». – 2015. – Т. 8. – № 2. – С. 109-119.

15 Ермаков С.А. Архитектура системы безопасности в сотовых се-

тях стандарта LTE [Текст]/ С.А. Ермаков, Н.С. Колебнет, В.Г. Юрасов,

И.Л. Батаронов // Информация и безопасность. – 2014. – Т. 17. – № 4. – С. 626-

629.

16 Есин В.И. Защита данных в базе данных с универсальной струк-

турой [Текст]/ В.И. Есин, В.Г. Юрасов // Информация и безопасность. –

2014. – Т. 17. – № 2. – С. 180-187.

17 Монахов Ю.М., Моделирование распространения нежелательной

информации в социальных медиа / Ю.М. Монахов, К.Г. Абрамов; Вестник

КГУ им. Н.А. Некрасова. - 2011. – Т.17, №3. - С. 15-18.

18 Назарчук А.В., О сетевых исследованиях в социальных науках /

МГУ им. М. В. Ломоносова - М:. Типография МГУ, 2008. – 73 с.

19 Cоциальная сеть 4PDA. - Электрон. Дан. – Режим доступа:

http://4pda.ru (дата обращения: 18.07.2016)

20 Средство визуализации данных. - Электрон. Дан. – Режим

доступа: http ://gephi.org/ (дата обращения: 16.09.2016)

21 Статистика социальной сети 4PDA. - Электрон. Дан. – Режим

доступа: http://konect.uni-koblenz.de/networks/4PDA. (дата обращения:

10.09.2016)

22 Статистические данные посещения социальной сети. - Электрон.

Дан. – Режим доступа: http://www.alexa.com/

Воронежский научно-образовательный центр

управления информационными рисками

Page 23: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

23

УДК 004.056.57

СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ СПЕЦИФИКА

РАСПРОСТРАНЕНИЯ КОНТЕНТА В СОЦИАЛЬНОЙ СЕТИ ДЛЯ

КОЛЛЕКТИВНЫХ ОБСУЖДЕНИЙ REDDIT

А.И. Небольсин, А.В. Паринов

Социальная сеть Reddit категории социальных сетей для коллектив-

ного обсуждения коротко называют форумами. По данным статистики фо-

румы занимают около 18% от всей аудитории социальных сетей, за счѐт

своей полезности и концентрации целевой аудитории [19].

Reddit — социальный новостной сайт, в котором зарегистрирован-

ные пользователи могут размещать ссылки на какую-либо понравившуюся

информацию в интернете. Как и другие подобные сайты, Reddit поддержи-

вает систему голосования за понравившиеся сообщения — наиболее попу-

лярные из них оказываются на заглавной странице сайта [15].

В социальной сети для коллективных обсуждений Reddit больше

1000 подразделов их можно разделить на 3 основных раздела (рис. 1) [15]:

1) Новостные статьи – статьи про основные новости в мире, про по-

литическую обстановку, они несут как правило официальный характер и

ссылаются на такие источники информации (live cience.com,

wa hingtonpo t.com и другие).

2) Развлекательный контент – информация, предназначенная для

увеличения вовлеченности аудитории к той или иной тематике. К ним

относятся опросы, фото и видео, не несущие никакой официальной

информации из СМИ.

3) Авторские записи (блоги) - статьи, которые публикуют

непосредственно сами пользователи социальной сети.

Page 24: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

24

Рис. 1. Классификация разделов для публикаций в социальной сети Reddit

Особенности социальной сети Reddit:

- Для каждого авторизованного пользователя социальной сети

вводится рейтинг, называемый кармой. Карма показывает, оценку

пользователя по всем его выложенным в сети постам она складывается из

положительных и отрицательных отзывов [15].

- Шкала рейтинга постов про ранжирована от -10 до +10. Так же

есть особый рейтинг «позолотить» - это высший бал посту.

- Рейтинг поста другие авторизованные пользователи могут

увидеть только спустя некоторое время. Это сделано для того, чтобы

избежать «эффекта толпы» - когда пользователи просто так голосуют за

или против, даже не прочитав весь пост [15].

Немаловажным фактором в исследовании специфики субъектов

социальной сети Reddit является информация о том, откуда пользователи

узнали о данной социальной сети и перешли на пользование данной сетью.

Page 25: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

25

По данным статистического сайта Alexa [19], о сайте социальной

сети Reddit наибольшее количество пользователей узнало из поискового

сервиса Google, социальной сети Digg, сети для просмотра и выкладывания

видео контента YouTube, социальной сети Facebook, и других социальных

сетей, и поисковых сервисов [15].

С учетом всей известной нам информации и статистики субъектов

социальной сети Reddit можем проклассифицировать субъекты данной

социальной сети. Активных пользователей и пассивных. В свою очередь

пассивных пользователей можно разделить на пользователей, прошедших

регистрацию и пользователей, не прошедших регистрацию [15].

В настоящее время, как и во всех наиболее популярных социальных

сетях, в том числе и для коллективных обсуждений представлены

практически все виды информационного контента.

Рис. 2. Классификация субъектов социальной сети Reddit

Page 26: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

26

В процессе дискуссии пользователи стараются аргументировать

свою позицию, используя при этом такие возможности веб-форума как,

прикрепление графических данных, аудио и видео материалов, гиперссы-

лок на «другие авторитетные источники» или же комбинируя все различ-

ные типы контента между собой.

Исходя из вышесказанного можно проклассифицировать контент со-

циальной сети для коллективных обсуждений Reddit как показано на ри-

сунке 3.

Рис. 3. Блок-схема разновидности циркулирующего контента в сети Reddit

В социальной сети Reddit все сетевые ресурсы можно разделить на

два основных типа: ресурсы коллективного пользования и ресурсы персо-

нального пользования [16].

Отличительной особенностью сети является то, что каждый сетевой

ресурс расположен на отдельном подсайте. На пример, раздел, посвящен-

Page 27: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

27

ный новостям, находится по адресу http ://www.reddit.com/r/new / и так для

каждого подсайта социальной сети Reddit [14].

Сетевые ресурсы социальной сети можно представить виде следую-

щей схемы.

Рис. 4 - Классификация сетевых ресурсов социальной сети

Аккаунт – является ресурсом личного пользования. В нем пользова-

тели могут сохранять закладки, производить настройку новостной ленты и

выкладывать личную информацию (контакты) [15].

Закладки – сохраненные посты, посты, отмеченные высшей оценкой,

для удобства их просмотра.

Лента постов – формат данных, используемый для доставки пользо-

вателям часто обновляемой информации [8,9]. Распространители этой ин-

формации предоставляют новостную ленту, позволяя пользователям под-

писаться на неѐ. Лента состоит из некоторого ограниченного числа статей,

а также из служебной информации: имени автора или даты публикации

статьи. При появлении новых данных они добавляются в ленту, вытесняя

при этом старые статьи. К ленте можно применить фильтры сортировки,

например, чтобы посты отображались не по дате их публикации [9].

Page 28: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

28

Лента комментариев – является общедоступным ресурсом, находить-

ся под публикуемыми постами пользователей. На этой ленте авторизован-

ные пользователи могут оставлять свое мнение о посте, отвечать на вопро-

сы и просто общаться с другими пользователями социальной сети Reddit. К

ленте постов также можно применить различные фильтры некоторые из

них – отображать комментарии только с определенного рейтинга [13].

Главная страница Reddit – Страница, которую видит любой (автори-

зованный или неавторизованный) пользователь, который зашел на данный

сайт. На этой странице отображаются самые новые или самые популярные

посты, размещенные пользователями социальной сети для коллективных

обсуждений Reddit [12,15].

В данной классификации действия доступные пользователям были

разделены на три основные категории: размещение, ознакомление и реаги-

рование.

В категории «размещение», пользователям доступны такие действия

как: создание подсайта, размещение поста на любом выбранном подсайте,

публикация постов в сторонние социальные сети (Facebook, Youtube, Tum-

blr и другие).

В категории «ознакомление», пользователи способны прочитать ста-

тью или посмотреть видео, рекламу или фотографию. Ознакомиться с те-

матикой выбранного подсайта.

Весь функционал пользователя социальной сети Reddit сосредоточен

в категории «реагирование». В данную категорию попали действия, кото-

рые следуют после ознакомления пользователей с предложенным контен-

том [12,15].

Page 29: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

29

Рис. 5. Классификация действий субъектов в социальной сети Reddit

С учетом полученных классификаций контента, субъектов и их дей-

ствий, а также сетевых ресурсов данной социальной сети предоставляется

возможным построить структурно-функциональная модель социальной се-

ти Reddit с учетом всех ее особенностей (рис. 6). В данной модели функ-

циональные связи представляют собой сложную структуру взаимодей-

ствия контента, сетевых ресурсов и субъектов, функционирующих в за-

данном сетевом пространстве [10].

Page 30: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

30

Рис. 6. Структурно-функциональная модель социальной сети

Page 31: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

31

Данные для дальнейшего исследования социальной сети Reddit были

использованы с интернет ресурса Konect [18].

Таблица 1 – Статистические данные социальной сети Reddit

Характеристические данные Показатели

Количество узлов 17381

Количество ребер 115217

Диаметр 7

Средняя длина пути 3,245

Коэффициент кластеризации (%) 1,329

Диаметр сети 5,12

Средний диаметр сети 2,152

Сетевая плотность 10,283

На рисунке ниже построен исходный граф согласно предоставленной

статистике по социальной сети для коллективных обсуждений Reddit [9].

Рис. 7. Исходный граф для социальной сети Reddit

Page 32: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

32

С помощью программно-аппаратного комплекса gephi построен

график степеней вершин для социальной сети Reddit [16].

Необходимым элементом для анализа социальной сети Reddit явля-

ется нахождение взвешенных метрик.

Статистические данные социальной сети Reddit можно представить в

виде трехместного предиката, в котором на первом месте располагается

узел сети, из которого исходит ребро, подтверждающее связь между поль-

зователями сети, на втором месте – узел, в который входит это же самое

ребро, и на третьем – вес ребра, отражающий силу связи между вершина-

ми.

Узлом любой пользователь социальной сети, а вес ребра – количе-

ство комментариев, оставленное пользователем под постом другого авто-

ризованного пользователя за месяц.

Формат данных в данном предикате соответствует следующей фор-

муле:

где i и j – номера вершин и в сети;

- вес дуги , связывающей и , и направленной от i к j;

В данном случае вес дуги можно определить как динамиче-

ский ресурс, то есть передачу контента определенного объема V и его цен-

ности C в сети в единицу времени (2):

где – усредненная ценность наполнителя (контента);

– интенсивность обмена контентом.

Page 33: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

33

Суть алгоритма преобразования исходных данных социальной сети

Reddit заключается в построении тройного предиката сначала в виде

звездной матрице и затем в виде матрицы взвешенной центральности.

На основе предложенного алгоритма преобразования исходных дан-

ных сети построим звездную матрицу социальной сети Reddit, элементы

строки которой соответствуют дугам, входящим в данную вершину, а эле-

менты столбца – дугам, исходящим из вершины (табл. 2):

Таблица 2 - Звездная матрица социальной сети Reddit

№ узла 1 2 3 4 5 6 7 8 9 … 17381

1 0 0 38 0 0 0 0 52 0 … 19

2 61 0 0 52 0 0 0 0 0 … 0

3 41 42 0 0 0 0 71 0 0 … 81

4 98 0 59 0 0 83 0 0 0 … 0

5 0 95 0 74 0 0 23 0 57 … 0

6 0 8 0 64 0 0 0 0 0 … 0

7 97 76 0 0 0 25 0 0 0 … 31

8 6 0 0 97 0 0 0 0 0 … 52

9 48 0 0 68 0 98 0 0 0 … 11

10 0 66 30 0 91 37 26 0 0 … 74

11 3 0 0 55 0 0 0 63 46 … 0

… … … … … … … … … … … …

17381 0 17 73 0 0 0 16 0 0 … 0

Далее построим квадратную матрицу взвешенной центральности

элементов сети. Для этого необходимо определить удельный вес ее вершин

и дуг с помощью нормировки их весов по суммарному трафику сети по

формуле (3):

где – вес трафика в дуге .

Данная формула будет характеризовать степень взвешенной (по тра-

фику) центральности дуги. Значит, для определения взвешенной централь-

Page 34: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

34

ности вершины можно использовать сумму, которую далее следует про

нормировать по суммарному трафику сети (4):

В результате получим нормированную величину, которая будет ха-

рактеризовать удельный вес трафика, проходящего через вершину , по

отношению ко всему трафику сети формула (5):

где – вес трафика в исходящей и узла дуге;

– вес трафика во входящей в узел дуге.

В итоге, следуя формуле (5) получим матрицу взвешенной централь-

ности элементов исходной сети следующего вида (табл. 3):

Таблица 3 - Матрица взвешенной центральности социальной сети

Reddit

№ узла 1 2 3 … 577 578 … 17381

1 0,00887 0 0,00032 … 6,1*10-6

0 … 0

2 0,00097 0,00923 0 … 0 0 … 0

3 0,00028 0,00071 0,00421 … 0 0 … 0

… … … … … … … … 0

576 0 0 0 … 0 0 …

577 0,00104 0 0 … 0,00913 0 … 0

578 0 0 2*10-5

… 0 0,00698 … 0

… … … … … … … … …

17381 0 0 0 … 0 0 … 0,0038

На последнем этапе алгоритма преобразования исходных данных со-

циальной сети Reddit найдем и построим диагональную матрицу удельного

баланса трафика в вершинах данной сети.

Page 35: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

35

На данном шаге учитывается не сумма, а разность исходящего и

входящего трафика (6):

где: – вес трафика в исходящей и узла дуге;

– вес трафика во входящей в узел дуге.

В результате данных вычислений по формуле (6) получим диаго-

нальную матрицу удельного баланса трафика в вершинах сети (табл. 6).

Полученная удельная величина характеризует роль вершины (субъ-

екта) сети: - при – это генератор контента; при – это аккуму-

лятор контента.

Чем больше модуль , тем в большей степени проявляется его роле-

вая функция.

Таблица 4 - Матрица удельного баланса

№ узла 1 2 3 … 577 578 … 17381

1 -0,29*10-5

0 0 … 0

0 … 0

2 0 -0,71*10-4

0 … 0 0 … 0

3 0 0 -0,1*10-6

… 0 0 … 0

… … … … … … … … 0

576 0 0 0 … 0 0 … 0

577 0 0 0 … -0,32*10-5

0 … 0

578 0 0 0 … 0 -0,26*10-5

… 0

… … … … … … … … …

17381 0 0 0 … 0 0 … -2*10-6

Чтобы решить проблему анализа десятка тысяч вершин социальной

сети для коллективных обсуждений Reddit, преобразуем всю сеть в

Page 36: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

36

некоторую выборку, которая в полной мере описывает и отражает все

основные свойства данной сети [15].

Выбранный подход заключается в отборе вершин по их степени, то

есть количеству инцидентным им дуг.

Суть данного алгоритма состоит в том, что требуется из полученных

квадратных матриц взвешенности, получить усеченное количество узлов,

которые способны с сохранением подобия описать исходную сетевую

структуру.

Исходя из сказанного выше, в выбранном алгоритме уместно

использование квадратной матрицы взвешенной центральности элементов

сети, а точнее – ее диагонали, где определена степень взвешенной

центральности каждой вершины.

Таблица 5 – Степени взвешенной центральности вершин сети Reddit

Номер узла Степень Номер узла Степень

1 0,00887 576 0,00613

2 0,009231 577 0,00913

3 0,000211 578 0,00698

… … … …

575 0,00015 17381 0,00764

Далее для получения репрезентативной выборки проранжируем сте-

пени узлов по убыванию и просуммируем эти значения для получения не-

обходимого результата (точности модели).

В нашем случае это значение равно 0,95, так как допустима 5% поте-

ря трафика. Просуммировав свои значения до значения в 0,95 получили

выборку размером в 120 элементов. Следующим шагом обнулим столбцы

и стоки, на пересечении которых стояла исключенная вершина.

На основе данного усечения построим следующую матрицу (табл. 6):

Page 37: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

37

Таблица 6 – Проранжированная усеченная матрица сети Reddit

№ узла 7597 14389 4768 … 8717 201

7597 0

0,0000214 0 … 0,00001591

0

14389 0 0 0,00001981 … 0 0

4768 0 0 0 … 0 0

… … … … … … …

11471 0 0 0 … 0 0

8717 0 0,0000201 0 … 0 0,00001581

201 0,0000254 0 0 … 0 0

На последнем этапе сформируем итоговую матрицу в виде, удобном

для последующего моделирования информационной диффузии [14,18].

Данная матрица представлена ниже (табл. 7):

Таблица 7 – Модифицированная матрицей смежности сети Reddit

№ узла 7597 14389 4768 … 11471 8717 201

7597 0

1 0 … 0 1

0

14389 0 5 -1 … 0 0 0

4768 0 0 13 … 0 0 0

… … … … … … … …

11471 0 0 0 … 17 0 0

8717 0 -1 0 … 0 9 -1

201 1 0 0 … 1 0 11

На основе данной матрицы, с помощью программного обеспечения

Gephi [17] построим усеченный граф социальной сети (рис. 8):

Page 38: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

38

Рис. 8. Выборка социальной сети Reddit

Стоит отметить, что у данной социальной сети явная кластерность

прослеживается. Это напрямую зависит от возможностей авторизованных

пользователей – любой авторизованный пользователь может прочесть лю-

бую статью, прокомментировать ее и сохранить к себе в закладки. Так же

он может провести оценку данной статьи и порекомендовать ее другим ав-

торизованным пользователям социальной сети для коллективных обсуж-

дений Reddit.

Для того, чтобы перенести все выводы, полученные в результате

эксперимента с выборочной совокупностью на всю социальную сеть (гене-

ральную совокупность) необходимо доказать репрезентативность выборки

[20].

Одним из способов доказать сохранение всех свойств выборочной

совокупности и принадлежности полученной выборки степенному закону,

Page 39: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

39

воспользуемся критерием Пирсона. Перейдем к расчетам критерия Пирсо-

на для социальной сети Reddit [20].

Для доказательства данного критерия выдвинем гипотезы H0 и H1

[13]. Гипотеза H0 представляет собой генеральную совокупность, распре-

деленную по степенному закону (7). В свою очередь гипотеза H1 представ-

ляет собой выборочную совокупность, распределенную по степенному за-

кону (7).

Вычислим значение критерия по следующей формуле (8):

(8)

где n – объем выборки;

- вероятность попадания случайной величины в рассматриваемый

интервал;

- теоретическая вероятность попадания в рассматриваемый ин-

тервал.

Для расчета значения для выдвинутых гипотез, воспользуемся

формулой (8) [20]. Получим следующие значения для гипотезы H0:

и для гипотезы H1: .

Выберем уровень значимости равным , следовательно p=1-

=0,95 и отметим количество степеней своды . Критическое значе-

ние критерия Пирсона для данного уровня значимости и количества степе-

ней своды равно .

Исходя из того, что для обеих гипотез наблюдаемое значение коэф-

фициента не попадает в критическую область можно сделать вывод, что

нет смысле отвергать рассмотренные гипотезы. Следовательно, выбороч-

ная и генеральная совокупность принадлежат экспоненциальному закону.

Page 40: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

40

Определение репрезентативности выборки также зависит от сравне-

ния среднеквадратических отклонений исследуемых совокупностей. Для

расчета воспользуемся формулами (9) и (10), а также рассчитаем коэффи-

циент корреляции (9-12):

(9)

(10)

(11)

(12)

где: n – общее число вершин;

– i-ый элемент выборки;

– среднее арифметическое выборки;

– среднеквадратическое отклонение для совокупностей

X и Y соответственно;

– среднеквадратичное отклонение значений выборочной

совокупности от генеральной;

– коэффициент ковариации совокупностей X и Y;

– коэффициент корреляции.

Воспользовавшись формулами (9-12) вычислим, что СКО составляет

0.089 при значении коэффициента корреляции 0.781, что является допу-

стимым значением при рассмотрении вопроса подобия двух совокупно-

стей. Исходя из полученных результатов, можно сделать вывод, что имеет

место репрезентативная выборка [20].

Page 41: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

41

Для наглядности полученных результатов предоставим гистограммы

распределения вершин для генеральной совокупности и выборочной сово-

купности (по горизонтальной оси – слои вершин, по вертикальной оси –

доля вершин данной степени).

Рис. 9. Распределение количества вершин по степеням

В итоге, опираясь на передовые исследования отечественных и за-

рубежных ученых [1-7], были выполнены алгоритмы преобразования ис-

ходных данных сети и нахождения репрезентативной выборки. Проведя

анализ и систематизацию исходных статистических данных социальной

сети для коллективных обсуждений Reddit, удалось построить структурно-

функциональную модель, с учетом всех особенностей данной сети, визуа-

лизировать модель усеченной сети.

Была показано сравнение исходного графа социальной сети Reddit и

полученной репрезентативной выборки, состоящей из 120 узлов.

Огибающая распределения степени вершин генеральной совокуп-

ности

Слои вершин степени k

До

ля

вер

ши

н

сте

пе

ни

k

Огибающая распределения степени вершин репрезентативной вы-

борки

P(k)

k

Page 42: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

42

Литература:

1 Analytical estimation of the component viability of distribution au-

tomated information data system / G.A. Ostapenko, D.G. Plotnicov, O.Y

Makarov, N.M. Tikhomirov, V.G. Yurasov // World Applied Sciences Journal. –

2013. – 25 (3). – P. 416-420.

2 Analytical models of information-psychological impact of social in-

formation networks on users / G.A. Ostapenko, L.V. Parinova, V.I. Belonozh-

kin, I.L. Bataronov, K.V. Simonov // World Applied Sciences Journal. – 2013. –

25 (3). – P. 410-415.

3 Assessment of the system's EPI-resistance under conditions of in-

formation epidemic expan ion / N.M. Radko, A.G. Ostapenko, S.V. Mashin,

O.A. Ostapenko, D.V. Gusev // Biosciences Biotechnology Research Asia. –

2014. – Vol. 11 (3). – P. 1781-1784.

4 Discreet risk-models of the process of the development of virus ep-

idemics in non-uniform networks / V.V. Islamgulova, A.G. Ostapenko,,N.M.

Radko, R.K. Babadzhanov, O.A. Ostapenko // Journal of Theoretical and Ap-

plied Information Technology. – 2016. – P. 306-315.

5 Flood-attacks within the hypertext information transfer protocol:

damage assessment and management / A.G. Ostapenko, M.V. Bursa, G.A.

Ostapenko, D.O. Butrik // Biosciences Biotechnology Research Asia. – 2014. –

Vol. 11 (Spl.End). – P. 173-176.

6 Optimization of expert methods used to analyze information secu-

rity risk in modern wireless networks / S.A. Ermakov, A.S. Zavorykin, N.S.

Kolenbet, A.G. Ostapenko, A.O Kalashnikov // Life Science Journal. – 2014. –

№ 11(10 ). – P. 514.

Page 43: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

43

7 Techniques and Tools for Designing an Online Social Network

Platform / Panagiotis Karampelas // New Hampshire: Hellenic American Uni-

versity. - 2013. - № 7. – P. 109.

8 Peak risk assessing the process of information epidemics expansion

/ N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, A.S. Avdeev //

Biosciences Biotechnology Research Asia. – 2014. – Vol. 11 (Spl.End). – P.

251-255.

9 Social Networks: Theory and Applications. [Электронный

ресурс]. – Режим доступа:

http://leonidzhukov.net/hse/2014/socialnetworks/index.html

10 Online Social Networks: Human Cognitive Constraints in Face-

book, Twitter and Reddit Personal Graphs / Valerio Arnaboldi, Andrea Passarel-

la, Marco Conti, Robin I.M. Dunbar // Waltham: Elsevier Inc. - 2015. – Vol. 12.

– P. 113.

11 Большая Стенфордская Коллекция Сетевых Данных -

Электрон. Дан. – Режим доступа: http ://snap.stanford.edu/data/

12 Информационное общество / C.B. Бондаренко // Измерительная

техника. - 2002. - Вып.1. – 264 с.

13 Об устойчивости и мощности критериев проверки

однородности средних / Лемешко Б.Ю., Лемешко С.Б. // Измерительная

техника. – 2008. №9. – С.23-28.

14 Социальные сети: модели информационного влияния,

управления и противоборства / Губанов Д.А., Новиков Д.А., Чхаратишвили

А.Г. Под ред. чл.-корр. РАН Д.А. Новикова // – М.: Издательство физико-

математической литературы. – 2010. – 288 с.

15 Социальная сеть Reddit – Вопросы и ответы. - Электрон. Дан. –

Режим доступа: https://www.reddit.com/help/contentpolicy

Page 44: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

44

16 Средство визуализации данных. - Электрон. Дан. – Режим

доступа: https://gephi.org/

17 Статистический анализ данных, моделирование и исследование

вероятностных закономерностей / Б. Ю. Лемешко, С. Б. Лемешко,

С. Н. Постовалов, Е. В. Чимитова // Компьютерный подход: монография —

Новосибирск: Изд-во НГТУ. – 2011. — 888 с.

18 Статистика социальной сети Reddit. - Электрон. Дан. – Режим

доступа: http://konect.uni-koblenz.de/networks/reddit. (дата обращения:

09.09.2016)

19 Статистические данные посещения социальной сети. -

Электрон. Дан. – Режим доступа: http://www.alexa.com/

20 Теория вероятностей и математическая статистика / Гмурман

В.Е. // – Учебное пособие. Высшее образование. – 2007. – 251 с.

Воронежский научно-образовательный центр

управления информационными рисками

Page 45: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

45

УДК 004. 056

СОЦИАЛЬНАЯ СЕТЬ SCIENTIFIC COLLABORATION:

СТРУКТУРНО – ФУНКЦИОНАЛЬНЫЕ ОСОБЕННОСТИ

РАСПРОСТРАНЕНИЯ КОНТЕНТА

Е.А. Шварцкопф, С.А. Щеглов, А.В. Паринов

Scientific collaboration - социальная сеть ученых, свободная инфор-

мационная площадка научного общения, инструмент коммуникации, поис-

ка людей и научных знаний [1,2].

Цель сети - создать условия развития науки благодаря генерации

научной мысли при взаимодействии исследователей.

Задача сети - обеспечить бесплатное и удобное общение начинаю-

щим и состоявшимся исследователям, свободный доступ к научным зна-

ниям.

Сеть позволяет:

- создать персональную страницу;

- найти людей, разбирающихся в интересующих вопросах;

- найти научный материал на родном или иностранном языке;

- всегда быть на связи с друзьями, коллегами, учениками и учителя-

ми;

- публиковать и обсуждать статьи и исследования;

- рассказать о своей научной деятельности людям;

- размещать и получать научные вакансии и предложения о совмест-

ной научной работе;

- взаимодействовать с представителями учебных заведений;

- всегда быть в курсе последних достижений и разработок;

- размещать и получать научные новости на новостном ресурсе;

Page 46: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

46

- размещать и получать информацию о проводимых конференциях и

семинарах;

- получать данные о новых публикациях по своим научным темати-

кам.

Для начала оценки структурно-функциональной особенности сети

Scientific collaboration требуется рассмотреть [1, 2]:

1) ресурсы сети (рис. 1);

2) контент сети (рис. 2);

3) объекты сети (рис. 2);

4) субъекты сети (рис. 3);

5) действия в социальной сети (рис. 4,5).

После выполнения всех вышеперечисленных пунктов был проведен

анализ результатов и построена структурно-функциональная модель соци-

альной сети Scientific collaboration (рис. 6).

В социальной сети Scientific collaboration все сетевые ресурсы можно

разделить на два основных типа: ресурсы коллективного пользования и ре-

сурсы персонального пользования (рис. 1) [1, 3].

Page 47: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

47

Рис. 1. Ресурсы сети Scientific collaboration

К ресурсам коллективного пользования относятся те ресурсы, кото-

рые доступны всем субъектам социальной сети без исключения, где все

пользователи способны просматривать новостную ленту, библиотеку или

пользоваться магазином.

К ресурсам персонального пользования относится личный профиль

каждого пользователя, где доступ к такому ресурсу имеет только непо-

средственный владелец профиля.

В социальной сети Scientific collaboration циркулирует большое ко-

личество информации, которая представлена в виде различного контента:

текстовая информация, изображения и видеозаписи, содержимое которых

можно разделить на различные объекты, создаваемые и публикуемые

пользователями сети Scientific collaboration (рис.2).

Page 48: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

48

Львиную долю сети занимает текстовый контент - около 90% всей

циркулирующей информации. Оставшиеся 10% - доля изображений и ви-

део (рис. 2).

Рис. 2. Контент и объекты сети Scientific collaboration

При анализе аудитории данной социальной сети (рис. 3) целесооб-

разно выделить три основных типа лиц, задействованных в публикации,

просмотре, комментировании и обсуждении того или иного контента [1-3]:

1. Модераторы. Они имеют одинаковые права, следят за поряд-

ком в социальной сети и занимаются публикацией предложенной пользо-

вателем новостной статьи или любого другого контента, который поддер-

живается в данной социальной сети;

2. Авторизованные пользователи. В данный перечень входят

пользователи социальной сети, прошедшие регистрацию аккаунта. После

Page 49: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

49

чего они получают расширенные возможности пользования в социальной

сети. В свою очередь, весь блок зарегистрированных пользователей можно

разделить на две части: активные и пассивные пользователи.

3. Активные пользователи. Данная часть пользователей участвует

в дискуссиях (комментировании) заинтересовавших их статей, обсуждени-

ях интересующих их вопросов в личных группах, предложением собствен-

ных научных трудов, оценке других пользователей. Чем больше активно-

сти проявляет пользователь в социальной сети, тем большее число публи-

каций и комментариев он имеет. Исходя из числа публикаций и коммента-

риев данного пользователя, можно судить о его адекватности и компетент-

ности мнения при ведении дискуссии под предложенной статьей. Также,

данная часть пользователей может поделиться предложенной статьей в

другой социальной сети (Facebook, Google+ и другие), тем самым привле-

кая внимание как к самой статье других участников сетевого пространства,

так и к сети Scientific collaboration. Вследствие чего пользователи других

социальных сетей могут зарегистрироваться на сайте и стать новыми ак-

тивными или пассивными пользователями социальной сети Scientific col-

laboration.

4. Пассивные пользователи, которые не принимают активного

участия в дискуссиях и комментировании других пользователей. Их не ин-

тересует публикация собственных научных трудов и ведение исследова-

тельских групп. Они ознакомляются с новыми статьями на главной стра-

нице социальной сети или с помощью новостной ленты.

5. Неавторизованные пользователи, которые имеют ограничен-

ные возможности в данной социальной сети. Им доступен просмотр статей

на главной странице сайта, научная библиотека, журналы и раздел вакан-

сий [4].

Page 50: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

50

Рис. 3. Субъекты сети Scientific collaboration

В социальной сети Scientific collaboration пользователи имеют опре-

деленный набор действий (функций), позволяющий им взаимодействовать

с контентом. Все возможности доступные субъектам данной социальной

сети можно классифицировать по двум признакам [1-3]:

1. По доступности. То есть все действия в данной социальной се-

ти можно разделить на две основные группы: управленческие (доступные

только модератору и администратору), и пользовательские, которые в

свою очередь подразделяются на возможности доступные только автори-

зованным пользователям и возможности доступные неавторизованным

пользователям;

2. Также целесообразно рассмотреть все действия в социальной

сети по функциональной возможности, доступные авторизованным и неав-

торизованным пользователям.

Данные классификации способны дать представление о полном

списке возможностей всех субъектов социальной сети Scientific collabora-

Page 51: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

51

tion, что позволит проанализировать их действие и поведение в различных

ситуациях, а также построить структурно-функциональную модель соци-

альной сети Scientific collaboration [5-11].

Рассмотрим первую классификацию действий субъектов в социаль-

ной сети с позиции доступности, изображенную на рисунке 4.

Рис. 4. Классификация действий субъектов в социальной сети Scientific

collaboration с позиции их доступности

Пользовательские действия в свою очередь подразделяются на дей-

ствия доступные авторизованным и неавторизованным пользователям.

К числу действий авторизованных пользователей можно отнести все

основные возможности, которые получает субъект после прохождения ре-

Page 52: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

52

гистрации в социальной сети. К ним можно отнести: ознакомление, ком-

ментирование, сохранение, публикация, распространение и другие.

К возможностям неавторизованных пользователей относится намно-

го меньше действий: ознакомление, поиск и регистрация. Однако, пройдя

процесс регистрации, они могут получить расширенные возможности, до-

ступные только авторизованным пользователям.

Далее рассмотрим вторую предложенную классификацию действий

доступных пользователям социальной сети Scientific collaboration, изобра-

женную на рисунке 5.

Рис. 5. Классификация действий субъектов в социальной сети Scientific

collaboration с позиции их функционала

В данной классификации действия доступные пользователям были

разделены на три основные категории: размещение, ознакомление и реаги-

рование.

Page 53: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

53

В категории «размещение», пользователям доступны публикация ма-

териалов, создание групп, проектов, вакансий, резюме и грантов.

В категории «ознакомление», пользователи способны читать библио-

теку, просматривать новости, резюме, вакансии.

Весь функционал пользователя социальной сети Scientific

collaboration сосредоточен в категории «реагирование». В данную катего-

рию попали действия, которые следуют после ознакомления пользователей

с предложенным контентом.

С учетом полученных классификаций контента, субъектов и их действий, а

также сетевых ресурсов данной социальной сети предоставляется возмож-

ным построить структурно-функциональную модель социальной сети

Scientific collaboration с учетом всех ее особенностей (рис. 6).

Рис. 6. Классификация действий субъектов в социальной сети Scientific col-

laboration с позиции их функционала

Page 54: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

54

В данной модели (рис. 6) функциональные связи представляют собой

сложную структуру взаимодействия контента, сетевых ресурсов и субъек-

тов, функционирующих в заданном сетевом пространстве [12].

Необходимым элементом для анализа социальной сети Scientific col-

laboration является нахождение взвешенных метрик.

Для того, чтобы перейти к представлению статистических данных в

виде матрицы взвешенности, рассмотрим понятие трехместного предиката

на основе статистики сети Scientific collaboration. Трехместный предикат

для социальной сети Scientific collaboration будет иметь вид (x y z), x и y -

смежные вершины, z - вес инцидентного ребра для вершин x и y.

Рассмотрим статистические данные социальной сети Scientific

collaboration, собранные в течение 2 лет, начиная с 2013 года [13]. Данная

сеть является ориентированной и состоит из 16726 вершин, каждая из ко-

торых представлена ученым. Для такой социальной сети трехместный

предикат выглядит следующим образом (табл. 1). Т.к. данный предикат со-

стоит из 95188 строк, изобразим некоторую его часть для наглядности в

таблице 1, где вес связи обозначает суммарное количество статей, которое

написали ученые, являющиеся смежными вершинами социальной сети.

Таблица 1 - Трехместный предикат социальной сети Scientific collab-

oration

Идентификатор первой вершины Идентификатор второй вершины Вес связи

1 190 7

1 201 3

1 562 2

8 9 10

9 362 5

11 9044 3

15 334 1

Page 55: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

55

К данной статистике прилагается список ученых, каждому из кото-

рых присвоен свой идентификатор вершины, например, 1-Radzihovsky L.,

2- Frischat SD, 8- Cirrillo ENM, 9- Gonnella G, 11- Haldane FDM, 15- Eder R

и т.д [14].

Таким образом, суть алгоритма преобразования исходных данных

социальной сети Scientific collaboration заключается в построении тройного

предиката сначала в виде звездной матрицы и затем в виде матрицы взве-

шенной центральности.

На основе предложенного алгоритма преобразования исходных дан-

ных сети построим звездную матрицу социальной сети Scientific collabora-

tion, элементы строки которой соответствуют дугам, входящим в данную

вершину, а элементы столбца – дугам, исходящим из вершины (табл. 2).

Таблица 2 – Звездная матрица социальной сети Scientific collaboration

(N=16726)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 … N

1 - 0 0 0 0 0 0 0 0 0 0 0 0 0 … 0

2 - 1 0 0 0 0 0 0 0 0 0 0 0 … 0

3 0 1 - 0 0 0 0 0 0 0 0 0 0 0 … 0

4 0 0 0 - 5 23 4 0 0 0 0 0 0 0 … 0

5 0 0 0 5 - 4 0 0 0 0 0 0 0 0 … 0

6 0 0 0 23 4 - 1 0 0 0 0 0 0 0 … 0

7 0 0 0 4 1 - 0 0 0 0 0 0 0 … 0

8 0 0 0 0 0 0 0 - 10 0 0 0 0 0 … 0

9 0 0 0 0 0 0 0 10 - 0 0 0 0 0 … 0

10 0 0 0 0 0 0 0 0 0 - 0 0 0 0 … 0

11 0 0 0 0 0 0 0 0 0 0 - 0 0 0 … 0

12 0 0 0 0 0 0 0 0 0 0 0 - 1 1 … 0

13 0 0 0 0 0 0 0 0 0 0 0 1 - 1 … 0

14 0 0 0 0 0 0 0 0 0 0 0 1 1 - … 0

… … … … … … … … … … … … … … … … …

N 0 0 0 0 0 0 0 0 0 0 0 0 0 0 … 0

Page 56: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

56

На втором шаге определим количество исходящих дуг (степень ис-

хода) для каждого узла социальной сети. Данная матрица будет необходи-

ма для последующих процедур моделирования процессов диффузии

контента в социальной сети (табл. 3).

Таблица 3 – Диагональная матрица степеней вершин сети Scientific

collaboration (N=16726)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 … N

1 15 0 0 0 0 0 0 0 0 0 0 0 0 0 … 0

2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 … 0

3 0 0 1 0 0 0 0 0 0 0 0 0 0 0 … 0

4 0 0 0 18 0 0 0 0 0 0 0 0 0 0 … 0

5 0 0 0 0 6 0 0 0 0 0 0 0 0 0 … 0

6 0 0 0 0 0 28 0 0 0 0 0 0 0 0 … 0

7 0 0 0 0 0 0 4 0 0 0 0 0 0 0 … 0

8 0 0 0 0 0 0 0 11 0 0 0 0 0 0 … 0

9 0 0 0 0 0 0 0 0 10 0 0 0 0 0 … 0

10 0 0 0 0 0 0 0 0 0 1 0 0 0 0 … 0

11 0 0 0 0 0 0 0 0 0 0 7 0 0 0 … 0

12 0 0 0 0 0 0 0 0 0 0 0 2 0 0 … 0

13 0 0 0 0 0 0 0 0 0 0 0 0 3 0 … 0

14 0 0 0 0 0 0 0 0 0 0 0 0 0 2 … 0

… … … … … … … … … … … … … … … … …

N 0 0 0 0 0 0 0 0 0 0 0 0 0 0 … 4

На третьем шаге построим квадратную матрицу взвешенной цен-

тральности элементов сети. Для этого необходимо определить удельный

вес ее вершин и дуг с помощью нормировки их весов по суммарному тра-

фику сети по следующей формуле:

где – вес трафика в дуге .

Выражение (1) будет характеризовать степень взвешенной (по тра-

фику) центральности дуги.

Page 57: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

57

Однако следует заметить, что суммарный трафик сети не разделяет

входящие и исходящие дуги. Поэтому для определения взвешенной цен-

тральности вершины можно использовать сумму, которую далее следу-

ет пронормировать по суммарному трафику сети:

В результате из (2) получим нормированную величину, которая бу-

дет характеризовать удельный вес трафика, проходящего через вершину

, по отношению ко всему трафику сети:

где – вес трафика в исходящей из узла дуге;

– вес трафика во входящей в узел дуге.

В итоге, следуя формуле (3) получим матрицу взвешенной централь-

ности элементов исходной сети следующего вида (табл. 4).

Таблица 4 - Матрица взвешенной центральности социальной сети

Scientific collaboration

1 2 … 12 13 … 21 22 … 16726

1 0 … 0 0 … 0 0 … 0

2 0 … 0 0 … 0 0 … 0

… … … … … … … … … … …

12 0 0 … … 0 0 … 0

13 0 0 … … 0 0 … 0

… … … … … … … … … … …

21 0 0 … 0 0 … … 0

22 0 0 … 0 0 … … 0

… … … … … … … … … … …

16726 0 0 … 0 0 … 0 0 …

Page 58: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

58

Последний этап преобразования исходных данных сети заключается

в нахождении и построении диагональной матрицы удельного баланса

трафика в вершинах социальной сети Scientific collaboration.

На данном этапе будет учитываться не сумма, а разность исходящего

и входящего для вершины трафиков:

где – вес трафика в исходящей из узла дуге;

– вес трафика во входящей в узел дуге.

В результате данных вычислений получим диагональную матрицу

удельного баланса трафика в вершинах сети (табл. 5).

Полученная удельная величина характеризует роль вершины (субъ-

екта) сети:

- при – это генератор контента;

- при – это аккумулятор контента.

Чем больше модуль , тем в большей степени проявляется его роле-

вая функция.

Таблица 5 - Матрица удельного баланса трафика в вершинах соци-

альной сети Scientific collaboration

1 2 … 12 13 … 21 22 … 16726

1 0 … 0 0 … 0 0 … 0

2 0 … 0 0 … 0 0 … 0

… … … … … … … … … … …

12 0 0 … 0 … 0 0 … 0

13 0 0 … 0 … 0 0 … 0

… … … … … … … … … … …

21 0 0 … 0 0 … 0 … 0

22 0 0 … 0 0 … 0 … 0

… … … … … … … … … … …

16726 0 0 … 0 0 … 0 0 …

Page 59: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

59

Так как социальная сеть достаточно велика и включает в себя десят-

ки тысяч вершин, что затрудняет в полной степени ее проанализировать,

следует преобразовать всю сеть в некоторую выборку сети, которая в пол-

ной мере описывает и отражает все основные свойства сети.

Данный подход заключается в отборе вершин по их степени, то есть

количеству инцидентным им дуг. Однако такой подход не учитывает тот

факт, что каждая дуга имеет свой вес. Таким образом, отсутствует взве-

шенная оценка с точки зрения трафика.

Суть данного алгоритма состоит в том, что требуется из полученных

квадратных матриц взвешенности, получить усеченное количество узлов,

которые способны с сохранением подобия описать исходную сетевую

структуру.

Поэтому в предложенном алгоритме уместно использование квад-

ратной матрицы взвешенной центральности элементов сети, а точнее – ее

диагонали, где определен показатель удельного веса трафика, проходящего

через каждую вершину, по отношению ко всему трафику сети (табл. 6).

Таблица 6 – Показатели степени взвешенной центральности вершин

Номер узла Показатель Номер узла Показатель

1 0,0001575 21 0,000364

2 0,00211 22 0,00004307

3 0,00105 23 0,0000195

… … … …

11 0,00007353 16724 0,00004202

12 0,00006303 16725 0,00000407

13 0,0003151 16726 0,00000322

Далее необходимо проранжировать показатели степени взвешенной

центральности узлов матрицы в порядке убывания (табл. 7):

Page 60: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

60

Таблица 7 – Проранжированные показатели степени взвешенной

центральности вершин

Номер узла Показатель Номер узла Показатель

4474 0,09124091 4571 0,00212786

7315 0,07082069 920 0,00212563

4034 0,0700853 3075 0,00212422

5489 0,0687519 3113 0,00212102

… … … …

2225 0,00213440 16501 0,0000105364

2306 0,00213046 16563 0,0000105055

На следующем этапе просуммируем полученные значения до полу-

чения необходимого результата (точности модели), то есть до значения

0.95, так как допустима 5% потеря трафика. Полученная сумма должна

быть не меньше 0,95 [15]. Этим критерием и ограничится репрезентатив-

ная (с точки зрения трафика) выборка:

.

При данном суммировании имеем выборку из 419 элементов, с по-

мощью которых можно описать данную сеть с 5% погрешностью.

Далее обнулим столбцы и стоки не входящих в данную выборку уз-

лов матрицы (табл. 4).

На основе данного усечения построим матрицу (табл. 8).

Page 61: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

61

Таблица 8 – Проранжированная усеченная матрица социальной сети

Scientific collaboration

Порядковый

№ 1 2 … 165 166 … 321 … 418 419

№ узла 4474 7315 … 223 519 … 8747 … 15867 1568

1 4474 0 0 … 0 0 … 0 … 0 0

2 7315 0 0 … 0 0 … 0 … 0 0

3 4034 0 … 0 0 … … 0 0

… … … … … … … … … … … …

165 223 0 … 0 … 0 … 0 0

166 519 0 0 … 0 0 … 0 … 0 0

… … … … … … … … … … … …

321 8747 0 0 … 0 0 … 0 … 0 0

… … … … … … … … … … … …

418 15867 0 0 … 0 0 … 0 … 0 0

419 15868 0 0 … 0 0 … 0 … 0 0

На основе данной матрицы, с помощью программного обеспечения

Gephi [16] построим усеченный граф социальной сети (рис. 7).

Рис. 7. Выборка социальной сети Scientific collaboration

Стоит отметить, что у данной социальной сети прослеживается явная

кластерность (рис. 7), которая напрямую зависит от возможностей автори-

зованных пользователей – любой авторизованный пользователь может

Page 62: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

62

совместно с другим авторизованным пользователем выпустить научный

материал. Для чего в данной сети предусмотрена возможность создавать

группы, которые облегчают процесс отыскания интересующих тем и объ-

единяют ученых для обсуждения только им интересных вопросов, то есть

образуются узлы концентраторы – распространители информации. Так как

каждый узел имеет уникальный идентификационный номер, который со-

ответствует конкретному пользователю сети [14], то легко можно устано-

вить создателя группы и ее принадлежность к конкретной научной обла-

сти, это подтверждает, что выборка содержит 27 кластеров.

Последний этап алгоритма состоит в формировании итоговой матри-

цы, в виде удобном для последующего моделирования информационной

диффузии, где недиагональные элементы равны 1, так как интересует

лишь факт смежности вершин истоков (+1) и стоков (-1), а диагональные

элементы имеют вес k, равный сумме элементов (+1) столбца. Отсюда

определяется ожидаемое количество вирусованных контентом элементов.

Данная матрица выглядит следующим образом (табл. 9).

Таблица 9 – Модифицированная матрица смежности социальной се-

ти Scientific collaboration

1 2 3 … 165 166 … 321 322 323 … 418 419

1 0 0 0 … 0 0 … 0 0 0 … 0 0

2 0 0 0 … 0 0 … 0 0 0 … 0 0

3 0 0 10 … 0 0 … 1 0 0 … 0 0

… … … … … … … … … … … … … …

165 -1 0 0 … 6 1 … 0 0 0 … 0 0

166 0 0 0 … 0 9 … 0 0 0 … 1 0

… … … … … … … … … … … … … …

321 0 0 0 … 0 0 … 12 0 … 0 0

322 0 0 0 … 0 0 … 0 16 0 … 0 0

323 0 0 0 … 0 0 … 0 0 18 … 0 0

… … … … … … … … … … … … … …

418 0 0 0 … 0 -1 … 0 0 0 … 13 0

419 0 0 0 … 0 0 … 0 0 0 … 0 25

Page 63: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

63

Для того чтобы с уверенностью можно было пользоваться усеченной

сетью, необходимо доказать подобие основной сети ее выборке. Одним из

возможных способов доказать подобие основной сети и полученной репре-

зентативной выборки (на основе доказательства о принадлежности полу-

ченной выборки сети к степенному закону распределения) является крите-

рий Пирсона [17].

Посчитаем критерий Пирсона для выборки сети Scientific

collaboration по формуле:

где n – объем выборки;

- вероятность попадания случайной величины X в заданный ин-

тервал степеней.

Тогда следуя представленной формуле (5), рассчитаем значение .

В данном случае χ2 = 18.54. Теперь посчитаем (выборка) – 1 (коли-

чество параметров в плотности степенного распределения) = 18 (число

степеней свободы). Выберем уровень значимости , тогда

[18]. Табличное значение равно 28.9. Получается,

что табличное значение больше вычисленного. Следовательно, гипотеза

верна, и приведенное степенное распределение согласуется с результатами

эксперимента, что и требовалось доказать.

Следующим шагом, рассчитаем среднеквадратические отклонения

(СКО) для исходной сети и полученной репрезентативной выборки по

формулам (6) и (7):

Page 64: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

64

где: n – общее число вершин;

– i-ый элемент выборки;

– среднее арифметическое выборки;

– среднеквадратическое отклонение.

Тогда получим: – СКО генеральной совокупности;

– СКО репрезентативной выборки.

Отклонение между эталоном (генеральной совокупностью) и полу-

ченной выборкой получилось равным . Это доказывает, что репре-

зентативная выборка подобна генеральной совокупности с заданной точ-

ностью 5% [15].

Сравним полученные гистограммы распределения вершин для пер-

воначальной и усеченной сетей, где по горизонтальной оси отложен интер-

вал степеней вершин, а по вертикальной – процентная доля вершин в k

слое, изображенные на рисунке 8.

Page 65: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

65

Рис. 8. Гистограмма распределения степеней вершин

Из рисунка 8 видно, что распределение генеральной совокупности и

полученной репрезентативной выборки имеют схожую форму и имеют до-

пустимое отклонение 4,89% не превышающее 5%, что и было получено в

ходе проверки распределений [15].

Таким образом, используя алгоритм преобразования исходных дан-

ных сети, была найдена репрезентативная выборка, получена визуальная

модель усеченной социальной сети Scientific collaboration и соответствую-

щие матрицы, способные в полной мере охарактеризовать структурно-

функциональные особенности распространения контента в социальной се-

ти Scientific collaboration, что поможет достичь главной цели исследования,

которая состоит в оценке и регулировании рисков, возникающих в сети в

случае распространения в ней деструктивного контента [19-22]. Для этого

в дальнейшем необходимо решить ряд задач:

Page 66: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

66

1. Используя построенную микро-модель сети Scientific collabora-

tion промоделировать сетевой эпидемический процесс[23-25];

2. Управление рисками с учетом определенного вероятного

ущерба информационной эпидемии по суммарному весу, метрик, матриц

смежности, взвешенности и послойной внутрисетевой связанности [26-28].

Литература:

1. Newman, M. E. J. the structure of scientific collaboration networks

[Text]/ M. E. J. Newman// Proc. Natl. Acad. Sci. USA 98. -2001. – P. 404–409.

2. Principles of scientific research team formation and evolution Proc.

Natl. Acad. Sci. USA 2014. – 89 с.

3. Evolution and convergence of the patterns of international scientific

collaboration Proc. Natl. Acad. Sci. USA 2016. 57 – 61с.

4. Жуликов С. Е., Жуликова О. В. Современные подходы к анализу

социальных сетей // Гаудеамус: психолого-педагогический журнал. – 2012.

– №2 (20). – С. 200–202.

5. Antsupov, A. Ya. Conflictology: the textbook for higher education in-

stitutions / A.Ya. Antsupov, A. I. Shilov. – 3rd prod., reslave. and additional –

SPb.: St. Petersburg, 2007. – 591 p.

6. Bachilo, I. L. About the concept of legal support of informatization of

Russia. Legislative problems of informatization of society/I.L. Bachilo, G. V.

Belov / – M.: World, 1992. – 400 p.

7. Bachilo, I. L. Information right. The textbook Under the editorship of

the academician of RAS B. N. Topornina/I.L. Bachilo, V. N. Lopatin, M. A. Fe-

dotov and other / SPb.: Legal center, 2001. – 789 p.

Page 67: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

67

8. Bachilo, I. L. Information right: fundamentals of practical informatics:

Education guidance / I.L. Bachilo / – M: Edition of Mr. M.Yu.Tikhomirov,

2001. – 352 p.

9. Byrd, K. War with many unknowns / K. Byrd//Computerra. – M.: 2009.

– No. 20. – 5 p.

10. Grinyaev, S. Russia in global information society: threats, risks and

possible ways of their neutralization / S. Grinyaev, – Electron. it is given. – Ac-

cess mode: http://www.noravank.am/upload/pdf/419_ru.pdf.

11. Kalashnikov, A.O. Attacks to information and technological infra-

structure of crucial objects: assessment and regulation of risks: Monograph /

A.O. Kalashnikov, E. V. Yermilov, O. N. Choporov, K. A. Razinkin, N. I.

Barannikov; under the editorship of the Member correspondent of RAS D. A.

Novikov. - Voronezh: Scientific Book publishing house. 2013. - 160 p.

12. Стрельников А. Н. Социальные сети: механизмы работы и пути

развития. Электрон. дан. – Режим доступа:

http://www.rae.ru/forum2011/153/1796

13. Сайт статистики взвешенной матрицы. – Электрон. дан. – Ре-

жим доступа: http://opsahl.co.uk/tnet/datasets/Newman-Cond_mat_95-99-

co_occurrence.txt

14. Social Network Analysis John Scott 19 ноября 2013 г. SAGE –

Электрон. дан. – Режим доступа: http://www.pnas.org/content/98/2/404.full

15. Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные

сети: модели информационного влияния, управления и противоборства /

Под ред. чл.-корр. РАН Д.А. Новикова. –М.: Издательство физико-

математической литературы, 2010. – 116с.

16. Средство визуализации данных. - Электрон. Дан. – Режим до-

ступа: https://gephi.org/

Page 68: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

68

17. Гмурман В.Е., Теория вероятностей и математическая стати-

стика. Учебное пособие. Высшее образование. – Москва, 2006 – С. 243.

18. Analytical estimation of the component viability of distribution au-

tomated information data system / G.A. Ostapenko, D.G. Plotnicov, O.Y

Makarov, N.M. Tikhomirov, V.G. Yurasov // World Applied Sciences Journal. –

2013. – 25 (3). – P. 416-420.

19. Analytical models of information-psychological impact of social in-

formation networks on users / G.A. Ostapenko, L.V. Parinova, V.I. Belonozh-

kin, I.L. Bataronov, K.V. Simonov // World Applied Sciences Journal. – 2013. –

25 (3). – P. 410-415.

20. Assessment of the system's EPI-resistance under conditions of in-

formation epidemic expan ion / N.M. Radko, A.G. Ostapenko, S.V. Mashin,

O.A. Ostapenko, D.V. Gusev // Biosciences Biotechnology Research Asia. –

2014. – Vol. 11 (3). – P. 1781-1784.

21. Peak risk assessing the process of information epidemics expansion

/ N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, A.S. Avdeev //

Biosciences Biotechnology Research Asia. – 2014. – Vol. 11 (Spl.End). – P.

251-255.

22. Discreet risk-models of the process of the development of virus ep-

idemics in non-uniform networks / V.V. Islamgulova, A.G. Ostapenko,,N.M.

Radko, R.K. Babadzhanov, O.A. Ostapenko // Journal of Theoretical and Ap-

plied Information Technology. – 2016. – P. 306-315.

23. Analytical estimation of the component viability of distribution au-

tomated information data system / G.A. Ostapenko, D.G. Plotnicov, O.Y

Makarov, N.M. Tikhomirov, V.G. Yurasov // World Applied Sciences Journal. –

2013. – 25 (3). – P. 416-420.

24. Analytical models of information-psychological impact of social in-

formation networks on users / G.A. Ostapenko, L.V. Parinova, V.I. Belonozh-

Page 69: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

69

kin, I.L. Bataronov, K.V. Simonov // World Applied Sciences Jour-nal. – 2013.

– 25 (3). – P. 410-415.

25. Optimization of expert methods used to analyze information secu-

rity risk in modern wireless networks / S.A. Ermakov, A.S. Zavorykin, N.S.

Kolenbet, A.G. Ostapenko, A.O Kalashnikov // Life Science Journal. – 2014. –

№ 11(10 ). – P. 511-514.

26. Assessment of the system's EPI-resistance under conditions of in-

formation epidemic expan ion / N.M. Radko, A.G. Ostapenko, S.V. Mashin,

O.A. Ostapenko, D.V. Gusev // Biosciences Biotechnology Research Asia. –

2014. – Vol. 11 (3). – P. 1781-1784.

27. Peak risk assessing the process of information epidemics expansion

/ N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, A.S. Avdeev //

Biosciences Biotechnology Research Asia. – 2014. – Vol. 11 (Spl.End). – P.

251-255.

28. Discreet risk-models of the process of the development of virus ep-

idemics in non-uniform networks / V.V. Islamgulova, A.G. Ostapenko,,N.M.

Radko, R.K. Babadzhanov, O.A. Ostapenko // Journal of Theoretical and Ap-

plied Information Technology. – 2016. – P. 306-315.

Воронежский научно-образовательный центр управления

информационными рисками

Page 70: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

70

УДК 004.506

СОЦИАЛЬНАЯ СЕТЬ SOUNDCLOUD:

СТРУКТУРНО – ФУНКЦИОНАЛЬНЫЕ ОСОБЕННОСТИ

РАСПРОСТРАНЕНИЯ КОНТЕНТА

Д.В. Ракшин, А.В. Паринов

Социальная сеть SoundCloud – это сеть для обмена медиаконтентом

[11]. Это относительно новая сеть для обмена аудиоконтентом, общения

пользователей. Ключевой особенностью SoundCloud является возможность

распространять каждую запись в отдельности с помощью уникально-

го URL, что позволяет встраивать их в популярные сети (например, в

Twitter, Facebook) [7-18].

SoundCloud обладает уникальной особенностью оставлять коммен-

тарии в любом месте звукового файла. Редактирование комментария не-

возможно, но есть возможность удалить комментарий и написать новый

[16].

Чтобы произвести оценку структурно-функциональных особенно-

стей социальной сети SoundCloud, необходимо рассмотреть:

1) циркулирующий контент сети;

2) ресурсы сети;

3) субъекты сети;

4) действия субъектов сети:

а) зарегистрированных пользователей;

б) незарегистрированных пользователей.

В социальной сети SoundCloud циркулирует большое многообразие

информации, которая представлена в виде различного контента: текстовая

Page 71: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

71

информация, изображения и аудиозаписи, которые можно разделить на

объекты, создаваемые и публикуемые пользователями сети (рис.1).

Данная сеть пользуется огромным спросом у начинающих музыкан-

тов. Любой желающий может пройти регистрацию и загружать свои треки,

создавать альбомы.

Рис. 1. Классификация контента в социальной сети SoundCloud

Из рисунка 1 следует, что большинство циркулирующего контента –

это аудиофайлы, которые, в свою очередь, разделяются по направлениям,

стилям. Также стоит отметить, что существуют платные подписки, где

пользователю предоставляется более обширная информация о статистике

прослушивания, рейтинге аудиозаписей и исполнителях, о статистике со-

циальной сети, в целом. Существуют также платные треки для скачивания

произведений популярных исполнителей.

На рисунке 2 представлены ресурсы социальной сети, которые раз-

деляются на ресурсы коллективного и персонального использования [12].

Page 72: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

72

Рис. 2. – Ресурсы сети SoundCloud

Ресурсы SoundCloud предназначены для персонального пользования

(аккаунт пользователя, аккаунт модератора) и коллективного пользования

(новостная лента, главная страница сайта, каналы и альбомы пользовате-

лей).

К персональным ресурсам доступ имеет только сам пользователь и

администраторы сайта. К ресурсам коллективного пользования доступ

имеют зарегистрированные и незарегистрированные пользователи, но на

размещение контента имеют право только зарегистрированные пользова-

тели.

Администрация сети контролирует публикацию всех новых аудиоза-

писей.

При анализе аудитории данной социальной сети стоит выделить [4]

два типа пользователей: активные и пассивные (рис.3):

Page 73: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

73

Рис. 3. Субъекты сети SoundCloud

1. Модераторы. На сайте SoundCloud управление полностью лежит

на модераторах. Они имеют одинаковые права, следят за порядком в

социальной сети и занимаются публикацией аудиофайлов, которые

предложили пользователи.

2. Зарегистрированные пользователи. В данный перечень входят

пользователи социальной сети, прошедшие регистрацию аккаунта. В свою

очередь, весь блок зарегистрированных пользователей можно разделить на

две части: активные и пассивные пользователи:

– активные пользователи. Данная часть пользователей участвует в

дискуссиях (комментировании) заинтересовавшей их статье, составлении

своих плейлистов, предложением собственных аудиозаписей. Чем больше

активности проявляет пользователь в социальной сети, тем большее число

оценок он имеет;

– пассивные пользователи. Это пользователи, которые не прини-

мают активного участия в дискуссиях, составлении и добавлении своих

аудиозаписей, оценке других пользователей.

Page 74: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

74

3. Незарегистрированные пользователи. Им доступно: просмотр

главной страницы, прослушивание треков, чтение комментариев к

некоторым трекам.

Каждый пользователь может установить свой круг лиц, который мо-

жет просматривать альбом и прослушивать его треки.

В социальной сети SoundCloud пользователи имеют ряд функций для

взаимодействия с контентом (рис.4).

Рис. 4. Классификация действий субъектов в социальной сети SoundCloud

с позиции их доступности

Из рисунка 4 видно, что в данной социальной сети все функции, до-

ступные как обычным пользователям, так и модераторам с администрато-

ром, можно разделить на две категории: управленческие и пользователь-

ские функции.

Page 75: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

75

К управленческим функциям можно отнести такие как: администри-

рование и модерация.

Под администрированием в данном контексте понимается установ-

ление необходимых настроек сайта доступным только администратору.

Под модерацией стоит понимать действия привилегированных поль-

зователей (модераторов) по контролю за соблюдением установленных ад-

министратором правил другими пользователями. Обычно модераторы сле-

дят за соблюдением правил на различных форумах социальной сети.

Пользовательские функции, в свою очередь, подразделяются на

функции доступные авторизованным и неавторизованным пользователям.

К возможностям неавторизованных пользователей относится намно-

го меньше функций: ознакомление и распространение (рис.5). Однако, они

могут пройти процесс регистрации и получить расширенные возможности

[19].

Рис. 5. Действия неавторизированных пользователей

Page 76: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

76

К числу функций авторизованных пользователей можно отнести все

основные возможности, которые получает субъект после прохождения ре-

гистрации в социальной сети (рис.6).

Рис. 6. Действия авторизированных пользователей

С учетом полученных классификаций контента, субъектов и их дей-

ствий, а также сетевых ресурсов данной социальной сети следует постро-

ить структурно-функциональную модель социальной сети SoundCloud

[10]. В данной модели функциональные связи представляют собой слож-

ную структуру взаимодействия контента, сетевых ресурсов и субъектов,

функционирующих в заданном сетевом пространстве [6].

Отсюда следует структурно-функциональная схема социальной сети

SoundCloud (рис.7).

Page 77: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

77

Рис. 7. Структурно-функциональная схема социальной сети SoundCloud

Page 78: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

78

Для анализа социальной сети SoundCloud важно нахождение взве-

шенных метрик. Чтобы перейти к представлению статистических данных в

виде матрицы взвешенности рассмотрим понятие трехместного предиката

на основе статистики сети SoundCloud. Трехместный предикат для соци-

альной сети SoundCloud будет иметь вид (x y z), x и y - смежные вершины, z

- вес инцидентного ребра для вершин x и y [17].

Рассмотрим статистические данные социальной сети SoundCloud.

Данная сеть является ориентированной и состоит из 28637 вершин, каждая

из которых представлена пользователем. Для такой социальной сети в

трехместном предикате (табл. 1), вес дуги обозначает суммарное количе-

ство репостов аудиофайлов пользователя у другого пользователя, которые

он сохранил на свой аккаунт в социальной сети в сутки [17, 23].

Таблица 1– Фрагмент трехместного предиката социальной сети

SoundCloud [17]

Идентификатор истока вер-

шины

Идентификатор стока

вершины

Вес дуги

1 2 9

44 82 3

115 22 8

124 62 8

966 374 6

279 65 3

Сеть можно представить в виде звездной матрицы (табл.2), где эле-

менты строки которой соответствуют дугам, входящим в данную вершину,

а элементы столбца – дугам, исходящим из вершины. Сделав репрезента-

тивную выборку, можно получить распределение сети с меньшим количе-

ством вершин, т.е. сократить размерность анализируемой сети.

Page 79: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

79

Таблица 2 – Звездная матрица социальной сети SoundCloud

1 2 3 … 9 10 … 1527 15218 … 28236 28637

1 2 2 0 … 0 7 … 0 0 … 0 0

2 0 9 8 … 0 0 … 0 0 … 0 0

3 0 0 7 … 0 0 … 0 0 … 0 0

… … … … … … … … … … … … …

9 0 8 8 … 1 0 … 0 0 … 0 0

10 0 10 0 … 0 1 … 0 0 … 0 1

… … … … … … … … … … … … …

15217 0 0 0 … 0 0 … 1 0 … 0 0

15218 0 3 6 … 9 0 … 0 2 … 0 0

… 0 0 0 … 0 0 … 0 4 … 0 0

28636 0 0 0 … 0 0 … 1 3 … 4 7

28637 0 0 0 … 0 0 … 0 4 … 8 3

Далее следует формировать квадратную матрицу взвешенной цен-

тральности. Для ее построения необходимо нормировать (1) веса узлов по

сумме всех дуг сети по формуле:

Чтобы построить квадратную матрицу взвешенной центральности

элементов сети, нужно определить удельный вес ее вершин и дуг с помо-

щью нормировки их весов по суммарному трафику сети по следующей

формуле:

где – вес трафика в дуге .

Выражение (2) будет характеризовать степень взвешенной (по тра-

фику) центральности дуги.

Для определения взвешенной центральности вершины следует ис-

пользовать сумму, которую далее следует пронормировать по суммарному

трафику сети:

Page 80: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

80

Из выражения (3) получим нормированную величину, которая будет

характеризовать удельный вес трафика, проходящего через вершину , по

отношению ко всему трафику сети:

где: – вес трафика в исходящей из узла дуге;

– вес трафика во входящей в узел дуге.

В итоге, следуя формуле (4), можно получить квадратную матрицу

взвешенной центральности элементов исходной сети следующего вида

(табл. 3):

Таблица 3 – Матрица взвешенной центральности социальной сети

SoundCloud

46 88 … 15219 … 28637

46 0,010545 0,011345 … 0 … 0

88 0 0,000014 … 0,0000211 … 0

… … … … … … …

15219 0 0 … 0,0000354 … 0

… … … … … … …

28237 0 0 … 0 … 0,0000452

Последний этап заключается в построении диагональной матрицы

удельного баланса трафика в вершинах социальной сети SoundCloud.

На данном этапе можно учитывать разность исходящего и входящего

для вершины трафиков:

Page 81: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

81

где: – вес трафика в исходящей из узла дуге;

– вес трафика во входящей в узел дуге.

Из выражения (5) получим диагональную матрицу удельного балан-

са трафика в вершинах сети (табл. 5).

Следует отметить, что социальная сеть SoundCloud быстро развива-

ется, и требуется регулярная корректировка данных.

Таблица 5 – Диагональная матрица удельного баланса трафика в

вершинах сети SoundCloud

2 … 46 … 69 … 74 … 28637

46 0,00014 … 0 … 0 … 0 … 0

88 0 … -0,00016 … 0 … 0 … 0

165 0 … 0 … -0,00018 … 0 … 0

… … … … … … … … … …

1159 0 … 0 … 0 … -0,000017 … 0

… … … … … … … … … …

15219 0 0 0 0 0

… … … … … … … … … …

28637 0 0 0 0 -0,0000023

Данный метод заключается в отборе вершин по их степени, то есть

количеству инцидентным им дуг, но такой подход не учитывает тот факт,

что каждая дуга имеет свой вес и имеет взвешенную оценку с точки зре-

ния трафика.

Поэтому уместно построение матрицы взвешенной центральности

элементов сети, а точнее – ее диагонали, где определена степень взвешен-

ной центральности каждой вершины (табл.6).

Page 82: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

82

Таблица 6 – Степени взвешенной центральности вершин

Номер узла Степень Номер узла Степень

46 0,010575063 133 0,007469969

88 0,009741124 80 0,007434483

69 0,009386256 62 0,006724747

74 0,009333026 196 0,006636031

165 0,009262052 55 0,006440852

150 0,008853954 195 0,006263418

147 0,008818467 54 0,006227932

174 0,008818467 136 0,006227932

159 0,008747494 137 0,006156958

57 0,008374882 51 0,006121471

317 0,008357139 82 0,006121471

60 0,008215192 106 0,006015011

90 0,007647403 183 0,005944037

164 0,007611916 92 0,00585532

Далее необходимо проранжировать степени узлов матрицы по убы-

ванию (табл. 7):

Таблица 7 – Проранжированные степени взвешенной центральности

вершин

Номер узла Степень Номер узла Степень

1274 0,08073094 2470 0,00310121

6125 0,08012009 2723 0,0039102

… … … …

2241 0,00186911 28636 0,00000285

2216 0,00219451 28637 0,000000452

Просуммируем полученные значения до получения необходимого

результата (точности модели), т.е. до значения 0.95, так как допустима 5%

потеря трафика. Полученная сумма должна быть не меньше 0,95% [22].

Этим критерием и ограничится репрезентативная (с точки зрения трафика)

выборка:

В результате получили выборку из 309 вершин, с помощью которых

можно описать данную социальную сеть с 5% погрешностью.

Page 83: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

83

На основе данного усечения построим следующую матрицу

(табл.8):

Таблица 8 – Проранжированная усеченная матрица социальной сети

SoundCloud

С помощью программного обеспечения Gephi [29] построим граф

усеченной социальной сети (рис. 6):

Рис. 6. Выборка социальной сети SoundCloud

Последний этап состоит в формировании итоговой матрицы (табл.9)

в виде, удобном для последующего моделирования информационной диф-

фузии.

Порядковый №

1 2 … 211 … 308 309

№ узла 11274 6125 … 2723 … 28636 28637

1 1274 0 0 … 0,015324 … 0 0

2 3225 0 0 … 0 … 0 0

… … … … … … … … …

211 6821 0 0,016201 0 0 0

… … … … … … … … …

308 9897 0 0 … 0,017324 0 0

309 20841 0 0 … 0 0 0

Page 84: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

84

Таким образом, после применения предложенных алгоритмов преоб-

разования исходных данных сети, была найдена репрезентативная выборка

и получена визуальная модель усеченной социальной сети SoundCloud и

соответствующие матрицы, способные в полной мере охарактеризовать

распространение контента в данной социальной сети. Для того чтобы с

уверенностью можно было пользоваться усеченной сетью, необходимо до-

казать подобие основной сети ее выборке [24, 28].

Стоит отметить, что у данной социальной сети прослеживается явная

кластерность (рис.6). Это напрямую зависит от возможностей авторизо-

ванных пользователей – любой авторизованный пользователь может сов-

местно с другим авторизованным пользователем создать собственный

трек, который через одобрение администрации сайта становится доступен

для прослушивания.

Завершающий этап преобразований состоит в формировании итого-

вой матрицы в виде, удобном для последующего моделирования информа-

ционной диффузии.

Таблица 9 – Модифицированная матрица смежности сети

2 3 5 … 123 127 130 … 155 156 … 309

2 69 1 1 … 0 0 0 … 0 0 … 0

3 1 16 0 … 0 0 0 … 0 0 … 0

5 -1 0 49 … 0 0 0 … 0 0 … 0

… … … … … … … … … … … … …

123 0 0 0 … 49 1 0 … 0 0 … 0

127 0 0 0 … -1 87 0 … 0 0 … 0

130 0 0 0 … 0 0 10 … 0 0 … 0

155 0 0 0 … 0 0 0 … 17 1 … 0

156 0 0 0 … 0 0 0 … 1 10 … 0

309 0 0 0 … 0 0 0 … 0 0 … 1

Page 85: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

85

Для доказательства подобия основной сети и еѐ полученной выборки

(на основе доказательства о принадлежности полученной выборки сети к

степенному закону распределения), следует воспользоваться критерием

Пирсона:

где: n – объем выборки;

- вероятность попадания случайной величины.

Следуя формуле (6), рассчитаем значение χ2. В данном случае

χ2= . Следовательно, n = 27 (выборка) – 1 (количество параметров

в плотности степенного распределения) = 26 (число степеней свободы)

[24].

Далее выберем уровень значимости , тогда

. Табличное значение χ2 равно 42.6. Получается, что таб-

личное значение χ2 больше вычисленного. Следовательно, гипотеза верна,

и приведенное степенное распределение согласуется с результатами экспе-

римента, что и требовалось доказать.

На следующем этапе нашего исследования необходимо провести

расчет среднеквадратического отклонения (СКО) для исходной сети и по-

лученной репрезентативной выборки по формулам (7) и (8) [24]:

Page 86: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

86

где: n – общее число вершин;

– i-ый элемент выборки;

– среднее арифметическое выборки;

– среднеквадратическое отклонение.

Тогда из выражения 8 получим: – СКО генеральной со-

вокупности; – СКО репрезентативной выборки.

Отклонение между эталоном (генеральной совокупностью) и полу-

ченной выборкой получилось равным 4,73%. Это доказывает, что репре-

зентативная выборка подобна генеральной совокупности с заданной точ-

ностью.

Представим гистограммы распределения вершин для генеральной

совокупности и полученной выборки (по горизонтальной оси – вершины с

определенной степенью, по вертикальной – количество вершин данной

степени), иллюстрирующих полученные ранее результаты (рис. 7):

P(k)

Page 87: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

87

Рис. 7. Гистограмма распределения вершин

Получение репрезентативной выборки, состоящей из 309 узлов, по-

служит основой для последующего риск-анализа [8-21, 25-27] социальной

сети SoundCloud.

Литература:

3. A.G. Ostapenko, M.V. Bursa, G.A. Ostapenko, D.O. Butrik.

Flood-attacks within the hypertext information transfer protocol: damage as-

sessment and management. Biosciences Biotechnology Research Asia. – 2014. –

Vol. 11 (Spl.End). – P. 173-176.

4. Benevenut F. Characterizing user behavior in online social net-

works / F. Benevenut, T. Rodrigues, M. Cha, and V. Almeida / In Proc. of ACM

SIGCOMM Internet Measurement Conference. ACM, 2009. – P. 28-32.

5. Caldarelli G. Scale-Free Networks. Complex Webs in Nature and

Technology / G. Caldarelli / Cambridge University Press, 2007. – P. 45-51.

k

P(k)

Page 88: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

88

6. Caldarelli G. Scale-Free Networks. Complex Webs in Nature and

Technology / G. Caldarelli / Cambridge University Press, 2007. – P. 45-51.

7. Fronczak A. Higher order clustering coefficients in Barabasi-Albert

networks / A. Fronczak, J.A. Holyst, M. Jedynak, J. Sienkiewicz / Physica A

316. – 2002. –P. 688- 694.

8. G.A. Ostapenko, D.G. Plotnicov, O.Y Makarov, N.M. Tikhomirov,

V.G. Yurasov. Analytical estimation of the component viability of distribution

automated information data system. World Applied Sciences Journal. – 2013. –

25 (3). – P. 416-420.

9. G.A. Ostapenko, L.V. Parinova, V.I. Belonozhkin, I.L. Bataronov,

K.V. Simonov. Analytical models of information-psychological impact of so-

cial information networks on users. World Applied Sciences Journal. – 2013. –

25 (3). – P. 410-415.

10. Johnson S. Entropic origin of disassortativity in complex networks /

S. John on, J.J. Torre , M.A. Muñoz / Physical Review Letters. – 2010. – 4 p.

11. Kleinberg J. M. Authoritative sources in a hyperlinked environment

/ J.M. Kleinberg / ACM, - 1999. –P. 604-632.

12. Liu X., Tse C. K., Small M. Complex network structure of musical

compositions: Algorithmic generation of appealing music, (2010). – Р. 126–132.

13. N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, A.S.

Avdeev. Peak risk assessing the process of information epidemics expansion.

Biosciences Biotechnology Research Asia. – 2014. – Vol. 11 (Spl.End). – P.

251-255.

14. N.M. Radko, A.G. Ostapenko, S.V. Mashin, O.A. Ostapenko, D.V.

Gusev. Assessment of the system's EPI-resistance under conditions of infor-

mation epidemic expan ion . Biosciences Biotechnology Research Asia. – 2014.

– Vol. 11 (3). – P. 1781-1784.

Page 89: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

89

15. S.A. Ermakov, A.S. Zavorykin, N.S. Kolenbet, A.G. Ostapenko,

A.O Kalashnikov. Optimization of expert methods used to analyze information

security risk in modern wireless networks. Life Science Journal. – 2014. – №

11(10s). – P. 511-514.

16. Sallaberry A., Are all Social Networks Structurally Similar. A

Comparative Study using Network Statistics and Metrics, 2014. - P. 25-36.

17. Social Network Analysis John Scott 24 декабря 2014 г. SAGE –

Электрон. дан. – Режим доступа:

http://www.pnas.org/content/109/30/1208.full.

18. Sybil-Resilient Online Content Rating Dinh Nguyen Tran, Bonan

Min, Jinyang Li, Lakshminarayanan Subramanian, Courant Institute of Mathe-

matical Sciences, New York University.

19. Tsvetovat M., Social Network Analysis for Startups: Finding Con-

nections on the Social Web. — O'Reilly, 2011. — Р. 45. — 192 с.

20. V.V. Islamgulova, A.G. Ostapenko,,N.M. Radko, R.K. Ba-

badzhanov, O.A. Ostapenko. Discreet risk-models of the process of the devel-

opment of virus epidemics in non-uniform networks. Journal of Theoretical and

Applied Information Technology. – 2016. – P. 306-315.

21. Алферов А.Г. Устойчивость инфокоммуникационных систем в

условиях информационного конфликта [Текст]/ А.Г. Алферов, И.О. Тол-

стых, Н.Н. Толстых, О.В. Поздышева, А.И. Мордовин // Информация и

безопасность. – 2014. – Т. 17. – № 4. – С. 558-567.

22. Гмурман В.Е. Теория вероятностей и математическая

статистика. – М.: Высш. шк., 2007. С. 142-151.

23. Голозубов А.А. Риск-моделирование процесса заражения ав-

томатизированных информационных систем, построенных в сетях тополо-

гии «звезда», посредством вирусов-спутников [Текст]/ А.А. Голозубов,

Page 90: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

90

Н.В. Филатов, Е.А. Москалева, О.Ю. Макаров // Информация и безопас-

ность. – 2014. – Т. 17. – № 2. – С. 200-2003.

24. Губанов Д.А., Новиков Д.А., Чхаратишвили А.Г. Социальные

сети: модели информационного влияния, управления и противоборства /

Под ред. чл.-корр. РАН Д.А. Новикова. – М.: Издательство физико-

математической литературы, 2010. – 288 с.

25. Дешина А.Е. Информационные риски в мультисерверных си-

стемах: атаки комплексного типа [Текст] / А.Е. Дешина, В.И. Белоножкин

// Информация и безопасность. – 2013. – Т. 16. – № 3. – С. 335-344.

26. Паринов А.В. Риск-оценка смертности инновационных проек-

тов: научно-методические основы [Текст]/ А.В. Паринов, Л.В. Паринова,

В.Г. Юрасов // Информация и безопасность. – 2013. – Т. 16. – № 3. – С. 423-

426.

27. Паринов А.В. Управление рисками инновационных проектов

[Текст]/ А.В. Паринов, Л.В. Паринова, А.В. Заряев // Информация и без-

опасность. – 2014. – Т. 17. – № 4. – С. 602-605.

28. Радько Н.М. Топологическое многообразие эпидемических мо-

делей неоднородных информационно-телекоммуникационных сетей в кон-

тексте их эпистойкости [Текст]/ Н.М. Радько, В.В. Исламгулова, Д.Н. Рах-

манин // Управление информационными рисками и обеспечение безопас-

ности инфокоммуникационных систем: Сб. науч. тр.; под ред. чл.-корр.

РАН В.И. Борисова. – Воронеж: Издательство «Научная книга». – 2015. –

Т. 8. – № 2. – С. 54-65.

29. Средство визуализации данных. - Электрон. Дан. – Режим

доступа: http ://gephi.org/.

Воронежский научно-образовательный центр

управления информационными рисками

Page 91: Сборник научных трудов корреспондента РАНбезопасный-интернет.рф/wp... · 4 УДК 004.056.57 СОЦИАЛЬНАЯ СЕТЬ

91

Научное издание

УПРАВЛЕНИЕ ИНФОРМАЦИОННЫМИ РИСКАМИ

И ОБЕСПЕЧЕНИЕ БЕЗОПАСНОСТИ

ИНФОКОММУНИКАЦИОННЫХ СИСТЕМ

Сборник научных трудов

Вып. 3 (13), 2016

Под редакцией чл.-корр. РАН В.И. Борисова

Главный редактор А.Г. Остапенко

Издание публикуется в авторской редакции

Компьютерная верстка Е.Ю. Чапурин

Дизайн обложки С.А. Кравец

Подписано в печать __.12.16. Формат __. Усл. печ. л. __.

Заказ ____Тираж 170 экз.