Работа с данными в google таблицах

51
Таблицы Google как наиболее удобный инструмент для начинающих дата-журналистов Мастер-класс 19 сентября 2013 г.

Upload: ansakoy

Post on 28-Nov-2014

3.243 views

Category:

Documents


8 download

DESCRIPTION

Пошаговое прохождение

TRANSCRIPT

Page 1: Работа с данными в Google таблицах

Таблицы Google как наиболее удобный инструмент для

начинающих дата-журналистов

Мастер-класс

19 сентября 2013 г.

Page 2: Работа с данными в Google таблицах

Таблицы:

• Google (бесплатное ПО)

• Open/Libre Office (бесплатное ПО)

• MS Excel (платное ПО)

Page 3: Работа с данными в Google таблицах

Чтобы работать с Google таблицами, необходимо завести аккаунт Google

Page 4: Работа с данными в Google таблицах

Google документы:

Допускают совместную работу над таблицей онлайн.

Если вдруг оборвалась связь с

интернетом, то работать с документом невозможно.

Можно включить возможность автономной работы.

Page 5: Работа с данными в Google таблицах
Page 6: Работа с данными в Google таблицах

Источник данных:

http://www.oecd.org/statistics/

Page 7: Работа с данными в Google таблицах
Page 8: Работа с данными в Google таблицах

Форматы, с которыми можно работать в таблицах:

Page 9: Работа с данными в Google таблицах

Импорт файла в Google таблицу

Page 10: Работа с данными в Google таблицах

Импорт файла в Google таблицу

Page 11: Работа с данными в Google таблицах

Готово

Примечание: Если таблица отказывается импортировать файл .xls, ссылаясь на то, что это неизвестный ей формат, можно попробовать открыть этот файл в таблице Excel или Open/Libre Calc и сохранить его, например, в версии 97-2003.

Page 12: Работа с данными в Google таблицах

Важно: До начала обработки данных обязательно нужно сделать копию документа, чтобы исходный вариант на всякий случай тоже сохранился.

Page 13: Работа с данными в Google таблицах

Как правило, данные в таблице бывают отформатированы. Удобства ради уберем форматирование, чтобы видеть таблицу в чистом виде.

Page 14: Работа с данными в Google таблицах
Page 15: Работа с данными в Google таблицах

Готово

Page 16: Работа с данными в Google таблицах

Теперь смотрим на данные

Page 17: Работа с данными в Google таблицах

Продолжаем смотреть на данные

Что делать?

Page 18: Работа с данными в Google таблицах

Что делать с отсутствующими данными?

• Это всегда зависит от конкретной ситуации.

• Отсутствие данных может быть поводом провести расследование именно по этому вопросу.

• Можно попробовать обратиться в ведомства, отвечающие за публикацию этих данных, и запросить недостающую информацию.

• Можно попробовать поискать наборы данных по той же теме в других источниках.

Page 19: Работа с данными в Google таблицах

Что делать с отсутствующими данными?

• В ряде случаев, когда речь идет об общих тенденциях и соотношениях, отсутствием данных можно пренебречь: например, вообще не рассматривать данные за определенный период, а исследовать тот период, для которого все данные есть.

• Аналитики в применении к некоторым случаям могут сопоставлять просто последние имеющиеся данные для каждого случая.

Page 20: Работа с данными в Google таблицах

Важно: все допущения в работе с данными желательно фиксировать в

таблице – например, в форме комментария.

Page 21: Работа с данными в Google таблицах

В нашем случае данных за 2010 и 2011 гг. существенно меньше, чем за прочие годы. Попробуем посмотреть тот период, за который у нас больше данных.

Page 22: Работа с данными в Google таблицах

Выделяем нужную область, копируем её (Ctrl+C), создаем новую вкладку в таблице и вставляем туда то, что скопировали (Ctrl+V)

Page 23: Работа с данными в Google таблицах

Подсчёты

Page 24: Работа с данными в Google таблицах

Сортировка

Page 25: Работа с данными в Google таблицах

В нашем случае рассортируем страны по признаку общей численности самоубийств от максимальных показателей к минимальным.

Page 26: Работа с данными в Google таблицах
Page 27: Работа с данными в Google таблицах

Теперь у нас есть рассортированные данные, и мы можем сосредоточиться на странах с максимальными и минимальными значениями. К примеру, можно сопоставить эти показатели с другими индикаторами благополучия/неблагополучия. Например, ВВП, продолжительность жизни, уровень безработицы и т.д.

Page 28: Работа с данными в Google таблицах

Забегая вперед, скажу, что во многих случаях из тех, с которыми мы хотим сопоставить наши данные, отсутствуют значения за 2004 г. Также по ряду стран некоторые данные представлены очень неполно. Набор стран, с которыми мы в дальнейшем будем работать, обусловлен и этими факторами.

Page 29: Работа с данными в Google таблицах

За 2005 год отсутствуют данные по Италии. В порядке допущения внесем в ячейку тот же показатель, что в 2006 г. (необходимо это указать).

Page 30: Работа с данными в Google таблицах

Теперь попробуем соотнести это с другими показателями, как-то:

• Продолжительность жизни

• ВВП

• Уровень безработицы

• Бюджет на социальные нужды

• Бюджет на пособия по безработице

Page 31: Работа с данными в Google таблицах

Проблема:

Как представить несколько измерений в одной таблице, а в дальнейшем – и в виде двухмерной визуализации?

Page 32: Работа с данными в Google таблицах

Одно из возможных решений – представить данные в виде интерактивной динамической схемы

https://docs.google.com/spreadsheet/ccc?key=0AofhFA7uQyz0dEwxMGE2QWpsNUtpbDhmN0U3cXJ0MXc#gid=0

Page 33: Работа с данными в Google таблицах

Динамическую схему (motion chart) разработал Ханс Рослинг (Hans Rosling), шведский врач и статистик.

Выступления Рослинга (в том числе презентация динамической схемы) на конференции TED:

http://www.ted.com/speakers/hans_rosling.html

Page 34: Работа с данными в Google таблицах

В свою очередь, сводная таблица должна выглядеть примерно так:

Page 35: Работа с данными в Google таблицах

Задача: преобразовать нашу таблицу в таблицу такого вида

Page 36: Работа с данными в Google таблицах

Data Wrangler

Это можно легко сделать при помощи бесплатной программы Data Wrangler, которая работает онлайн.

http://vis.stanford.edu/wrangler/

Page 37: Работа с данными в Google таблицах

Data Wrangler

1. Для удобства в дальнейшем вернем сортировку стран по алфавиту. После чего копируем таблицу.

2. Включаем Data Wrangler:

Page 38: Работа с данными в Google таблицах

Data Wrangler

3.Вставляем скопированное в открывшееся окно и нажимаем “Wrangle”.

Page 39: Работа с данными в Google таблицах

Data Wrangler

Page 40: Работа с данными в Google таблицах

Data Wrangler

4. Фиксируем заглавную строку

Page 41: Работа с данными в Google таблицах

Data Wrangler

5. Перераспределяем данные

Page 42: Работа с данными в Google таблицах

Data Wrangler 6. Экспортируем (для вставки в таблицу – лучше всего в виде Tab-Separated Values)

Page 43: Работа с данными в Google таблицах

Data Wrangler

Page 44: Работа с данными в Google таблицах

7. Вставляем результат в таблицу

Data Wrangler

Page 45: Работа с данными в Google таблицах

Дальнейшие шаги

• Аналогичным образом обрабатываем нужные нам данные из других таблиц.

• Всё нужное собираем в единую сводную таблицу.

Page 46: Работа с данными в Google таблицах

Визуализация

Выделяем таблицу и вызываем диалог построения диаграмм.

Page 47: Работа с данными в Google таблицах

Выбираем динамическую схему и нажимаем «Вставить»

Page 48: Работа с данными в Google таблицах

Если щелкнуть по белому полю диаграммы, то в правом верхнем углу появится треугольник, щелкнув по которому можно вызвать меню.

Page 49: Работа с данными в Google таблицах

В частности, можно получить код для публикации схемы на html-странице

Page 50: Работа с данными в Google таблицах

Можно также переместить диаграмму на отдельный лист

Page 51: Работа с данными в Google таблицах

Ссылки:

• Таблица, которая была создана в итоге: https://docs.google.com/spreadsheet/ccc?key=0AofhFA7uQyz0dEwxMGE2QWpsNUtpbDhmN0U3cXJ0MXc#gid=0

• Google Диск: https://drive.google.com

• Data Wrangler: http://vis.stanford.edu/wrangler/