ТЕМА 5. Стадия проектирования и реализации ИС

58
1 ТЕМА 5. ТЕМА 5. Стадия Стадия проектирования и проектирования и реализации ИС. реализации ИС. Лекция 21. Лекция 21. Способы организации Способы организации информационной базы. информационной базы.

Upload: bryar-orr

Post on 30-Dec-2015

73 views

Category:

Documents


3 download

DESCRIPTION

ТЕМА 5. Стадия проектирования и реализации ИС. Лекция 21. Способы организации информационной базы. Информационная база. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ТЕМА 5. Стадия проектирования и реализации ИС

1

ТЕМА 5.ТЕМА 5. Стадия проектирования Стадия проектирования

и реализации ИС.и реализации ИС.

Лекция 21.Лекция 21.Способы организации Способы организации

информационной базы.информационной базы.

Page 2: ТЕМА 5. Стадия проектирования и реализации ИС

2

Информационная базаИнформационная база

Автоматизированная информационная технология

Накопление и

хранение данных

Пере-дача

данных

Формирование результирующей

информации

Обработка данных

Подготовка информационных

массивов

Сбор и регистрация

данных

Аппарат управления

Объект управления

Внешняя среда

Комплекс обеспечивающих

подсистем

Комплекс функциональных

подсистем

Информационная база (ИБ) — это совокупность данных, организованная определенным способом и хранимая в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности аппарата управления и функциональных подсистем ИС.

Page 3: ТЕМА 5. Стадия проектирования и реализации ИС

3

Классификация файлов ИБКлассификация файлов ИБ По смысловому содержанию По смысловому содержанию По этапам обработкиПо этапам обработки По роли в машинной обработке и По роли в машинной обработке и

технологии использования технологии использования По назначению (по типу функциональных По назначению (по типу функциональных

подсистем)подсистем) По типу носителяПо типу носителя По типу логической организации По типу логической организации

(линейная, иерархическая, реляционная (линейная, иерархическая, реляционная структура записи)структура записи)

Page 4: ТЕМА 5. Стадия проектирования и реализации ИС

4

Массивы данных

ВходныеВнутренние

(базовые)Выходные

(результатные)

ПостоянныеПеременные

(оперативные)

Вспомогательные(рабочие)

Промежуточные

Архивные Служебные

По этапу обработки

По технологии использования

Основные

Page 5: ТЕМА 5. Стадия проектирования и реализации ИС

5

Виды массивов по этапам обработкиВиды массивов по этапам обработкиВид массивов Назначение и содержание

Входные Содержат исходные и текущие данные, запросы на решение задач и выполнение процессов.

Предназначены для ввода данных или обновления базовых файлов.

Выходные

(результатные)

Содержат совокупность показателей, необходимых для формирования отчетности и принятия решений в последующий период.

Внутренние

(базовые)

Содержат справочную, нормативную, служебную информацию.

Предназначены для переработки информации из входных массивов и формирования выходных массивов.

Page 6: ТЕМА 5. Стадия проектирования и реализации ИС

6

Виды массивов по технологии Виды массивов по технологии использованияиспользования

Вид массивов

Назначение и характеристики.

Постоянные Формируются до начала функционирования ИС.

Содержат директивные, нормативные, справочные и другие, редко меняющиеся, данные.

Переменные (оперативные)

Формируются из первичных документов. Содержат текущую информацию о состоянии объекта управления.

Вспомогательные (рабочие)

Являются результатом логических преобразований постоянных массивов. Создаются для решения конкретных задач с целью сокращения времени обработки информации.

Промежуточные

Содержат информацию, возникающую на стыке различных задач. Не имеют самостоятельного значения для целей управления объектом.

Архивные Формируются на основе выходных массивов. Предназначены для хранения информации, необходимой для обработки в будущих отчетных периодах, для решения аналитических, прогнозных задач.

Служебные Содержат информацию, необходимую для обработки всех выше упомянутых массивов. Предназначены для ускорения поиска информации в основных файлах.

Page 7: ТЕМА 5. Стадия проектирования и реализации ИС

7

Требования к внутримашинному ИОТребования к внутримашинному ИО Полнота, целостность, согласованность и

непротиворечивость хранимой информации.

Минимизация времени выборки данных при решении задач управления.

Независимость структуры массивов от программных средств их организации.

Динамичность структуры ИБ. Релевантность ИБ. Удобство языкового интерфейса. Разграничение прав доступа пользователей.

Page 8: ТЕМА 5. Стадия проектирования и реализации ИС

8

Способы организации Способы организации информационной базыинформационной базы

Поддерживается функциональными пакетами прикладных программ

Основывается на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных (СУБД).

Информационная база

Совокупность локальных файлов

Интегрированнаябаза данных

Page 9: ТЕМА 5. Стадия проектирования и реализации ИС

9

Особенности пофайловой Особенности пофайловой организации ИОорганизации ИО

Специализация структуры данных под решаемые задачи высокая скорость обработки данных.

Не предусматривается установления связи между файлами, исключается работа в диалоге.

Применяется при решении узкоспециализированных задач с небольшим объемом данных, хранящихся в обособленных файлах.

Page 10: ТЕМА 5. Стадия проектирования и реализации ИС

10

Стандартные операции с файламиСтандартные операции с файлами

Файл представляет собой линейную последовательность записей, над которой можно выполнить следующие стандартные операции:

создать файл (требуемого типа и размера); открыть ранее созданный файл; прочитать из файла некоторую запись (текущую,

следующую, предыдущую); записать в файл на место текущей записи новую

запись; добавить новую запись в конец файла.

Page 11: ТЕМА 5. Стадия проектирования и реализации ИС

11

Недостатки пофайловой организации Недостатки пофайловой организации внутримашинного ИОвнутримашинного ИО

Зависимость программ от данных (структура записи файла известна только программе, которая с ним работает)

Сложность авторизации (принят децентрализованный принцип управления доступом, когда администрирование режимом доступа к каждому файлу осуществляется его владельцем)

Сложность реализации многопользовательского доступа (эффективный многопользовательский доступ возможен только в режиме чтения файлов)

Page 12: ТЕМА 5. Стадия проектирования и реализации ИС

12

Организация ИО в виде БД База данных – это интегрированная совокупность

файлов, обеспечивающая хранение информационных ресурсов, удобное взаимодействие между ними и быстрый доступ к данным.

Преимущества: обеспечение совместимости данных; уменьшение синтаксической и семантической

избыточности; соответствие данных реальному состоянию объекта

управления; обеспечение многопользовательского доступа к данным.

Проблемы: необходимость усиления контроля ввода данных; необходимость разграничения прав доступа пользователей; необходимость обеспечения защиты данных.

Page 13: ТЕМА 5. Стадия проектирования и реализации ИС

13

Виды БДВиды БД

1.1. По используемой модели данных:По используемой модели данных: Иерархические;Иерархические; Сетевые;Сетевые; Реляционные;Реляционные; Объектно-ориентированные.Объектно-ориентированные.

2.2. По организации хранения данных и По организации хранения данных и технологии их обработки:технологии их обработки:

Централизованные;Централизованные; Распределенные.Распределенные.

Page 14: ТЕМА 5. Стадия проектирования и реализации ИС

14

Критерий выбора способа Критерий выбора способа организации ИБорганизации ИБ

Достижение минимальных трудовых и Достижение минимальных трудовых и стоимостных затрат на:стоимостных затрат на:

проектирование структуры ИБ, проектирование структуры ИБ, проектирование программного обеспечения проектирование программного обеспечения

системы ведения файлов, системы ведения файлов, перепроектирование ИБ при возникновении перепроектирование ИБ при возникновении

новых задач.новых задач.

Page 15: ТЕМА 5. Стадия проектирования и реализации ИС

Требования к организации БДТребования к организации БД логическая и физическая независимость данных;логическая и физическая независимость данных; контролируемая избыточность данных;контролируемая избыточность данных; стандартизация данных за счет использования стандартизация данных за счет использования

классификаторов;классификаторов; наличие словаря данных;наличие словаря данных; специализация интерфейса для администратора БД специализация интерфейса для администратора БД

и пользователей системы;и пользователей системы; контроль целостности данных;контроль целостности данных; защита данных от несанкционированного доступа;защита данных от несанкционированного доступа; наличие вспомогательных программных средств наличие вспомогательных программных средств

(утилит) проектирования и эксплуатации БД.(утилит) проектирования и эксплуатации БД.15

Page 16: ТЕМА 5. Стадия проектирования и реализации ИС

16

Виды БД по технологии хранения и Виды БД по технологии хранения и обработки данныхобработки данных

Централизованные БД Распределенные БД

Расположение: один компьютеродин компьютер

Назначение: организация более : организация более простого и дешевого способа простого и дешевого способа информационного обслуживания информационного обслуживания пользователей;пользователей;

Объемы данных: небольшие : небольшие

Задачи: несложные: несложные

Надежность: более высокая за : более высокая за счет организационной счет организационной независимости независимости

Расположение: несколько несколько компьютеров, объединенных в компьютеров, объединенных в единую вычислительную систему с единую вычислительную систему с помощью вычислительных сетей;помощью вычислительных сетей;

Назначение: предоставление более : предоставление более гибких форм обслуживания гибких форм обслуживания множеству удаленных множеству удаленных пользователей пользователей

Объемы данных: значительныезначительные

Задачи: сложные: сложные

Надежность обеспечивается за счет средств резервирования.

Page 17: ТЕМА 5. Стадия проектирования и реализации ИС

Принципы организации Принципы организации централизованной БДцентрализованной БД

обеспечение логической организации данных с помощью обеспечение логической организации данных с помощью построения глобальной модели данных;построения глобальной модели данных;

представление информационных потребностей для представление информационных потребностей для каждой задачи в виде подмоделей данных;каждой задачи в виде подмоделей данных;

выделение специального языка описания данных для выделение специального языка описания данных для получения схем и подсхем;получения схем и подсхем;

описание процедур обработки данных с использованием описание процедур обработки данных с использованием языка манипулирования данными;языка манипулирования данными;

разделение доступа к полям данных;разделение доступа к полям данных; защита данных через пароль;защита данных через пароль; обеспечение доступности данных одновременно для обеспечение доступности данных одновременно для

нескольких пользователей.нескольких пользователей.17

Page 18: ТЕМА 5. Стадия проектирования и реализации ИС

Принципы организации Принципы организации распределенной БДраспределенной БД

учет территориального расположения подразделений ЭИС;учет территориального расположения подразделений ЭИС; обеспечение независимости данных от их территориального обеспечение независимости данных от их территориального

расположения;расположения; оптимальное размещение БД между клиентами и серверами;оптимальное размещение БД между клиентами и серверами; сокращение стоимости информационного обслуживания сокращение стоимости информационного обслуживания

клиентов;клиентов; обеспечение решения сложных межведомственных задач;обеспечение решения сложных межведомственных задач; надежность хранения обработки данных; надежность хранения обработки данных; использование СУБД, ориентированных на работу в сети;использование СУБД, ориентированных на работу в сети; возможность параллельного обращения к данным из возможность параллельного обращения к данным из

различных узлов обработки данных.различных узлов обработки данных.

18

Page 19: ТЕМА 5. Стадия проектирования и реализации ИС

19

Условия централизации и Условия централизации и децентрализации данныхдецентрализации данных

Данные централизуются, если:Данные централизуются, если: данные непрерывно обновляются, а территориально данные непрерывно обновляются, а территориально

разобщенные пользователи должны получать всякий раз разобщенные пользователи должны получать всякий раз последнее состояние данных;последнее состояние данных;

поиск производится во всей совокупности данных;поиск производится во всей совокупности данных; над данными осуществляются операции со вторичными над данными осуществляются операции со вторичными

ключами. ключами. Данные могут быть децентрализованными, если они Данные могут быть децентрализованными, если они

используются локально в точке их происхождения. используются локально в точке их происхождения. При низкой скорости обновления допустимо При низкой скорости обновления допустимо

хранение нескольких копий данных.хранение нескольких копий данных.

Page 20: ТЕМА 5. Стадия проектирования и реализации ИС

20

Схемы распределения

данных

Централизованныеданные

Распределенные данные

Иерархические данные

Неиерархические данные

Иерархия зависимых

данных

Иерархия независимых

данных

Разделенные данные

Расщепленные данные

Реплицированные данные

Централизованнаяобработка

Распределенная обработка

Централизованнаяобработка

Распределеннаяобработка Распределенная

обработка

Классификация систем по способам

распределения и обработки данных

Page 21: ТЕМА 5. Стадия проектирования и реализации ИС

21

Централизованные данныеЦентрализованные данные

Server

Computer Computer

ServerServer

Computer Computer Computer Computer

Централизованные данные,централизованная обработка

Централизованные данные,распределенная обработка

Page 22: ТЕМА 5. Стадия проектирования и реализации ИС

22

Иерархические данныеЗависимые данные

Server

ServerServer Server

АСУП

Подсистема приема заказов

Подсистема управления складом

Подсистема контроля за выпуском продукции

Computer

Computer

Независимые данные

Server

Детальная информация о клиентах

Основные сведения о клиентах

Computer Computer Computer

ServerServer

Server

Эталоннаякопия данных

Page 23: ТЕМА 5. Стадия проектирования и реализации ИС

23

Расщепленные данныеРасщепленные данные

Server Server

Server

Сеть

Данные района А

Данные района Б

Данные района В

Структура данных и программы их обработки в подсистемах одни и те же. Содержание различно.

Page 24: ТЕМА 5. Стадия проектирования и реализации ИС

24

Разделенные данные

Server Server

Server

Сеть

Бухгалтерия

Производство

Снабжение

Структура данных, их содержание и программы обработки в подсистемах различны.

Page 25: ТЕМА 5. Стадия проектирования и реализации ИС

25

Реплицированные данные

Server Server

Server

Сеть

XYZ

XYZ

XYZ

Копии одних и тех же данных. Структура данных и программы обработки идентичны.

Page 26: ТЕМА 5. Стадия проектирования и реализации ИС

26

Комбинированные Комбинированные формы распределения формы распределения

данныхданных АСУП

Бухгалтерия Склад Производство

Централизованные данные

Разделенные данные

Отдел 1 Отдел 2 Отдел 3

Расщепленные данные

Системы сбора данных

Иерархия зависимых данных

Иер

архи

я не

зави

сим

ых

дан

ных

Page 27: ТЕМА 5. Стадия проектирования и реализации ИС

27

Концепция информационных Концепция информационных хранилищхранилищ

Информационное Информационное хранилище позволяет хранилище позволяет обеспечить:обеспечить: хранение разнородных хранение разнородных

данных из различных данных из различных источников в течение источников в течение больших периодов больших периодов времени;времени;

быстрый доступ к данным быстрый доступ к данным и поиск релевантной и поиск релевантной запросу информации. запросу информации.

Знания

Информация

Данные

Page 28: ТЕМА 5. Стадия проектирования и реализации ИС

28

Причины появления Причины появления информационных хранилищинформационных хранилищ

Осознание руководством предприятий того, что в Осознание руководством предприятий того, что в данных содержатся скрытые закономерности данных содержатся скрытые закономерности (знания), характеризующие процесс управления в (знания), характеризующие процесс управления в целом, способные повысить его эффективность; целом, способные повысить его эффективность;

снижение стоимости средств хранения информации, снижение стоимости средств хранения информации, дающее возможность хранить данные, накопленные дающее возможность хранить данные, накопленные за длительные интервалы времени; за длительные интервалы времени;

снижение стоимости элементной базы сложных снижение стоимости элементной базы сложных архитектур; архитектур;

переход от массового обслуживания к переход от массового обслуживания к индивидуальному (учет разнообразных требований индивидуальному (учет разнообразных требований заказчика). заказчика).

Page 29: ТЕМА 5. Стадия проектирования и реализации ИС

29

Проблемы интеграции данныхПроблемы интеграции данных

1.1. Источники могут использовать различные Источники могут использовать различные модели данных и предоставлять различные модели данных и предоставлять различные интерфейсы для доступа к своим данным. интерфейсы для доступа к своим данным.

2.2. Данные источника могут быть Данные источника могут быть неструктурированными. неструктурированными.

3.3. Источники могут быть автономными. Источники могут быть автономными.

Page 30: ТЕМА 5. Стадия проектирования и реализации ИС

30

Решение задачи интеграции данныхИнформационные хранилища

Хранилища данных

Виртуальные хранилища

данные из различных источников поступают в хранилище, все запросы к системе интеграции обрабатываются с использованием этих данных.

данные хранятся в источниках, а запросы к системе интеграции транслируются в запросы или операции, понятные источнику. Данные, полученные в ответ на эти запросы к источникам, объединяются и предоставляются пользователю.

Page 31: ТЕМА 5. Стадия проектирования и реализации ИС

31

Хранилище данных — Хранилище данных — это «предметно-ориентированная, это «предметно-ориентированная, интегрированная, содержащая исторические данные, интегрированная, содержащая исторические данные, неразрушаемая совокупность данных, предназначенная для неразрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений» (Уильям поддержки принятия управленческих решений» (Уильям Инмон, 1992). Инмон, 1992).

Хранилище данных (Хранилище данных (Content RepositoryContent Repository)) – программная – программная подсистема ИС, сочетающая в себе функции системы подсистема ИС, сочетающая в себе функции системы управления версиями, поисковой машины и СУБД.управления версиями, поисковой машины и СУБД.

Хранилище данных (Хранилище данных (Data WarehouseData Warehouse)) – очень большая – очень большая предметно-ориентированная корпоративная база данных, предметно-ориентированная корпоративная база данных, специально разработанная и предназначенная для подготовки специально разработанная и предназначенная для подготовки отчетов, анализа бизнес-процессов с целью поддержки отчетов, анализа бизнес-процессов с целью поддержки принятия решений в организации. принятия решений в организации.

Хранилище данныхХранилище данных – это автоматизированная – это автоматизированная информационно-технологическая система организации, информационно-технологическая система организации, которая собирает данные из существующих баз и внешних которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию источников, формирует, хранит и эксплуатирует информацию в виде наборов данных. в виде наборов данных.

Page 32: ТЕМА 5. Стадия проектирования и реализации ИС

32

Структура хранилища данныхСтруктура хранилища данных

Page 33: ТЕМА 5. Стадия проектирования и реализации ИС

33

Концепция хранилищ данныхКонцепция хранилищ данных1.1. ИнтеграцияИнтеграция ранее разъединенных ранее разъединенных

детализированных данных в едином хранилище.детализированных данных в едином хранилище.2.2. Тематическое и временное Тематическое и временное структурированиеструктурирование, ,

согласованиесогласование и предварительная обработка. и предварительная обработка. 3.3. Разделение Разделение хранящихся данных по их хранящихся данных по их

назначению – для операционной обработки и для назначению – для операционной обработки и для использования в задачах анализа. использования в задачах анализа.

Цель использования ХДЦель использования ХД – подготовка данных к – подготовка данных к последующему анализу.последующему анализу.

OLTPOLTP ( (On-line Transaction Processing) – ) – задачи задачи оперативной обработки данных;оперативной обработки данных;

OLAPOLAP ( (On-line Analytical Processing) – ) – задачи задачи аналитической обработки данныханалитической обработки данных

Page 34: ТЕМА 5. Стадия проектирования и реализации ИС

34

Свойства данныхСвойства данных

Предметная ориентированность Интегрированность Неизменяемость и целостность Хронологическая структурированность

Page 35: ТЕМА 5. Стадия проектирования и реализации ИС

35

Категории данныхКатегории данныхДанные Хранилища

Метаданные Фактические данные

описывают способы извлечения информации из различных источников, методы их преобразования из различных структур и форматов и доставки в хранилище

отражают состояние предметной области в конкретные моменты времени

Пр

ед

на

зна

че

ни

е

Местонахождение

Репозиторий Транзакционные системы

Аналитические системы

Суммарные данные

получены в результате расчетов,используются для принятия управленческих решений

Page 36: ТЕМА 5. Стадия проектирования и реализации ИС

36

Операции над даннымиОперации над данными1.1. Сбор данныхСбор данных (пополнение хранилища данных) (пополнение хранилища данных)

очистка – устранение ненужной информации; очистка – устранение ненужной информации; агрегирование – вычисление сумм, средних; агрегирование – вычисление сумм, средних; трансформация – преобразование типов данных, трансформация – преобразование типов данных,

реорганизация структур хранения; реорганизация структур хранения; объединение из внешних и внутренних источников – объединение из внешних и внутренних источников –

приведение к единым форматам; приведение к единым форматам; синхронизация – соответствие одному моменту синхронизация – соответствие одному моменту

времени. времени.

2.2. Поддержка целостности и Поддержка целостности и непротиворечивости данныхнепротиворечивости данных

использование репозитория (словаря-справочника)использование репозитория (словаря-справочника) проверка данных на соответствие их структуре и проверка данных на соответствие их структуре и

назначениюназначению

3.3. Организация доступа к даннымОрганизация доступа к данным

Page 37: ТЕМА 5. Стадия проектирования и реализации ИС

37

Требования к хранилищам данных Требования к хранилищам данных 1.1. Высокая скорость загрузки данныхВысокая скорость загрузки данных. .

производительность процесса загрузки не должна накладывать производительность процесса загрузки не должна накладывать ограничения на размер хранилища ограничения на размер хранилища

2.2. Обеспечение полнофункциональной технологии загрузкиОбеспечение полнофункциональной технологии загрузки преобразование данныхпреобразование данных фильтрация данныхфильтрация данных переформатирование данныхпереформатирование данных проверка целостности данныхпроверка целостности данных организация физического хранения данныхорганизация физического хранения данных индексирование данныхиндексирование данных обновление метаданных обновление метаданных

3.3. Высокое качество хранилища данныхВысокое качество хранилища данных Мера качества хранилища – объективность исходных данных и Мера качества хранилища – объективность исходных данных и

степень разнообразия возможных запросов степень разнообразия возможных запросов

4.4. Поддержка различных видов данныхПоддержка различных видов данных

Page 38: ТЕМА 5. Стадия проектирования и реализации ИС

38

5.5. Высокая скорость обработки запросовВысокая скорость обработки запросов зависит от сложности запроса, а не от объема хранилищазависит от сложности запроса, а не от объема хранилища

6.6. МасштабируемостьМасштабируемость. . поддержка СУБД параллельной обработки запросовподдержка СУБД параллельной обработки запросов сохранение работоспособности в случае локальных сохранение работоспособности в случае локальных

аварийаварий обслуживание любого числа пользователей без потери обслуживание любого числа пользователей без потери

производительностипроизводительности

7.7. Широкие возможности администрированияШирокие возможности администрирования контроль за приближением к ресурсным ограничениямконтроль за приближением к ресурсным ограничениям анализ затрат ресурсов анализ затрат ресурсов установка приоритетов для различных категорий установка приоритетов для различных категорий

пользователей и операцийпользователей и операций осуществление настройки системы на максимальную осуществление настройки системы на максимальную

производительность. производительность.

Требования к хранилищам данных Требования к хранилищам данных

Page 39: ТЕМА 5. Стадия проектирования и реализации ИС

39

Транзакционные и аналитические Транзакционные и аналитические системысистемы

Транзакционные системыТранзакционные системы ориентированы на ориентированы на операционную, или транзакционную операционную, или транзакционную обработку данных (автоматизированные обработку данных (автоматизированные информационные системы, осуществляющие информационные системы, осуществляющие учет и хранение оперативной информации по учет и хранение оперативной информации по бизнес-процессам предприятия);бизнес-процессам предприятия);

Аналитические системыАналитические системы ориентированы на ориентированы на анализ данных (системы поддержки анализ данных (системы поддержки принятия решений DSS - Decision Support принятия решений DSS - Decision Support System).System).

Page 40: ТЕМА 5. Стадия проектирования и реализации ИС

40

Признак Транзакционная система

Аналитическая система

Цель Учет, хранение и Учет, хранение и оперативная оперативная обработка непрерывно обработка непрерывно поступающих данных.поступающих данных.

Получение и хранение обобщенных Получение и хранение обобщенных данных об объекте управления, данных об объекте управления, предоставление информации для предоставление информации для принятия решений.принятия решений.

Вид данных Детализированные Детализированные данныеданные

Обобщенные данныеОбобщенные данные

Частота обновления данных

Непрерывно, Непрерывно, небольшими небольшими порциямипорциями

РедкоРедко

Представление результатов работы

Составление Составление определенного набора определенного набора отчетных форм отчетных форм

Получение большого числа Получение большого числа разнообразных отчетов в удобном разнообразных отчетов в удобном для понимания видедля понимания виде

Page 41: ТЕМА 5. Стадия проектирования и реализации ИС

41

Характер использования системыТранзакционная система

Аналитическая система

Автоматизация Автоматизация бизнес-процессов бизнес-процессов на уровне цехов, на уровне цехов, отделов, бюро. отделов, бюро.

Получение на основе хранящихся данных Получение на основе хранящихся данных показателей, определяющих закономерности показателей, определяющих закономерности развития предприятия и эффективность его развития предприятия и эффективность его работы. работы. Предоставление средств и инструментов для Предоставление средств и инструментов для обработки показателей с использованием обработки показателей с использованием различных методик анализа. различных методик анализа. Взаимодействие с различными программными Взаимодействие с различными программными пакетами, осуществляющими пакетами, осуществляющими специализированную обработку данных специализированную обработку данных (статистическими методами, с помощью (статистическими методами, с помощью нейронных сетей или нечеткой логики).нейронных сетей или нечеткой логики).

Page 42: ТЕМА 5. Стадия проектирования и реализации ИС

42

OLTP – Online Transaction ProcessingOLAP – Online Analytical ProcessingETL – Extract, Transformation and Load (система извлечения, преобразования и загрузки данных )

Взаимное сочетание транзакционной, аналитической систем и хранилища данных зависит от специфики деятельностиорганизации, количества и характера информации.

Page 43: ТЕМА 5. Стадия проектирования и реализации ИС

43

Варианты использования ХДВарианты использования ХД

АС – аналитическая системаТС – транзакционная системаХД – хранилище данных

Вариант 1

ТС 1 ТС 2 ТС 3

ХД

АС

Независимые источники данных

Page 44: ТЕМА 5. Стадия проектирования и реализации ИС

44

Варианты использования ХДВарианты использования ХД

АС – аналитическая системаТС – транзакционная системаХД – хранилище данных

Вариант 1 Вариант 2

ТС 1 ТС 2 ТС 3

ХД

АС

АС

ТС

ХД

Независимые источники данных Источник данных

Page 45: ТЕМА 5. Стадия проектирования и реализации ИС

45

Варианты использования ХДВарианты использования ХД

АС – аналитическая системаТС – транзакционная системаХД – хранилище данных

Вариант 1 Вариант 2 Вариант 3

ТС 1 ТС 2 ТС 3

ХД

АС

АС

ТС

ХД

ТС

Архивные БД

АС

ХД

Независимые источники данных Источник данных

Источник данных

Page 46: ТЕМА 5. Стадия проектирования и реализации ИС

46

Витрины данныхВитрины данныхВитрина данныхВитрина данных (Data Mart) (Data Mart) – это – это

тематическая база данных, содержащая тематическая база данных, содержащая информацию, относящуюся к отдельным информацию, относящуюся к отдельным аспектам деятельности организации. аспектам деятельности организации.

Витрина данныхВитрина данных является частью является частью хранилища данных, специфицированной хранилища данных, специфицированной для использования конкретным для использования конкретным подразделением или определенной группой подразделением или определенной группой пользователей. пользователей.

Page 47: ТЕМА 5. Стадия проектирования и реализации ИС

Независимые витрины данныхНезависимые витрины данных

47

Page 48: ТЕМА 5. Стадия проектирования и реализации ИС

48

Преимущества витрин данных

Недостатки витрин данных

1.1. Простота и невысокая Простота и невысокая стоимость реализациистоимость реализации

2.2. Экономия Экономия технических ресурсовтехнических ресурсов

3.3. Более высокий Более высокий уровень безопасности уровень безопасности данныхданных

4.4. Высокая Высокая производительностьпроизводительность

1.1. Дублирование данныхДублирование данных

2.2. Необходимость Необходимость синхронизации синхронизации данныхданных

3.3. Трудности Трудности расширения и расширения и объединения витринобъединения витрин

4.4. Ограниченность Ограниченность использованияиспользования

Page 49: ТЕМА 5. Стадия проектирования и реализации ИС

49

Общекорпоративная БД Реляционная

СУБДДетализированные

данные

П Р Е Д П Р И Я Т И Е

I уровень

Многомерная СУБД

БД

Агрегированные данные

Подразделение

БД

Агрегированные данные

Подразделение

БД

Агрегированные данные

Подразделение

II уровень

Аналитический инструментарий

АРМ АРМ АРМ

III уровень

Многоуровневое решение ХД

Page 50: ТЕМА 5. Стадия проектирования и реализации ИС

50

Концептуальная модель информационного хранилища

Органы государственной

власти и управления

Взаимодействующие организации

Вышестоящие органы

управления

Внешние источники данныхВнутренние источники данных

Средства загрузки данных из внутренних и внешних источников в информационное хранилище

Многомерные БД Реляционные БД

Витрины данных

Информационное хранилище данных предприятия

Корпоративная информационная система управления предприятием

Генераторы запросов, ИПС,

системы построения

отчетов

Детализированные данные о

деятельности предприятия

Системы аналитической

обработки корпоративных

данных

Агрегированные показатели

экономического состояния предприятия

Системы интеллектуального анализа данных, экспертные

системы

Page 51: ТЕМА 5. Стадия проектирования и реализации ИС

Шесть уровней архитектуры хранилища данных

51

SRD - Sample Restructure Deliver

ETL – Extract Transformation Load

Page 52: ТЕМА 5. Стадия проектирования и реализации ИС

Рекомендуемая структура Рекомендуемая структура корпоративного хранилища данныхкорпоративного хранилища данных

52

Page 53: ТЕМА 5. Стадия проектирования и реализации ИС

Виртуальные хранилища

53

При использовании виртуальных хранилищ данные хранятся в удаленных источниках. Запрос к источнику транслируется через систему интеграции.

Page 54: ТЕМА 5. Стадия проектирования и реализации ИС

54

Виртуальные хранилищаДостоинства Недостатки

Всегда обновленные Всегда обновленные («свежие») данные («свежие») данные Простота и малая Простота и малая стоимость реализациистоимость реализацииЕдиная платформа с Единая платформа с источником источником информацииинформацииОтсутствие сетевых Отсутствие сетевых соединений между соединений между источником источником информации и информации и хранилищем данных.хранилищем данных.

Сложность оптимизации запросовСложность оптимизации запросовДополнительные расходы на Дополнительные расходы на конвертацию данных во время конвертацию данных во время выполнения запросавыполнения запросаБолее низкая производительностьБолее низкая производительностьСложность интеграции данных с Сложность интеграции данных с другими источникамидругими источникамиОтсутствие истории чистоты Отсутствие истории чистоты данныхданныхЗависимость от доступности и Зависимость от доступности и структуры основной базы данных.структуры основной базы данных.

Page 55: ТЕМА 5. Стадия проектирования и реализации ИС

55

Логический уровень виртуального Логический уровень виртуального хранилищахранилища

Логический уровень определяется выбором Логический уровень определяется выбором модели данных и языка запросов для этой модели. модели данных и языка запросов для этой модели.

Модель используется для представления данных, Модель используется для представления данных, извлекаемых из всех источников. извлекаемых из всех источников.

Модель данных должна обеспечить прозрачность Модель данных должна обеспечить прозрачность доступа к внешним источникам.доступа к внешним источникам.

Пользователь получает возможность Пользователь получает возможность унифицированного доступа ко всем унифицированного доступа ко всем интегрируемым данным, т.е. видит внешние интегрируемым данным, т.е. видит внешние данные как локальные в выбранной модели и не данные как локальные в выбранной модели и не заботится об управлении доступом к источнику.заботится об управлении доступом к источнику.

Page 56: ТЕМА 5. Стадия проектирования и реализации ИС

56

Физический уровень виртуального Физический уровень виртуального хранилищахранилища

Система интеграции

Запрос

ОтветПосредник (mediator)

Запрос

Ответ

Посредник (mediator)

Обертка (wrapper)

За

пр

ос

От

ве

т

Источник данных

Обертка (wrapper)

Источник данных

Обертка (wrapper) используется для хранения информации о внешнем источнике и организации к нему доступа. Посредник (mediator) осуществляет интеграцию данных из различных источников

Page 57: ТЕМА 5. Стадия проектирования и реализации ИС

Облачное хранилище данных Облачное хранилище данных ((cloud storage)cloud storage)

Модель онлайн-хранилища, в котором Модель онлайн-хранилища, в котором данные хранятся на многочисленных данные хранятся на многочисленных распределённых в сети серверах, распределённых в сети серверах, предоставляемых в пользование клиентам, предоставляемых в пользование клиентам, в основном, третьей стороной.в основном, третьей стороной.

57

Page 58: ТЕМА 5. Стадия проектирования и реализации ИС

58

Достоинства НедостаткиКлиент платит только за то место в хранилище, которое фактически использует, но не за аренду сервера, все ресурсы которого он может и не использовать.Отсутствие затрат на приобретение, поддержку и обслуживание собственной инфраструктуры по хранению данных.Все процедуры по резервированию и сохранению целостности данных производятся провайдером облачного центра..

Безопасность при хранении и пересылке данных Возможное снижение Возможное снижение производительности по производительности по сравнению с работой в сравнению с работой в условиях собственного условиях собственного хранилищахранилищаНадежность и своевременность получения и доступности данных в облаке очень сильно зависит от многих промежуточных параметров..