p3 informacije i podaci

53
1/53 OIKT Predavanje 3: Informacije i podaci Dr Miroslav Marković [email protected] VTŠSS Aranđelovac

Upload: -

Post on 03-Dec-2015

225 views

Category:

Documents


0 download

DESCRIPTION

Predavanje 3

TRANSCRIPT

1/53

OIKT Predavanje 3: Informacije i podaci

Dr Miroslav Marković

[email protected]

VTŠSS Aranđelovac

2/53

Sadržaj

Pojam podataka

Pojam informacije

Pojam znanja

Pojam entropije

Transformacija podataka

Svojstva i vrste informacija

Vrednovanje informacija

3/53

Pojam podataka

•  U računarstvu: informacija ≠ podatak •  Podaci

q  sirove, nestrukturirane činjenice (npr. "Tri.") q  materijal za dobijanje informacija q  značenje zavisi od konteksta

•  Svaki podatak karakterišu simbol, opis i kontekst.

4/53

Pojam podataka •  Primer Kontekst Raspored predavanja za predmet

Osnove informac. komunik. tehnologija u zimskom semestru 2014/2015. godine

Opis podataka Vreme Ponedeljak Sreda Simboli 1215-1400 A4,A5,A6 1415-1600 A1,A2,А3 1215-1400 A7,A8,A9 1415-1600 A10,A11

logička veza među podacima

podaci i metapodaci

5/53

Pojam podataka

•  Simboli – znaci kojima se zapisuju podaci q  sintaksni aspekt – forma predstavljanja podataka q  semantički aspekt – značenje podataka/simbola q  pragmatički aspekt – akcije koje nastaju kao

rezultat interpretacije informacije q  primer – aspekti simbola za predstavljanje

brojeva •  Semiotika – proučava fenomen simbola

q  obuhvata i podatke i informacije

6/53

Primer: podaci i informacije

Integracija podataka

7/53

8/53

Pojam informacije

•  Informacija je inkrement znanja q  povećanje ili doprinos

skupu poznatih pojmova i činjenica •  Informacija zavisi od:

q  konteksta •  "Koliko je sladoleda prodato u poslastičarnici prošle nedelje?"

q  predznanja primaoca informacije •  "Tri." može da znači "tri kilograma", "tri komada", itd. i treba znati

da se radi o odgovarajućim jedinicama mere i sl.

9/53

Pojam informacije

•  Prenos poruka (komunikacija) q  način dolaženja do informacija q  vrlo složen problem,

koji je danas samo delimično proučen q  discipline koje ga proučavaju

•  psihologija, biologija, filozofija •  telekomunikacije •  informacioni sistemi •  druge discipline

10/53

Pojam informacije

•  U komunikaciji između dve osobe: q  mozak prve osobe izvor informacija

•  izvor uvek karakteriše skup mogućih poruka

q  vokalni sistem je predajnik q  deo prostora kroz koji se prenosi zvučni pritisak

je linija veze ili kanal q  uho i odgovarajući nerv druge osobe

predstavljaju prijemnik q  mozak druge osobe je korisnik

11/53

Pojam informacije

•  Količina informacije q  informacije su različitog značaja q  formalna mera za količinu informacije – entropija q  bit (binary digit) – jedinična količina informacije q  semantički aspekt informacija

•  značenje ili smisao poruka razlikuje se od jedne do druge osobe

•  taj aspekt se ne uzima u obzir prilikom određivanja mere za količinu informacija

12/53

Količina informacije •  Neka je E događaj čija je verovatnoća

pojavljivanja p(E). Tada je količina informacije koja se pridružuje događaju E:

•  Analogno, važi formula za količinu

informacije date poruke M:

)(1log)( 2 Ep

EI =

)(1log)( 2 Mp

MI =

13/53

Pojam informacije Informacija je nešto što ukida ili smanjuje neodređenost sistema, odnosno smanjuje neizvesnost promena.

C. Shannon

14/53

Pojam informacije •  Za informacije se vezuju

neizvesnost, očekivanje i pretpostavke •  Informacija raste kada verovatnoća

pojavljivanja datog događaja opada q  primer

•  “U januaru je padao sneg.“ – mala količina informacije

•  “U avgustu je padao sneg.“ – veća količina informacije

•  pretpostavka: severna polulopta, severni delovi •  manja verovatnoća –

veća neizvesnost, manje očekivanje

15/53

Informacija Podaci + Poslovna pravila = Informacija

KVALITET(Podaci + Poslovna pravila) = Informacija

X

Data

Discrete, unorganized,

raw facts

Information The

transformation of those facts into meaning

16/53

Količina informacije

promenljiva sa N mogućih vrednosti -> količina informacije koju nosi: -  broj bita da se kodira svih N vrednosti -  iznosi: log2N, zaokruženo na prvi veći prirodni broj

17/53

ZNANJE (Knowledge)

"   Znanje se sastoji od podataka i/ili informacija koji su organizovani i procesirani tako da obuhvate potrebno razumevanje, iskustvo, akumulirano učenje i ekspertizu za rešavanje datog problema ili aktivnosti.

18/53

Zašto KM (Knowledge Management)?

Proces akumuliranja znanja

19/53

20/53

Pojam entropije

•  Entropija q  mera neorganizovanosti sistema q  mera za nered u sistemu

•  potpuni nered i potpuni red ne postoje q  mera neizvesnosti o podacima

u prenetim porukama •  Informacija

q  Shannon: negativna vrednost entropije q  mera za red, izvesnost, organizovanost sistema

21/53

22/53

Pojam entropije

•  Entropija Xi, i = 1, 2, ..., n - poruke p(Xi) - verovatnoća pojavljivanja poruke Xi

p(Xi)log21

p(Xi)!

"

##

$

%

&&

i=1

n∑H(X) = - entropija

⎟⎟⎟

⎜⎜⎜

)p(X1logi

2 - broj bita potreban za optimalno kodiranje poruke Xi

Entropija - srednja vrednost broja bita pri optimalnom kodiranju

23/53

Pojam entropije - nastavak

•  Entropija

Entropija – predstavlja očekivanu ili srednju vrednost količine informacija pojedinačnih događaja

Entropija – se odnosi na skup od n događaja xi (i=1,…,n) sa verovatnoćama p(xi)

Skup od n događaja xi (i=1,…,n)

Entropija jezika

24/53

NMHr )(

=

Apsolutna entropija jezika:

U opštem slučaju entropija poruke M je H(M) = n2log gde je n broj mogućih značenja poruke i gde se pretpostavlja da su sva značenja poruke jednako verovatna. Entropija jezika:

bita,

LR 2log=

gde je N dužina poruke.

gde je L broj znakova.

25/53

Maksimalna entropija

•  Entropija je maksimalna kada sve moguće vrednosti slučajne promenljive X imaju istu verovatnoću. To se može prikazati na sledeći način:

)1,...,1(),...,( 1 nnHppH nnn ≤

26/53

Povećavanje broja događaja

•  Povećavanjem broja događaja čije su verovatnoće pojavljivanja jednake entropija se povećava, tj. važi:

)11,...,

11(),...,( 11 ++

≤ + nnHppH nnn

27/53

Transformacija podataka

•  Poruka ima značenje samo kada postane dostupna korisnicima

•  Značenje poruke zavisi od: q  znanja primaoca q  njegove sposobnosti da interpretira podatke

Videokonferencije kao primer deljenja informacija

28/53

29/53

Transformacija podataka

•  Za IS je bitno da je značenje podataka: q  tačno zapisano q  preneto korisnicima bez ostavljanja mogućnosti

za različite interpretacije •  Podaci postaju informacije

u trenutku njihovog korišćenja q  ako se prikupljeni podaci ne koriste,

oni ne postaju informacije

30/53

Transformacija podataka

•  Informacije se dobijaju selekcijom i obradom podataka

•  Obrada podataka – skup aktivnosti kojima se podaci transformišu u informacije

•  Informacije se prikazuju u formi pogodnoj za korisnika

PODACI PREDSTAVLJANJE

Alfanumerički podaci Brojevi, slova i drugi karakteri Podaci u vidu slike Grafički crteži i slike Zvučni podaci Zvuk, šum Video podaci Pokretne slike

31/53

Transformacija podataka

•  Proces transformacije podataka u informacije q  selekcija, organizacija i manipulacija (obrada)

Podaci Transformacija Informacije

... 1.5 ... 2.3 ... 3.5

Prosečna mesečna prodaja iznosi 2.3 miliona dolara

IS

32/53

Transformacija podataka

•  Proces transformacije podataka u informacije q  selekcija, organizacija i manipulacija (obrada)

Akvizicija Manipulacija Memorisanje Obezbeđivanje pristupa sa lokacije korisnika

Informacioni sistem

Spoljni podaci

Ulazni podaci

Postojeći podaci iz sistema

Odgovori na upite

Izlazne informacije

Efekti odluka

Ekspertske preporuke

Dokumenti o transakcijama

Izveštaji

33/53

Svojstva i vrste informacija

•  Poželjna svojstva informacija

•  tačnost •  kompletnost •  ekonomičnost •  fleksibilnost •  pouzdanost •  relevantnost •  adekvatnost

•  raspoloživost •  jednostavnost •  blagovremenost •  mogućnost verifikacije •  mogućnost pristupa •  trajnost •  zaštićenost

34/53

Svojstva i vrste informacija

•  Poželjna svojstva informacija q  neke željene karakteristike su međusobno

protivrečne •  mogućnost pristupa i zaštita •  zaštita i fleksibilnost •  pouzdanost, tačnost, zaštićenost i ekonomičnost

•  Kvalitetna informacija q  tačna, aktuelna, blagovremena, pouzdana,

u potrebnoj formi i verodostojna

35/53

Svojstva i vrste informacija

•  Vrste informacija q  najopštija podela

•  naučne •  poslovne (vrlo su obimne!)

q  praktična podela •  neformalne (mišljenje, rasuđivanje, iskustvo,...) •  formalne (od interesa za IS)

36/53

Svojstva i vrste informacija

•  Vrste informacija q  podela prema načinu prikazivanja

•  dokumenti •  vizuelne informacije (dijagrami, izveštaji, grafikoni,...) •  multimedijalne informacije

q  podela na osnovu načina generisanja •  eksterne (izvan sistema) •  interne (u samom sistemu)

–  lakše su za prikupljanje i kontrolisanje –  pouzdanije su, pristupačnije i jeftinije

37/53

Svojstva i vrste informacija

•  Vrste informacija q  podela prema učestalosti pojavljivanja/korišćenja

•  jednokratne •  periodične •  povremene

q  podela prema tome na koje se vremenske događaje ili stanja sistema odnose

•  statističke (informacije iz prošlosti, za ranije periode) •  kontrolne (o tekućem funkcionisanju sistema) •  planske (o budućem funkcionisanju ili događajima)

38/53

Svojstva i vrste informacija

•  Vrste informacija q  podela informacija prema obimu i kvalitetu

•  potpune •  nepotpune

–  neizvesnost se može ublažiti zaključivanjem na bazi analogije, sličnosti, indukcije, generalizacije, iskustva,...

•  preobimne –  otežavaju proces komuniciranja –  poskupljuju IS –  teško je izabrati prave informacije –  povećavaju verovatnoću donošenja pogrešnih odluka

39/53

Vrednovanje informacija

•  Važna pitanja pri projektovanju IS q  ko su korisnici informacija? q  koje informacije treba generisati? q  koje informacije treba čuvati? q  koje informacije treba koristiti?

40/53

Vrednovanje informacija

•  Kategorije korisnika informacija q  ljudi koji se bave

rukovođenjem, upravljanjem i planiranjem q  ljudi koji se bave naučnoistraživačkim radom q  ljudi koji se bave proizvodnim, poslovnim i

organizacionim delatnostima q  masovni korisnici – administracija, službenici,

trgovci, đaci, studenti i dr.

41/53

Vrednovanje informacija •  Faktori koji utiču na vrednost informacije

q  njena aktuelnost q  tačnost q  pouzdanost q  mera u kojoj zadovoljava potrebe korisnika

•  Različite kategorije korisnika različito vrednuju datu informaciju

•  Koeficijent tačnosti informacija q  količnik

broja tačnih i broja generisanih informacija

42/53

PRIMER REALNOG SISTEMA

43/53

Tipovi podržanih IT sistema

44/53

Tipovi podržanih IT sistema - nastavak

45/53

PRIMER 1

•  U jednoj grupi za vežbe ima ukupno 55 studenata, tj. 25 studenata i 30 studentkinja. Po završetku časa, studenti izlaze iz laboratorije za vežbe slučajnim redosledom. Prikazati entropiju situacije da iz laboratorije izađe prvo student, odnosno prvo studentkinja (samo postavka, bez izračunavanja).

46/53

PRIMER 1 - REŠENJE

⎟⎟⎟⎟

⎜⎜⎜⎜

+⎟⎟⎟⎟

⎜⎜⎜⎜

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

55301log

5530

55251log

5525

)(1log)( 22

2

12

iii XpXp

gde je X1 događaj "prvo izlazi student" a X2 događaj "prvo izlazi studentkinja".

47/53

PRIMER 2 •  U Muzeju Jugoslovenske Kinoteke od 01.11.2013. do

14.11.2013. održava se retrospektiva filmova Quentina Tarrantina. Biće prikazano ukupno 7 različitih filmova, svaki po dva puta. Svakog dana održava se samo jedna projekcija. Smatra se da je film Psi iz rezervoara među najinteresantnijim ostvarenjima tog režisera i sigurno je da će biti prikazan na toj retrospektivi, ali se u ovom trenutku ne zna kojih dana. Slučajni posetilac Kinoteke dolazi na projekciju samo 06.11.2013. i može da se dogodi da vidi ili da ne vidi film Psi iz rezervoara. Prikazati kako se računa entropija tog sistema (samo postavka, bez izračunavanja).

48/53

PRIMER 2 - REŠENJE

gde je X1 događaj "posetilac gleda film Psi iz rezervoara“, a X2 događaj "posetilac gleda neki drugi film"

⎟⎟⎟⎟

⎜⎜⎜⎜

+⎟⎟⎟⎟

⎜⎜⎜⎜

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

14121log

1412

1421log

142

)(1log)( 22

2

12

iii XpXp

49/53

PRIMER 3

•  U jednom jednostavnom hipotetičkom sistemu prikazuju se na ekranu u pravilnom cikličnom nizu jedna po jedna fotografija fudbalera jednog potpuno nepoznatog tima od 11 igrača, od kojih je samo jedan golman. Slučajni prolaznik baci pogled na ekran i može na ekranu da vidi ili da ne vidi golmana. Prikazati kako se računa entropija tog sistema (samo postavka, bez izračunavanja).

50/53

PRIMER 3 - REŠENJE

gde je X1 događaj "prolaznik vidi fotografiju golmana“, a X2 događaj "prolaznik vidi fotografiju nekog drugog igrača".

⎟⎟⎟⎟

⎜⎜⎜⎜

+⎟⎟⎟⎟

⎜⎜⎜⎜

=⎟⎟⎠

⎞⎜⎜⎝

⎛∑=

11101log

1110

1111log

111

)(1log)( 22

2

12

iii XpXp

51/53

ICT pojmovi

•  EPROM – (“Erasable Programmable Read Only Memory”) – ROM memorija koja se može reprogramirati, tj. brisati i ponovo programirati

•  FLIP-FLOP – elektronsko kolo sa dva stabilna stanja

•  BCD (“Binary Coded Decimal”) – binarno kodirani decimalni sistem, tj. metod za prikazivanje decimalnih brojeva pomoću binarnih brojeva

52/53

ICT pojmovi - nastavak

•  ASCII – (“American Standard Code for Information Interchange”) – američki standardni kod za prenos podataka

•  BIT (“binary digit”) – osnovna jedinica informacije koja može da ima vrednost 0 ili 1

•  Apsolutna adresa – apsolutna, tj. mašinska adresa, stvarna memorijska adresa

53/53

ICT pojmovi - nastavak

•  “multitasking” – istovremeno izvršavanje više zadataka u okviru jednog posla

•  “multiprogramming” – multiprogramiranje, tj. izvršavanje dva ili više programa na jednom računaru pri čemu korisnik ima utisak istovremenog izvršavanja