bpcas6 web baza analiza podataka

72
WEB BAZE PODATAKA (analiza podataka)

Upload: slavisa-kazanovic

Post on 30-Nov-2015

37 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: BPCAS6 Web Baza Analiza Podataka

WEB BAZE PODATAKA

(analiza podataka)

Page 2: BPCAS6 Web Baza Analiza Podataka

ŠTA SU WEB BAZE PODATAKA ?

Kao i svaki uobičajeni sistem za upravljanje bazama podataka, Web baza podataka je skladište podataka ili nosilac informacija kojem je moguće pristupiti putem jezika upita ili programiranjem API-ja (Application Programming Interface – interfejs za programiranje).

Page 3: BPCAS6 Web Baza Analiza Podataka

• Za razliku od konvencionalnog sistema baza podataka, kod Web baza podataka, ovakav pristup se obično ne obavlja korišćenjem naredbi otkucanih na komandnoj liniji ili pomoću interfejsa koji su posebno dizajnirani za korišćenje na određenoj računarskoj platformi.

Page 4: BPCAS6 Web Baza Analiza Podataka

• Web bazama podataka se pristupa kroz druge Web aplikacije – specifično, formama koje su razvijene korišćenjem standardizovanih HTML znakova, ActiveX kontrole i skripti na strani klijenta napisane, na primer, pomoću VBScript-a ili JavaScript-a.

Page 5: BPCAS6 Web Baza Analiza Podataka

Korišćenjem mogućnosti dostupnih u HTML-u, aplikativnim programima na Web serveru se pristupa kroz server-side programe putem CGI (Common Gateway Interface), server-specific interfejsa kao što je Microsoft-ov Internet Information Server (IIS), interfejs za aplikativno programiranje (ISAPI) ili server-side okruženje skripti kao što su IIS-ove Active Server stranice (koje koristi Visual Basic).

Page 6: BPCAS6 Web Baza Analiza Podataka

• HTML forme interfejsa omogućavaju da se kreiraju aplikacije koje sadrže funkcionalnost baza podataka i obezbeđuju pristup skladištima podataka u korist Web klijenta (tj. korisnik i pretraživač).

Page 7: BPCAS6 Web Baza Analiza Podataka

• Može se dizajnirati aplikacija samostalno u cilju ispitivanja baze podataka i dobijanja specifične informacije – na primer, profil najuspešnijih prodavaca u nekoj kompaniji tokom poslednjeg kvartala.

Page 8: BPCAS6 Web Baza Analiza Podataka

• Aplikacija, takođe, može da iskoristi informacije izvučene iz baze podataka radi kreiranja složenije baze podataka. Statistika prodaje lanca prodavnica mogu se izvući iz baze podataka, na primer, i iskoristiti za statističku analizu kako različite prodaje i promocije utiču na dobitak tokom određenog vremenskog perioda.

Page 9: BPCAS6 Web Baza Analiza Podataka

• Mogućnost da se integriše baza podataka u aplikaciju kojoj mogu pristupiti korisnici upotrebom Web pretraživača je ono što bazu podataka čini Web bazom podataka.

Page 10: BPCAS6 Web Baza Analiza Podataka

STATISTIČKA ANALIZA POSEĆENOSTI WEB SAJTA

Najveća tekovina koja je proizašla iz poslovne primene Interneta i njegovog multimedijalnog servisa poznatog pod nazivom Web (WWW – World Wide Web) jeste potpuno okretanje potrebama korisnika.

Page 11: BPCAS6 Web Baza Analiza Podataka

• Merenje i analiza posećenosti Web sajta imaju veliki značaj u poboljšanju dvosmerne komunikacije na relaciji između uslužne kompanije (vlasnika Web sajta) i potrošača (posetioca Web sajta). Statistika posećenosti je veoma bitan elemenat i u analizi kvaliteta Web sajta.

Page 12: BPCAS6 Web Baza Analiza Podataka

NAČINI MERENJA POSEĆENOSTI WEB SAJTOVA

Postoji nekoliko načina za merenje posećenosti, a izbor metoda zavisi od potreba za takvim informacijama i ozbiljnosti sa kojom se upravlja sajtom.

Page 13: BPCAS6 Web Baza Analiza Podataka

Najjednostavniji način merenja posećenosti je postavljanje brojača na sajt. Svaki posetilac koji kompletno učita stranicu sajta uvećava brojač za 1.

Page 14: BPCAS6 Web Baza Analiza Podataka

Tracker radi identično kao brojač, beležeći posetioce koji su kompletno učitali stranicu sajta.

Međutim, ovaj metod daje više informacija o posetiocu: vreme posete, operativni sistem posetioca, da li je posetilac došao sa nekog drugog sajta ili ukucao URL i slično.

Page 15: BPCAS6 Web Baza Analiza Podataka

Nedostak ovog metoda je oslanjanje na grafički segment stranice.

Ovaj metod je široko prihvaćen jer je besplatan i lako razumljiv.

Jedan od najpopularnijih tracker-a je Web Trends Live.

Page 16: BPCAS6 Web Baza Analiza Podataka

Za one koji koji žele mnogo više informacija o posećenosti sajta odličan izvor su log fajlovi. Jedan od najvećih problema vezanih za informacije iz log fajla, jeste takozvani problem keširanja.

Page 17: BPCAS6 Web Baza Analiza Podataka

Ovaj problem nastaje kada se Web prezentacija ili njen deo čuva na nekom drugom serveru, na putu između korisnika i stvarnog servera Web sajta.

To može da bude disk samog korisnika na kome se čuvaju Web stranice kojima je korisnik poslednji put pristupao.

Page 18: BPCAS6 Web Baza Analiza Podataka

Zatim, to može da bude disk na proxy serveru (ovlašćenom serveru) – velike kompanije imaju po nekoliko desetina ili stotina računara koji pristupaju Internetu preko jednog proxy servera.

U toj situaciji značajan deo Web prezentacije može se nalaziti na proxy serveru, veliki broj korisnika će joj pristupati, ali to neće biti registrovano u log fajlu.

Page 19: BPCAS6 Web Baza Analiza Podataka

Takođe, komercijalni servisi čuvaju na svojim serverima veliki broj prezentacija kako bi svojim korisnicima omogućili brži pristup.

U svim ovim situacijama može se desiti da se ostvari pristup Web prezentaciji a da log fajl nema informaciju o tome.

Ovo je jedan od problema u merenju pristupa Web sajtu za koji još uvek ne postoje dovoljno kvalitetna rešenja.

Page 20: BPCAS6 Web Baza Analiza Podataka

Jedna od mogućnosti koje se uvode u postupak analize pristupa Web sajtovima jeste upotreba takozvanih kukija (cookies).

Cookie je informacija koju Web server beleži u browser korisnika, i na osnovu koje prepoznaje korisnika prilikom njegovog novog pojavljivanja.

Page 21: BPCAS6 Web Baza Analiza Podataka

Osim toga, uz pomoć cookie-ja se prate i beleže aktivnosti svakog korisnika kao pojedinca, na osnovu čega se mogu dobiti značajne informacije, naročito o korisnicima koji često pristupaju.

Page 22: BPCAS6 Web Baza Analiza Podataka

Postoji više programskih paketa za statističku analizu sajtova na osnovu log fajlova.

Neke od njih koriste i naši provajderi, na primer, Satto loganalyzer i Webalizer.

Page 23: BPCAS6 Web Baza Analiza Podataka

1. Svi ovi programi prikazuju opšti pregled aktivnosti na sajtu.

2. Podaci u tabelama i grafikoni pokazuju dinamiku upotrebe sajta.

3. Međutim, za detaljniju statističku analizu ovi paketi programa nisu dovoljni.

Page 24: BPCAS6 Web Baza Analiza Podataka

The Webalizer je besplatan program za brzu analizu web server log fajlova. On proizvodi detaljne izveštaje u HTML formatu koji se mogu pregledati pomoću standardnih browser-a.

Page 25: BPCAS6 Web Baza Analiza Podataka

Postoji i domaći servis www.radar.co.yu za merenje posećenosti sajta. On je identičan, po svrsi, stranom sajtu www.alexa.com i osnovni zadatak mu je praćenje posećenosti domaćih Web sajtova.

Page 26: BPCAS6 Web Baza Analiza Podataka

Ovaj sajt daje dnevni i mesečni pregled posećenosti domaćih Web sajtova uslužnih i ostalih kompanija.

Takođe, preko ovog sajta se mogu dobiti osnovne informacije o svakom sajtu koji ima domen yu, njegovim konkurentskim sajtovima, utvrditi njegovi komplementarni strani Web sajtovi itd.

Page 27: BPCAS6 Web Baza Analiza Podataka

INFORMACIJE O POSEĆENOSTI WEB SAJTOVAMeđu informacijama koje nude Web

analizeri – programi za analizu pristupa Web sajtu, najčešće su sledeće: broj pogodaka, zahteva ili poseta; dužina trajanja sesije, vrste informacija koje se traže, adresa sa koje korisnik pristupa, domeni korisnika; statistika upotrebe po satima, danima i mesecima; prva stranica kojoj korisnik pristupa i slično.

Page 28: BPCAS6 Web Baza Analiza Podataka

Brojem pogodaka naslovne stranice se smatra broj uspešnih učitavanja stranice, ne računajući grafiku.

Page 29: BPCAS6 Web Baza Analiza Podataka

Ukupnim brojem pogodaka se smatra svako uspešno učitavanje HTML stranice, slike, forme, skripta ili preuzete datoteke.

Page 30: BPCAS6 Web Baza Analiza Podataka

Prosečan broj pogodaka na dan i broj sesija na dan pokazuju prosečne aktivnosti korisnika na sajtu za svaki dan u periodu izveštavanja.

Page 31: BPCAS6 Web Baza Analiza Podataka

Najposećenije stranice – ova grupa podataka identifikuje najpopularnije stranice na sajtu i frekvenciju njihove posećenosti.

Takođe, dati su podaci o prosečnom vremenu koje posetilac provodi na svakoj od njih. Podaci ne uključuju pogotke grafike, audio i video sadržaja. Dat je procentualni odnos pogodaka stranice u odnosu na ostali HTML sadžaj.

Page 32: BPCAS6 Web Baza Analiza Podataka

Najmanje posećene stranice – ova grupa podataka identifikuje najmanje posećene stranice na sajtu. Broj impresija se odnosi samo na uspešno učitane HTML stranice, ne i na grafiku.

Page 33: BPCAS6 Web Baza Analiza Podataka

Najčešće ulazne stranice – ova

grupa pogodaka identifikuje prve stranice koje su viđene kada posetilac uđe na sajt.

To je najčešće naslovna strana, ali u nekim slučajevima to može biti i neka druga strana čiju adresu posetilac unese direktno ili upotrebi link.

Page 34: BPCAS6 Web Baza Analiza Podataka

Procenat se odnosi na ukupni broj sesija započetih ispravnim tipom dokumenta. Ako je sesija započela drugim tipom sadržaja (slika ili zvuk), taj sadržaj neće biti uračunat kao ulazni, a sesija se ne ubraja.

Page 35: BPCAS6 Web Baza Analiza Podataka

Najčešće izlazne stranice – ova grupa podataka identifikuje najčešće stranice sa kojih su posetioci napustili sajt. Procenat se odnosi na ukupni broj sesija koje su započele standardnim tipom dokumenta. Ako je sesija počela nestandardnim tipom podatka (grafika, zvuk), ona neće biti uračunata.

Page 36: BPCAS6 Web Baza Analiza Podataka

Pristup jednoj strani – ova grupa podataka identifikuje stranice sajta kojima su posetioci pristupili direktno i izašli bez pregleda bilo koje druge stranice.

Page 37: BPCAS6 Web Baza Analiza Podataka

Najčešće putanje kroz sajt – ova grupa podataka identifikuje putanje koje posetioci najčešće prate kada su na sajtu. Putanja počinje ulaznom stranicom i pokazuje sledećih šest pregledanih stranica.

Page 38: BPCAS6 Web Baza Analiza Podataka

Najčešće korišćene forme i skriptovi – ova grupa podataka identifikuje najpopularnije forme i skriptove koji se izvršavaju na sajtu.

Page 39: BPCAS6 Web Baza Analiza Podataka

Pregled aktivnosti u nedelji – ova grupa podataka podvlači aktivnosti sajta, poredeći aktivnosti radnim danom i vikendom. Posebno su navedeni najviše i najmanje aktivni dani u nedelji u periodu izveštaja.

Page 40: BPCAS6 Web Baza Analiza Podataka

Nivo aktivnosti po danima u nedelji – ova grupa podataka prikazuje aktivnosti sajta po danima u nedelji za period izveštavanja. Tabela prikazuje broj pogodaka i procente pogodaka u odnosu na ukupan broj sesija.

Page 41: BPCAS6 Web Baza Analiza Podataka

Nivo aktivnosti po satima u danu – ova grupa podataka prikazuje najaktivniji i najmanje aktivan sat u danu za period izveštavanja i nivo aktivnosti u svakom satu.

Page 42: BPCAS6 Web Baza Analiza Podataka

Nivo aktivnosti po danima u mesecu – ova grupa podataka prikazuje, za period izveštavanja, nivo aktivnosti u svakom danu.

Page 43: BPCAS6 Web Baza Analiza Podataka

Nivo aktivnosti po mesecima u godini – ova grupa podataka prikazuje, za prethodnih 12 meseci, nivo aktivnosti u svakom mesecu.

Page 44: BPCAS6 Web Baza Analiza Podataka

Tehničke statistike i analize – ova grupa podataka čini tehnički presek pouzdanosti sajta. Tabela prikazuje broj uspešnih i neuspešnih pogodaka na sajtu i izražava procentualni odnos.

Page 45: BPCAS6 Web Baza Analiza Podataka

Greške klijenata – ova grupa podataka identifikuje vrste grešaka koje prave posetioci dok pristupaju sajtu. Tabela prikazuje sve uočene greške sortirane po broju pojavljivanja.

Page 46: BPCAS6 Web Baza Analiza Podataka

Najfrekventniji direktorijumi – ova grupa podataka analizira pristupe direktorijumima na sajtu. U tabeli su prikazani najfrekventniji direktorijumi u opadajućem redosledu prema broju pogodaka.

Page 47: BPCAS6 Web Baza Analiza Podataka

Najčešći dolazni sajtovi – ova grupa podataka identifikuje imena domena ili numeričke IP adrese sa linkovima ka sajtu.

Page 48: BPCAS6 Web Baza Analiza Podataka

Najčešće dolazne URL adrese – ova grupa podataka daje pune URL adrese sajtova koji sadrže linkove ka sajtu. Podaci se ne odnose na posetioce koji su direktno ukucali URL sajta.

Page 49: BPCAS6 Web Baza Analiza Podataka

Najčešći pretraživači – u tabeli su navedeni pretraživači koje su posetioci upotrebili da bi došli do sajta.

Page 50: BPCAS6 Web Baza Analiza Podataka

Najčešće ključne reči u pretrazi – tabela identifikuje ključne reči koje dovode najviše posetilaca na sajt. Druga tabela identifikuje pretraživače po ključnim rečima.

Page 51: BPCAS6 Web Baza Analiza Podataka

Najčešće korišćeni browseri – ova grupa podataka identifikuje najpopularnije Web browsere koje koriste posetioci sajta.

Page 52: BPCAS6 Web Baza Analiza Podataka

Najčešće korišćene platforme – ova grupa podataka identifikuje operativne sisteme koje koriste posetioci sajta.

Page 53: BPCAS6 Web Baza Analiza Podataka
Page 54: BPCAS6 Web Baza Analiza Podataka
Page 55: BPCAS6 Web Baza Analiza Podataka

Domen korisnika i podaci o zemlji iz koje korisnik pristupa – ovo su podaci koje treba razmatrati sa rezervom, jer postoji veliki broj domena koji ne nose oznaku zemlje iz koje dolaze, nego su pod opštim domenima tipa com, edu, org i slično.

Takođe, oznaka zemlje ne znači da se korisnik i fizički nalazi u toj zemlji. Ovi podaci mogu biti korisni uz dodatnu obradu i analizu.

Page 56: BPCAS6 Web Baza Analiza Podataka
Page 57: BPCAS6 Web Baza Analiza Podataka

PRISTUPI U PROCESU MERENJA I ANALIZE POSEĆENOSTI WEB

SAJTA

U procesu merenja i analize posećenosti sajta postoje sledeća dva pristupa:

Korisnički (panel) zasnovano merenje;Server zasnovano merenje.

Page 58: BPCAS6 Web Baza Analiza Podataka

Osnovna razlika između ova dva pristupa je u merenju pojedinačnih posetilaca – različitih korisnika koji su pristupili sajtu.

Page 59: BPCAS6 Web Baza Analiza Podataka

Dok se kod korisnički orijentisanog pristupa (npr. MediaMetrix) dobija tačan i jasan podatak o broju jedinstvenih poseta, kod server orijentisanih pristupa (npr. Alexa) koriste se grube aproksimacije zasnovane na cookie-jima, IP adresama ili registracijama korisnika.

Page 60: BPCAS6 Web Baza Analiza Podataka

Za razliku od server orijentisanog pristupa, korisnički orijentisani pristup jasno razlikuje pojedinačnog posetioca od višestrukog posetioca.

Page 61: BPCAS6 Web Baza Analiza Podataka

Ovaj pristup razlikuje i jedinstvenu posetu stranici. Značajna prednost korisnički orijentisanog pristupa je i da se jednom impresijom smatra poseta jednoj stranici bez obzira koliko fajlova ona sadrži.

Page 62: BPCAS6 Web Baza Analiza Podataka

Za razliku od server orijentisanog pristupa u korisnički orijentisanom pristupu terminologija je univerzalna i standardizovana.

Mada je Internet elektronski medij koji pruža mogućnosti za pouzdano i tačno merenje posećenosti, ipak, ne postoji metod koji bi sa potpunom sigurnošću dao tačne podatke o posećenosti.

Page 63: BPCAS6 Web Baza Analiza Podataka

Trenutno postoje dva metoda koje možemo porediti, ali tačnost podataka je i dalje relativna i precizna samo u domenu statistične analize.

Page 64: BPCAS6 Web Baza Analiza Podataka

Zastupljeniji je server orijentisan metod koji je neosporno lošiji za merenje posećenosti u odnosu na korisnički orijentisani metod. Iako je trenutno manje zastupljen, korisnički orijentisan metod, svojim prednostima i rešenjima nedostataka server orijentisanog metoda, postaje sve popularniji i sve se više koristi.

Page 65: BPCAS6 Web Baza Analiza Podataka

Situacija kod nas je takva da mali broj korisnika zahteva tačne podatke o posećenosti, a to je dovelo do toga da se koriste veoma različiti servisi za istraživanje posećenosti.

Page 66: BPCAS6 Web Baza Analiza Podataka

I kod naših provajdera popularniji je server orijentisani pristup, ali kao i u svetu izražen je trend rasta popularnosti korisnički orijentisanog pristupa.

Page 67: BPCAS6 Web Baza Analiza Podataka

MOGUĆNOST KORIŠĆENJA SPSS PAKETA PROGRAMA ZA STATISTIČKU

ANALIZU POSEĆENOSTI SAJTA

Za razliku od specijalizovanih paketa programa za statističku analizu posećenosti sajtova poznati opšti paketi programa za statističku analizu, kao na primer SPSS, sadrže alate koji vlasnicima sajtova daju veće mogućnosti da sami obave određene analize.

Page 68: BPCAS6 Web Baza Analiza Podataka

Ako želimo korišćenjem, na primer, paketa programa SPSS, detaljnije da analiziramo podatke o aktivnostima na sajtu, prvi problem na koji nailazimo je da u dosadašnjim verzijama ovog inače odličnog programa za statističku analizu ne postoji mogućnost direktnog čitanja HTML tabela.

Page 69: BPCAS6 Web Baza Analiza Podataka

Zbog toga je neophodno da podatke iz HTML tabele prebacimo u neki od formata koji ovaj program može da koristi, na primer, u datoteku programa za tabelarna izračunavanja (Excel), naredbom Export to Microsoft Excel.

Page 70: BPCAS6 Web Baza Analiza Podataka
Page 71: BPCAS6 Web Baza Analiza Podataka
Page 72: BPCAS6 Web Baza Analiza Podataka

Konačno, podatke iz ove datoteke možemo da koristimo za neku od analiza u SPSS programu:

• Merne skale;• Statističke procedure za sumarno

prikazivanje podataka;• Statističke procedure za poređenje sredina

(Means, Independent T-test, Paired-Samples T-test );

• Modele analize varijanse (One-Way Analysis of Variance, Simple-Factorial ANOVA);

• Regresione modele (Regression - Linear, Regression – Curve Estimation), itd.