roar storleer: google - så god som forventet?

Post on 25-Jan-2017

306 Views

Category:

Education

8 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

GoogleSå god som forventet?

Foredrag holdt ved

«Treffpunkt Mikromarc»

Stockholm 3-4. November 2016

Roar Storleer

NTNU UB - Staben

2

U Universitetsbiblioteket

• Roar Storleer

• roar.storleer@ub.ntnu.no

• tel.: 73 59 51 23

• mob: 918 97 049

• adr.:

• NTNU UB Staff

• Høgskoleringen 1

• 7491 Trondheim

3Roar.storleer@ub.ntnu.no

Hvilke søkeverktøy

benytter du for å finne

kvalitets-sikret

informasjon?

4

Hvilke søkeverktøy skal jeg velge?

5

Smørbrødliste for vellykket resultat:

1. Forstå spørsmålet/analyser problemstillingen

2. Finne fram til signifikante søkeord.

TENK i SYNONYMER

3. Velge riktig søkeverktøy

4. Vite hvordan du utnytter det aktuelle

søkeverktøyets muligheter

5. Lage en god søkeprosedyre

6. Evaluere den funne informasjon om den er:

Sann

Pålitelig

Troverdig

Objektiv

Nøytral

Seriøs

7

Bygge søkeprosedyre

• Trunkering – maskering av karakterer (*, ?, #,!)

• Logiske operatorer (NOT, AND og OR)

• Nærhetsoperatorer/avstandsoperatorer

(NEAR/x, ONEAR/x, PRE/x, W/x, Nx, Wx,

AROUND(x)

• Feltkodesøking (TI, AU, JN, LA, DE, ID, ..)

• Frasesøking (” ”)

07.11.2016

8

Hva har Google?

• Trunkering – maskering av karakterer/ord: (/*)

• Logiske operatorer: (NOT (-), AND (default) , OR)

• Paranteser:

• Nærhetsoperatorer/avstandsoperatorer: (NEAR/x,

ONEAR/x, PRE/x, W/x, Nx, Wx, AROUND(x) ????

• Feltkodesøking:(TI (intitle), AU, JN, LA, DE, ID, ..)

• Frasesøking (” ”)

Søkemuligheter i noen SM: http://extremesearcher.com/chart1.html

9

Google søketips forts

• Foreslår søketermer når du er usikker på stavemåten (Instant)

• Kan maskere ord i flerordssøk med (*) wildcard, men har IKKE trunkering/maskering

• Stoppord og logiske operatorer søkes ut med ”xxx”

• «XX» søker eksakt (ikke synonymer/flertalls s/ordstammer)

• ” ” og –

• Synonymsøk: med ” ~” foran ord eg.: ~food (er fjernet)kan IKKE lengre søke på alle synonymer til food, men ikke food : ~food -food

• Intervallsøk: alt som har med tall, mengder, år, avstander, temperaturer, vekter, avstander, priser…med ”..” mellom intervall eg: 1958..1972; $200..$300 mm

07.11.2016

10

Proximity virker IKKE i Scholar

AROUND(x) er foreldet

07.11.2016

11

Bing/Yahoo!

• Yahoo bruker nå Bing’s database,

kommandoer og rangeringsalgoritme

• Ikke noe Avansert søke side – bruk kommandoer

• Liste over kommandoer:

http://msdn.microsoft.co/en-us/library/ff795620.aspx

• filetype: site: inboady: inurl:

• AND, NOT, OR og paranteser for komplekse søk

• Proximity; NEAR:n

07.11.2016

12Roar.storleer@ub.ntnu.no

GOOGLE (Gogool = 10100

)Wikipedia: 6x1079 atomer i hele universet

Kort historikk:

• Utviklet av Sergey Brin og Larry Page ved Stanford

University

• Basiside: Webs lenkestruktur som en stor graf

• Satt i drift i mars 1996, lansert 4. sept 1997, men

regner virkelig oppstart fra 27. sept 1998

• Hoved-ide for kvalitet: lenkesiteringer (PageRanking)

• Verbet å ”google” ble lagt til Merriam Webster Collegiate Dictionary

and the Oxford English Dictionary in 2006

• kilde: Wikipedia: http://en.wikipedia.org/wiki/History_of_Google

1307.11.2016

14Roar.storleer@ub.ntnu.no

Så - her er vidunderet:

15

- tjenester

07.11.2016

+ enda mer

1607.11.2016

17

Hva skjer – Google

søking?1. Web er lik en stor bok

med milliarder av sider

og de må indekseres.

Brukt millioner av

timer å bygge opp

indeksen

2. Søkespørsmål reiser

2400 km for å finne

svar og lister forslag og

tips ved feilstaving =

Google Instant

3. PageRanking: sist

oppdatert, linking, ord i

nettside, proximity,

stavelseskontroll,

synonymer, URL og

tittel, personalisering,

Innholdskvalitet, anbef.

av venner, beste

resultat nettside, bilde,

video, nyhet osv

4. Resultatet

5. Tid: 1/10 sek i gj.snitt

18

Noen tall

• Google Instant bruker i gjennomsnitt 1/10 sek

på hvert spørsmål

• Milliarder av søk hver dag

• Siden 2003 har Google besvart >600

milliarder nye unike spørsmål som ikke har

vært besvart før

• 16% av alle daglig søkinger er nye

19

Kriterier for utvalg?Googles spider Googlebot finner nettsider og følger lenkene til

nye nettsider osv

Mer enn 200 kriterier for utvalg

• Ord forekommer i tittel

• Ord forekommer i URL

• Ordene står ved siden av hverandre

• Inneholder sidene synonymer

• Er sidene fra «kvalitets»-institusjoner?

• Er sidene «PageRanked»

• Annerkjente sider som lenker til aktuell side

20

Kriterier for utvalg? forts

• Dokumenter med flest søketermer

• Hyppighet av termer i forhold til

størrelse på dokument

• Termenes innbyrdes avstand

• Står termene i tittel eller første avsnitt

• Metadata (Dublin Core)

07.11.2016

21

PageRank

07.11.2016

• PageRank er en algoritme for å rangere nettsteder i deres

søkemotor resultater

• PageRank er oppkalt etter Larry Page, en av

grunnleggerne av Google

• Pagerank er en måte å måle betydningen av nettsidene

• PageRank fungerer ved å telle antallet og kvaliteten av

lenker til en side for å finne et grovt anslag over hvor viktig

nettsiden er

• Den underliggende antakelsen er at viktige nettsteder

sannsynligvis får flere linker fra andre nettsteder.

22

Personalisering

• Hva jeg ser på min skjerm er ikke det samme som du ser på

din skjerm, og er heller ikke det samme som dine kollegaer

ser på deres skjermer, og er ikke det samme som dine

brukere ser.

• Google Scholar er mer konsistent

07.11.2016

23

Ting du bør vite om Google

• Google bruker personalisering og logger all din bruk på

tvers av Google-plattformene

• Kan slåes av/på ved

eller å logge seg av eller ikke logge på

07.11.2016

24

Hva samler Google på av data?

25

Google og personvernet

• bruker opplysningene til å gi våre brukere verdifulle produkter og tjenester

• utvikler produkter som er basert på omfattende personvernstandarder og -praksis

• gir brukerne innsyn i hvilke personlige opplysninger vi samler inn

• gir brukerne en rimelig mulighet til å beskytte sitt personvern

• håndterer opplysningene vi får tilgang på med største forsiktighet, slik at du kan føle deg trygg

Roar.storleer@ub.ntnu.no

26

Google - Boolsk søking!• (sykkeltur OR båttur) AND (Norge OR Sverige) NOT Danmark

07.11.2016

2707.11.2016

28

Søketeknikk – Google • dog OR pet

• cat food

• sukkerveien Norge OR Sverige

• hoteller oslo OR camping stockholm (1.800.000)

• hoteller AND Oslo OR camping AND Stockholm (14.700.000) – funker ikke

• sykkeltur OR båttur norge OR sverige -danmark

• museer trondheim OR ålesund OR kristiansund –oslofunker ikke

• Kan ikke søke på A OR (B AND C) OR D da OR har høyestprioritet

• «average size of octipus is 18 inch» (ikke slik) dropp størrelsen

29

norge bil OR båt sverige funker ikke

07.11.2016

30

Google søketips forts

• Ingen skjulte operatorer

• Verbatim for eksaktsøk

• Kan IKKE fjerne dubletter i GS

• GS – eksportfunksjon til EndNote, BibTex mm

• De fleste spesialtegn er med noen få unntak ikke søkbare

07.11.2016

31

Søk i lokal «land»-versjon

• Er du interessert i info om lokale forhold – søk i aktuell

landversjon eg; google.no, google.de osv

• Lokal søkemotor er bedre indeksert om lokale temaer enn .com

• Nyttig når en er ute etter data om en person, firma, spisesteder,

turopplegg osv som er knyttet til et bestemt land

• Gå til den relevante landversjonen av Google (/no, /se, /uk,

/com….)

• Erfares problemer med å få koblet seg opp mot /com fra lokal

versjon /no bruk google.com/ncr

07.11.2016

32

Ulike svar for google.no – com – se - osv

• Bruk nasjonal SM for lokal info

• Eks «Pizza – spise-steder i Trondheim»

33

Søketips - begrensninger

• oil AROUND(3) pollution nærhetsoperator/proximity

=foreldet

• oil * pollution maskering av ett/flere ord

• d?g går IKKE, google har ikke

maskering/trunkering men søker på

hele ord

• 1900..2000 intervallsøk

• 1900.. 2100 alle tall >=1900 - 1999 og

legger til 2100

34

Ting du bør vite om Google - forts

Google ser automatisk på variasjoner i dine

søketermer og dropper av og til søketermer fra

søket ditt

– Sier ikke ifra at de har gjort det

– «..» rundt termer, fraser, navn og titler virker ikke

alltid

– For å tvinge fram eksakt treff på en del av et søk

bruk ‘intext’ foran

eks: fottur allintext:jotunheimens fauna

– Bruk Verbatim for eksakt søk07.11.2016

35

Ting du bør vite om Google - forts

• Google web-søk søker IKKE i hele sin

database

– 2 indekser; «hovedindeks» som det søkes i

primært og en «tilleggsindeks»

– Tilleggsindeksen kan inneholde mindre populære,

uvanlige, spesialist materiale

– Tilleggsindeksen tas i bruk når Google tror/mener at

ditt søk har gitt for få treff/lite resultat

– Verbatim og noen avanserte søkekommandoer ser

ut til å trigge søk i tilleggsindeksen

07.11.2016

36

Ting du bør vite om Google - forts

• Google forandrer sin matematiske søke-algoritme

mange hunder ganger hvert år

– How Google makes improvements to its search algorithm– https://www.youtube.com/watch?v=J5RZOU6vK4Q&feature=youtu.be

• Vi som er brukere av Google er deres

forsøkskaniner

– Alt vi gjør logges og blir brukt til å forbedre søkeopplevelsene

for brukerne

07.11.2016

37

Ved søking vil Google:

• Foreslå søkeord og alternativ staving

• Personalisert søk – gi sider du har besøkt tidligere

• Inkludere synonymer/tilsvarende ord

• Søke etter ord med samme ordstamme - run fanger

opp running, men child fanger ikke opp children

• Men hvis du ønsker kun treff fra eksakt søk:

• «xxxx» – søke på eksakt ord eller bruk Verbatim

38

Søkeordenes rekkefølge og bruk av

partikkelord har betydning!

Noen forskjell:

• Who/A who/The who

• Blue sky/Sky blue

• 150 computer/$150 computer

• Tenk på den naturlige

sammenhengen søkeordene

skal stå i ønsket resultat

• Flower spider vs spider

flower

• Adobe Acrobat vs Acrobat

Adobe

• Car vs the car

• Black and white vs White and

black

39

De fleste spesialkarakterer er med få

unntak IKKE søkbare

• Ingen forskjell på store og små bokstaver

• Spesialkarakterer som betyr noe:

– C++

– C#

– #hashtagGoogle+

– $100

– @dmrussel

• Spesialkarakterer som IKKE betyr noe:

– £, ©, ®, §, ¶, (), !, %, ?

– ©2010 søker på 2010

40

Rettskrivingshjelp + tips til termer

Google Instant

41

Søketips

• Tenk på filformat

– PDF for dokumenter

– PPT/PPTX for presentasjoner

– XLS/XLSX for statistikk og regneark

– "summer temperature in Israel" filetype:xls

• Bruk kommdoen: filetype:xxxx

• «fish farming» salmon feeding filetype:ppt

• Gjenta viktige søketermer

• Forandre rekkefølge av ord

• Bruk frasesøk («..») eller nærhetsoperator (AROUND(x))

foreldet07.11.2016

42

Google - feltkoder

• link:www.ub.ntnu.no

• related:www.vg.no

• info:www.google.com gir informasjon om nettstedet

• define:hoemopathy

• site:www.google.com help / site:edu, site:org

• allintitle/Intitle:solar power

• allinurl/Inurl:google search

• allintext/Intext: søker i ”body” felt

• allinanchor/Inanchor: beste restaurant Tromsø

• safesearch:breast cancer

• filetype: zoology filtype:ppt

• Inauthor:ibsen, henrik kun i Scholar

43

Google - feltkoder

• Data range:201502-201506 norge

• Related:www.ntnu.no

• Cache:www.google.com

• Book Nora et dukkehjem

• Movie:dance with wolfs

• Weather:Oslo

44

Snertne søketriks (Shortcuts)Google Search Features

• Snertne søketriks (Shortcuts) :

– Time in Jerusalem

– Weather in Trondheim

– Capital Israel

– Population in Norway

– Movie Trondheim

– Map Telaviv

– Flight SK4552

– Tolvon antidepressant

– 1200 EUR to USD

– 43 C to F

– 150 pounds to kg

– Define ASCII

– ~pretty

– 5.77 * (258+477) /22

– patent 6588078

45

top related