Download - Arbeitsweise Google
![Page 1: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/1.jpg)
Erläuterung der Suchtechnologie von Google
![Page 2: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/2.jpg)
Vier Arbeitsschritte
1. Crawling2. Indexing3. Ranking
4. Displaying
![Page 3: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/3.jpg)
Definition nach Google
1. Crawling the Web, following links to find pages2. Indexing the pages to create an index from
every word to every place it occurs3. Ranking the pages so the best ones show up
first4. Displaying the results in a way that is easy for
the user to understandQuelle: “Internet Searching”, 2004, Peter Norvig, Director of Research Google Inc.
![Page 4: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/4.jpg)
1. Crawling
• Webcrawler (Robots, Bots) folgen Links um neue Seiten zu finden
• Übermittlung der Inhalte an den Index
• Suche und Übermittlung von neuen URLs zur Indexierung
![Page 5: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/5.jpg)
Schematische Darstellung des Crawlings
![Page 6: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/6.jpg)
Probleme beim Crawling
• Seite kann zurzeit nicht ausgeliefert werden
• Seite ist nicht erreichbar• Seite ist dupliziert auf verschiedenen
Seiten• Seite ist verfügbar unter verschiedenen
URL innerhalb der Domain
![Page 7: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/7.jpg)
Weitere Probleme:
• Viele Seiten enthalten Inhalte die nicht dem HTML Standard entsprechen
• HTTP Weiterleitungen• Ausschluss über die robots.txt Datei• Information ist schwer zu erreichen, weil
sie sich hinter einem Formular, einer Flashanimation oder JavaScript verbirgt
![Page 8: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/8.jpg)
2. Indexing
• Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.
![Page 9: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/9.jpg)
2. Indexing
• Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.
• Nicht alles was gecrawlt wird, landet im Index!
![Page 10: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/10.jpg)
3. Ranking
• Über 200 Rankingfaktoren (z.B. PageRank)
• Wertigkeit der Webseite ermitteln
• Reihenfolge in der Präsentation festlegen
![Page 11: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/11.jpg)
Ein Rankingfaktor: PageRank
Definition:PageRank interpretiert einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A
![Page 12: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/12.jpg)
PageRank Formel
![Page 13: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/13.jpg)
![Page 14: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/14.jpg)
4. Displaying
• Anzeigen der Resultate in einer Form die für den Nutzer leicht verständlich ist
• Vorhandene relevante Werbung anzeigen
![Page 15: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/15.jpg)
OptimierungsansätzeOptimierungsansätze
1. Crawling2. Indexing3. Ranking
4. Displaying
![Page 16: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/16.jpg)
• Validität/HTML Standards beachten• Dokumentengliederung• Position der Suchbegriffe
Optimierung Crawling/Indexing
![Page 17: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/17.jpg)
• Suchmaschinenfreundlichkeit• Links, Links, Links• Social Media Graphen• User generated Content
Optimierung Ranking
![Page 18: Arbeitsweise Google](https://reader036.vdocuments.site/reader036/viewer/2022082811/558df1451a28ab2b438b459a/html5/thumbnails/18.jpg)
• HTML-Titel• Description / Snippet
Optimierung Displaying