perspektiven eines open web index
TRANSCRIPT
![Page 1: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/1.jpg)
Perspektiven eines „Open Web Index“
Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg [email protected] @Dirk_Lew DGI-Forum Wittenberg „True Fiction: Die Digitalisierung unseres Alltags“ Wittenberg, 25. September 2015
![Page 2: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/2.jpg)
Gliederung
1. Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt 2. Das „Problem Google“ 3. Alternative Suchmaschinen 4. Lösungsvorschläge 5. Die Initiative „Open Web Index“ (OWI) 6. Fazit
![Page 3: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/3.jpg)
Die Bedeutung der Suchmaschinen und der Suchmaschinenmarkt
![Page 4: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/4.jpg)
Ansätze zur Erschließung der Inhalte des Web (Auswahl)
![Page 5: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/5.jpg)
Wer das Internet nutzt, nutzt Suchmaschinen
• Suchmaschinen sind der beliebteste Dienst des Internt (Purcell, Brenner & Raine, 2012; van Eimeren & Frees, 2013)
van Eimeren, B.; Frees, B. (2013): Rasanter Anstieg des Internetkonsums – Onliner fast drei Stunden täglich im Netz: Ergebnisse der ARD/ZDF-Onlinestudie 2013. Media Perspektiven 54(7-8), 358-372.
![Page 6: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/6.jpg)
Entwicklung des Suchanfragevolumens (USA)
Daten von ComScore. Die Daten wurden aus den regelmäßig bei „Search Engine Land“ veröffentlichten Zahlen zusammengestellt. (s. http:// searchengineland.com/library/stats/stats-comscore))
![Page 7: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/7.jpg)
Es wird eigentlich nur eine Suchmaschine genutzt
ComScore-Zahlen Deutschland, März 2012; http://www.focus.de/digital/internet/netzoekonomie-blog/suchmaschinen-googles-marktanteil-steigt- auf-96-prozent-in-deutschland_aid_723240.html
95,9
1,1
0,9
0 10 20 30 40 50 60 70 80 90 100
Bing
Yahoo
![Page 8: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/8.jpg)
Das „Problem Google“
![Page 9: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/9.jpg)
Durch Google bzw. seine Marktmacht verursachte Probleme
1. Nur eine von vielen möglichen algorithmischen Sichten auf die Inhalte des Web
2. Bevorzugung eigener Angebote 3. Effekt der Suchmaschinenoptimierung 4. (Dominanz bei der Online-Werbung)
![Page 10: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/10.jpg)
![Page 11: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/11.jpg)
![Page 12: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/12.jpg)
Desktop layout
593 clicks (59.3%)
0 clicks (0%)
358 clicks (35.8%)
49 clicks (4.9%)
Bevorzugung eigener Angebote
23
Lewandowski, D.; Sünkler, S.: Representative online study to evaluate the commitments proposed by Google as part of EU competition investigation AT.39740-Google - Report for Germany http://searchstudies.org/tl_files/Publikationen_PDFs/2013/Google_Online_Survey_DE.pdf
![Page 13: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/13.jpg)
![Page 14: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/14.jpg)
Anfragetypen in der Websuche nach Broder (2002)
• Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren.
– Ziel sind mehrere Dokumente. • Navigational (navigationsorientiert)
– Ziel ist es, eine bestimmte Seite (wieder) zu finden.
– Typisch: Suche nach Homepage („Ebay“).
– Ziel ist i.d.R. ein Dokument.
• Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
– Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
![Page 15: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/15.jpg)
Zufriedenheit der Nutzer in Bezug auf die Anfragetypen
Tabelle 1: Eindeutige Bewertbarkeit von Suchanfragen nach Anfragetyp
Navigationsorientiert Informationsorientiert Transaktionsorientiert
Eindeutig bewertbar Suche nach einem bereits
bekannten Dokument
Suche nach einem Faktum
Suche nach Trivia
Informationsorientierte
Suche, zu der Informationen
aus einer bestimmten Quelle
erwartet werden (bspw.
Wikipedia)
Suche nach einer bekannten
Website, auf der eine
Transaktion durchgeführt
werden soll
Nicht eindeutig
bewertbar
- Klassische
Informationssuche mit dem
Anspruch, ein vollständiges
Bild zu gewinnen bzw. einen
umfassenden Überblick
Mehrere Varianten der
Transaktion möglich
![Page 16: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/16.jpg)
Über was haben Suchmaschinen eigentlich Macht?
• Über das, was überhaupt in den Index aufgenommen wird – Technisch bedingte Probleme der Web-Indexierung
– Demokratisch legitimierter Ausschluss von Inhalten
– Willkürlicher Ausschluss von Inhalten
• Über das, was wir als Nutzer zu sehen bekommen – Reihung der Dokumente
– Anordnung der Suchergebnisseiten
– Direkte Antworten
![Page 17: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/17.jpg)
Es kann keine verzerrungsfreie Suchmaschine geben
• Verzerrungen werden zum Problem durch die Kombination von • Dominanz des Modells „algorithmische Web-Suchmaschine“
• Dominanz von Google in diesem Bereich
• Nutzerverhalten
• Probleme werden sich zukünftig noch verstärken durch • Direkte Beantwortung von Suchanfragen
• Wandel von Suchanfragen und Dokumenten
![Page 18: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/18.jpg)
XXXX
• XXXX – XXXX
– XXXX
• XXXX – XXXX
– XXXX
![Page 19: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/19.jpg)
Alternative Suchmaschinen
![Page 20: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/20.jpg)
Alternative Suchmaschinen
• Was ist eigentlich eine „alternative Suchmaschine“? – Jede Suchmaschine außer Google? à „Google Killer“, Cuil†
– Suchmaschinen, die grundlegend dasselbe machen wie Google? à Bing
– Suchmaschinen, die sich durch regionale Kompetenz abheben? à Seekport†
– Suchmaschinen, die neue/alternative Ansätze zur Erschließung und Durchsuchbarmachung des Web verfolgen?
• Keine Alternative: „Suchmaschinen“, die Ergebnisse einer anderen Suchmaschine anzeigen.
![Page 21: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/21.jpg)
Beziehungsgeflecht der Suchmaschinen (Deutschland)
Lewandowski, D. (2015). Suchmaschinen verstehen. Berlin Heidelberg: Springer Vieweg. S. 158)
![Page 22: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/22.jpg)
Das Partnerindex-Modell hat den Suchmaschinenmarkt ausgedünnt
• Geschäftsmodell Partnerindices – Eine Suchmaschine mit eigenem Index stellt ihre Ergebnisse und
ihre Textanzeigen dem Partner zur Verfügung
– Das mit den Werbeklicks verdiente Geld wird nach einem vorher festgelegten Schlüssel zwischen Suchmaschine und Partner aufgeteilt
• Attraktivität des Modells – Minimale zusätzliche Kosten pro Anfrage für die gebende
Suchmaschine
– Enorme Kostenersparnis für die nehmende Suchmaschine (Betrieb einer eigenen Suchmaschine entfällt)
– Ergebnis: Ausdünnung des Suchmaschinenmarkts
![Page 23: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/23.jpg)
• Suchmaschinen-Indexe aktuell – Google – Bing – Yandex – Baidu
• Eingestellte Suchmachinen-Indexe (seit 2009) – Yahoo – Ask – Cuil
• Neue Suchmaschinen-Indexe – Blekko – Duck Duck Go
• Web-Indexe für Analysezwecke (Beispiel) – Moz – OpenCrawl
Überblick Web-Indexe Auswahl
![Page 24: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/24.jpg)
Bias der Suchmaschinen
• Drei Ebenen von Suchmaschinen-Bias (Weber, 2011) – Implementierung der Suchmaschine
– Verhalten der Anbieter von Inhalten
– Nutzung von Suchmaschinen
à Eine „verzerrungsfreie“ Suchmaschine kann es nicht geben
• Verzerrungen werden zum Problem durch die Kombination von • Dominanz des Modells „algorithmische Web-Suchmaschine“
• Dominanz von Google in diesem Bereich
• Nutzerverhalten
![Page 25: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/25.jpg)
Warum brauchen wir mehr als eine Suchmaschine?
• Meinungsvielfalt • Wahl zwischen verschiedenen (algorithmischen) Sichten auf die Welt • Ideologiefreie Suchmaschinen sind nicht möglich
![Page 26: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/26.jpg)
Mögliche Lösungen
![Page 27: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/27.jpg)
Lösungsvorschläge
1. Der Markt wird‘s richten 2. Google zu fairer Ergebnisanzeige verpflichten 3. Google zerschlagen 4. Eine alternative Suchmaschine aufbauen 5. Google zwingen, seinen Index zu öffnen 6. Web-Index als Infrastrukturmaßnahme
![Page 28: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/28.jpg)
Die “lokale Kopie” des Web
Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
![Page 29: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/29.jpg)
Entkopplung von Index und Diensten
Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
Infrastruktur (öffentlich)
Dienste (Eigeninitiative)
![Page 30: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/30.jpg)
Ein offener Web-Index schafft die Voraussetzungen für die Informationsautonomie der europäischen Wirtschaft und Gesellschaft • „Ein für alle zu fairen Konditionen zugänglicher Index des Web“
– „Für alle“ meint, dass jeder Interessierte auf diesen Index zugreifen kann.
– „Faire Bedingungen“ bedeutet nicht unbedingt kostenlos, sondern kann auch ein faires Bezahlmodell vorsehen.
– Unter „zugänglich“ ist zu verstehen, dass der Index leicht automatisch abgefragt werden kann. Weiterhin sollte tatsächlich alles im Index enthaltene auch abfragbar sein.
– Und „Index des Web“ meint schließlich möglichst alle Inhalte des Web (und ggf. darüber hinaus).
![Page 31: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/31.jpg)
Finanzierung
• Finanzierung – Aufgrund der immensen Kosten kann ein solcher Index nur auf europäischer
Ebene geschaffen werden.
• Wer kann einen solchen Index betreiben? – Bestehende Forschungseinrichtung oder eine neu zu gründende Einrichtung – Der Betreiber des Index darf nicht allein über die Art der Erschließung der
Dokumente und ihre Verfügbarmachung bestimmen. à Kuratorium aus (potentiellen) Anwendern
![Page 32: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/32.jpg)
Die Initiative „Open Web Index“ (OWI)
![Page 33: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/33.jpg)
Beteiligte
• Sprecher – Dr. Wolfgang Sander-Beuermann, Suma e.V.
– Prof. Dr. Dirk Lewandowski, Hochschule für Angewandte Wissenschaften Hamburg
• Beteiligte – Wissenschaft
– Industrie (Deutsche Telekom, 1&1)
– Informationsinfrastruktureinrichtungen
– Public Relations
![Page 34: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/34.jpg)
Arbeiten
• Konzeptpapier „An Open Web Index for Europe“ • Vernetzung von Interessierten aus unterschiedlichen Bereichen • Workshops und Veranstaltungen • Lobbyarbeit • Website: www.openwebindex.eu
![Page 35: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/35.jpg)
Fazit
![Page 36: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/36.jpg)
#1
Das „Google-Problem“ wurde (endlich) erkannt. Wir sprechen nun über mögliche Lösungen.
![Page 37: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/37.jpg)
#2
Eine konstruktive Lösung ist einer destruktiven vorzuziehen.
![Page 38: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/38.jpg)
#3
Frei zugängliches Wissen ist die Quelle von kontinuierlichem Wettbewerb, Innovation und Unternehmertum auf der einen und persönlicher und Meinungsfreiheit auf der anderen Seite. Der Open Web Index schafft dafür die Voraussetzung.
![Page 39: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/39.jpg)
#4
Diese Aufgabe ist mit Infrastrukturaufgaben des Staates zu vergleichen – in Bezug auf die Sammlung und Verfügbarmachung von Wissen ist vor allem der Vergleich mit den Bibliotheken zu ziehen.
![Page 40: Perspektiven eines Open Web Index](https://reader031.vdocuments.site/reader031/viewer/2022030318/5a6dd2e37f8b9a505f8b4911/html5/thumbnails/40.jpg)
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information [email protected] Website: www.searchstudies.org