archivierung, analyse, interaktion und remix von wissenschaftlichen online-vorträgen
DESCRIPTION
Tagung Wissenschaft auf neuer Buehne am 13. Oktober 2010 auf Schloss RauischholzhausenTRANSCRIPT
Dr. Harald SackHasso-Plattner-Institut für SoftwaresystemtechnikUniversität PotsdamWissenschaft auf neuer Bühne2. Meilenstein-Tagung des Forschungsverbundes „Interactive Science – Interne Wissenschaftskommunikation über digitale Medien“Schloss Rauischholzhausen, 13. Oktober 2010
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
■ Senior Researcher am HPI, Forschungsgruppe „Semantische Technologien“
■ Forschungsschwerpunkte:
□ Semantic Web Technologien
□ Multimedia Retrieval
■ Projekte:
2
Dr. Harald Sack - Vorstellung
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
■ Das HPI wurde im Oktober 1998 im Rahmen einer Public Private Partnership gegründet
■ Forschung und Lehre sind dem IT-Systems Engineering gewidmet
■ 12 Professoren und ca. 100 Mitarbeiter in Forschung und Lehre
■ ca. 450 Studenten
□ 290 BA / 150 MA
■ HPI School of Design Thinking, Potsdam und Stanford
■ HPI Research School at Capetown University, Südafrika
■ HPI Research School at Technion, Haifa, Israel
3
Hasso Plattner Institut - HPI
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
4
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
5
Wissenschaftliches PräsentierenEin persönlicher Rückblick
Präsentationen 1997-2010...(Power Point, LaTeX, Keynote)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
6
Wissenschaftliches PräsentierenEin persönlicher Rückblick
1997
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
7
Wissenschaftliches PräsentierenEin persönlicher Rückblick
1997
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
8
Wissenschaftliches PräsentierenEin persönlicher Rückblick
1998
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
9
Wissenschaftliches PräsentierenEin persönlicher Rückblick
1999
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
10
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2000
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
11
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2000
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
12
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2001
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
13
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2001
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
14
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2001
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
15
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2001
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
16
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2003
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
17
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2004
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
18
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2004
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
19
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2004
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
20
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2004
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
21
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2005
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
22
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2005
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
23
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
24
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
25
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
26
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
27
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
28
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2006
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
29
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2007
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
30
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2007
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
31
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2007
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
32
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2007
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
33
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2008
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
34
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2008
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
35
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2008
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
36
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2009
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
37
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2009
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
38
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2010
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
39
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2010
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
40
Wissenschaftliches PräsentierenEin persönlicher Rückblick
2010
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
41
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
42
Wissenschaftliches Präsentieren im InternetPrä-Internet
• Universitäre Lehre (wissenschaftliche Präsentation) im Wandel...
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
43
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
• An den Universitäten wird die Präsenzlehre seit mehr als einer Dekade durch Vorlesungsaufzeichnungen ergänzt, die über das WWW zur Verfügung gestellt werden
• zur Archivierung
• zur Nachbereitung des Lehrstoffes
• zum Fernstudium
• ...
• Bereitstellung der Aufzeichnung über das Internet
• als PodCast (Audio)
• als Enhanced Podcast (Präsentation+Audio)
• als VideoCast
• via Media-Streaming
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
44
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
• Synchonisation mehrere Medien-Datenströme Präsentation
VideobildDozent
Zusatz-InformationLinks, etc.
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
45
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
• Synchonisation mehrere Medien-Datenströme Präsentation
VideobildDozent
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
46
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
tele-TASK -- Teleteaching Anywhere Solution Kit
• seit 2002 zuerst an der Universität Trier, dann am HPI im Einsatz
• mobile (low-cost) Aufzeichnung, Encoding, Streaming out-of-the-box
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
46
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
tele-TASK -- Teleteaching Anywhere Solution Kit
• seit 2002 zuerst an der Universität Trier, dann am HPI im Einsatz
• mobile (low-cost) Aufzeichnung, Encoding, Streaming out-of-the-box
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
47
Wissenschaftliches Präsentieren im InternetTechnische Grundlagen
tele-TASK -- Teleteaching Anywhere Solution Kit
• Keine spezielle Software auf dem Präsentationsrechner nötig
• Aufzeichnung des kompletten Bildschirms und aller Nutzeraktionen
• tele-TASK nimmt auf, encodiert und streamt in das Internet oder über das Intranet in einen anderen Hörsaal
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
48
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Bereitstellung der wissenschaftlichen Präsentation im Internet
• klassisch: direkte Verlinkung über Homepage/Website
• Social Web:
• Blogs ermöglichen asynchrone Interaktion/Feedback
• Twitter (Instant Messaging) ermöglicht synchrone Interaktion/Feedback
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
49
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Bereitstellung der wissenschaftlichen Präsentation im Internet
• Blogs ermöglichen asynchrone Interaktion/Feedback
•
http://sewe0910.blogspot.com/
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
50
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Bereitstellung der wissenschaftlichen Präsentation im Internet
• Twitter (Instant Messaging) ermöglicht synchrone Interaktion/Feedback
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
51
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Bereitstellung der wissenschaftlichen Präsentation im Internet
Bereitstellung der wissenschaftlichen Präsentation im Internet
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
52
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Bereitstellung der wissenschaftlichen Präsentation im Internet
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
53
Wissenschaftliches Präsentieren im InternetBereitstellung, Interaktion und Remix
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
54
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
55
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Bereitstellung der wissenschaftlichen Präsentation im Internet
• Spezialisierte Video-Portale, z.B. tele-TASK
• Klassischer Weg über das Internet Portal www.tele-task.de
• Zugriff auf archivierte Videos
• Livestream ausgewählter Veranstaltungen
• Video-Podcasts für portable Abspielgeräte
• Export als RSS-Feed z.B. nach iTunesU
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
56 Bereitstellung der wissenschaftlichen Präsentation im Internet
• Beispiel tele-TASK (Statistik)
• 3000 Vorlesungen
• 400 Serien
• 6700 Videopodcasts
• 800 Dozenten
• Ø 50.000 Klicks pro Tag
• Zugriffe über iTunes U
• Ø 25.000 Downloads pro Woche
• Peak: 80.000 Downloads pro Woche
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
57 Bereitstellung der wissenschaftlichen Präsentation im Internet
• Allgemeine Video-Portale und Videosuchmaschinen
• youTube
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
58 Bereitstellung der wissenschaftlichen Präsentation im Internet
• Allgemeine Video-Portale und Videosuchmaschinen
• youTube
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
59 Bereitstellung der wissenschaftlichen Präsentation im Internet
yovisto.com• Videosuchmaschine mit dem
Schwerpunkt akademischer Lehrveranstaltungen
• aktuell mehr als 10.000 Vorlesungen und wissenschaftliche Vorträge aus der ganzen Welt
• automatische Segmentierung und Videoanalyse
• benutzergenerierte Co-Annotation
• Social Tagging• Diskussionen• Rezensionen• Wikis• Lernmaterialien
• Zielgenauer Zugriff auf gesuchte Videoinhalte
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
www.yovisto.com
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
60
Archivierung und SucheWissenschaftlicher Präsentation im Internet
Bereitstellung der wissenschaftlichen Präsentation im Internet
• Akademische Videosuchmaschine yovisto
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
61 Bereitstellung der wissenschaftlichen Präsentation im Internet
• Akademische Videosuchmaschine yovisto
zeitbezogeneUser Tags undKommentare
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
62
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
63
Archivierung und Suche wissenschaftlicher Präsentation im Internet Video-Portale
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
64
Vom Suchen zum FindenDer Weg ist das Ziel
Das WWW ist ,ziemlich groß‘•ca. 25 x 109 in Suchmaschinen
indizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005)
•Web Crawler: > 1012 Dokumente(The Official Google Blog: We knew the Web was Big....., Juli 25, 2008)
•Google Search Index Caffeine umfasst ca.100 Million Gigabytes i.e. 1017 Byte (SMX Video: Google’s Matt Cutts On Caffeine Launch, June 9, 2010,
http://searchengineland.com/smx-video-googles-matt-cutts-on-caffeine-launch-43933)
•DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
65 Wie findet man etwas in einem audiovisuellen Archiv?
• Damit audiovisuelle Daten einer computergestützten gezielten Suche zugänglich werden, müssen Beschreibungen, Schlüsselwörter, etc. üblicherweise Textform vorliegen.
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
65 Wie findet man etwas in einem audiovisuellen Archiv?
• Damit audiovisuelle Daten einer computergestützten gezielten Suche zugänglich werden, müssen Beschreibungen, Schlüsselwörter, etc. üblicherweise Textform vorliegen.
Manuelle Analyse und Annotation
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
Marlene Dietrich
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
Marlene Dietrich ????
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
Marlene Dietrich ????????
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
66 Retrieval in Audiovisuellen (zeitabhängigen) Daten
•
automatische inhaltliche Analyse ist • fehlerbehaftet und•berechnungs-/speicheraufwändig
Marlene Dietrich ????????
„...ich bin von Kopf bis Fuß...“
{
© Friedrich Wilhelm Murnau Stiftung, DFI
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
Inhaltsbezogene Videoanalyse■ Ergebnis: Videosegmente mit zugeordneten, zeitbezogenen Metadaten
■ Metadaten setzen sich zusammen aus kombinierten Low Level/ High Level Deskriptoren
■ Metadaten als Basis für traditionelles Information Retrieval
67
Metadata Extractiontime
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
68 Automatische Metadatenextraktion
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
68
ICR / OCR
Automatische Metadatenextraktion
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
68
ICR / OCR
ASR
Automatische Metadatenextraktion
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
68
ICR / OCR
ASR
Dic
tiona
ry
Keyterm Spotting
Automatische Metadatenextraktion
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
69
Vom Suchen zum FindenDer Weg ist das Ziel
The World According to Google....
• Gezielte Suche
• Suche nach einem/mehreren speziellen Dokument(en)
• Benutzer weiß, was er/sie sucht
The World According to Google....
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
70
Vom Suchen zum FindenDer Weg ist das Ziel
The World According to Google....
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
71
Vom Suchen zum FindenDer Weg ist das Ziel
The World According to Google....
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
71
Vom Suchen zum FindenDer Weg ist das Ziel
The World According to Google....
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
71
Was aber, wenn ich nach einem Dokument suche, das in der Ergebnisliste auf Position 1.123.456 ist ...?
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
The World According to Google....72
• Was aber, wenn der Benutzer nicht genau weiß, welches Dokument bzw. was er/sie überhaupt finden möchte
• „was gibt es denn alles zu einem Thema?“
• „welchen Suchbegriff soll ich wählen, um ans Ziel zu kommen?“
• „wo fängt das Thema an, wo hört es auf?“
• „ich möchte einen Gesamtüberblick...“
• ...
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
Explorative Suche• Was, wenn der Benutzer nicht weiß, welchen Suchbegriff er/sie benutzen soll?
• Was, wenn der Benutzer komplexere Antworten sucht?
• Was, wenn er/sie das Wissensgebiet, über das er sich informieren will, nicht (gut) kennt?
• Was, wenn er/sie wissen möchte, welche Dokumente es insgesamt zu einem speziellen Thema in einem Repository gibt?
• Das Problem ist nicht neu....
• ...,Stöbern‘ statt ,Suchen‘
• ...etwas ,zufällig‘ finden (Serendipity)
• ...einen Überblick gewinnen
73
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
74
Vom Suchen zum FindenDer Weg ist das Ziel
Wie kommt man vom Suchen zum Finden...?
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
75 Wie kommt man vom Suchen zum Finden...?
Voraussetzung:
• Inhalte können von Maschinenkorrekt gelesen und interpretiert(=verstanden) werden
Semantic Web• Web-Inhalte in natürlicher Sprache
werden explizit annotiert mit semantischen Metadaten
• Semantische Metadaten kodieren die Bedeutung (Semantik) des Web-Inhalts und können von Maschinen korrekt gelesen und interpretiert werden
Natural Language Processing• Technologie des klassischen Information
Retrievals (WWW Suchmaschinen)
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
76 Inhalte im Web maschinell „verstehen“ (I)
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
76 Inhalte im Web maschinell „verstehen“ (I)
Text: „Jetzt spricht Poldi“
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
76 Inhalte im Web maschinell „verstehen“ (I)
Text: „Jetzt spricht Poldi“
Lukas Podolski ?
Entitäty MappingDisambiguierung
• DisambiguierungAuflösung sprachlicher Mehrdeutigkeiten
Leopold Holusek ?
Leopold Kielholz ?
Deutscher Fußballspieler
Deutscher Tischtennisspieler
Schweizer Fußballspieler
Poldi Kladno ? Tschechischer Fußballverein
Poldi ? Drache bei „Hallo Spencer“
Lukasz Podolski ? Polnischer Radrennfahrer
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (II)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
77
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
• Die Bedeutung (Semantik) der Entitätenund Klassen muss ebenfalls explizit definiert werden.
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (II)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
77
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
Fußballspieler
ist ein
Klasse• Die Bedeutung (Semantik) der Entitäten
und Klassen muss ebenfalls explizit definiert werden.
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (II)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
77
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
Fußballspieler
ist ein
Klasse
Person
ist eine
Klasse
• Die Bedeutung (Semantik) der Entitätenund Klassen muss ebenfalls explizit definiert werden.
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (III)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
78
Lukas Podolski (entity)
Fußballspieler
ist ein
(class)
Class-membership hat Typ
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (III)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
78
Lukas Podolski (entity)
Fußballspieler
ist ein
(class)
Class-membership hat Typ
Person
ist ein
(class)
superclass
subclass
Ist Subklasse von
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (IV)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
79
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person
ist einEntities
Classes
ist ein
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (IV)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
79
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlace
ist einEntities
Classes
ist ein
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (IV)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
79
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlace
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (IV)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
79
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlaceDate hasBirthDate
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (IV)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
79
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlaceDate hasBirthDate
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
hasBirthDate1985-06-04
ist ein
Vom Suchen zum FindenDer Weg ist das Ziel
Inhalte im Web maschinell „verstehen“ (V)
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
80
Lukas Podolski
LivingPeople
PersonDate
hasBirthDate1985-06-04
hasBirthDate
is a
is a
is a
DeadPeople∩ =∅
logical constraint
is a
∀x.∃y.hasDeathDate(x,y) ∧ Person(x) ∧ Date(y) → DeadPeople(x)
entities
classes
Vom Suchen zum FindenDer Weg ist das Ziel
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
81Was ist das Semantic Web?
„The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation"
Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, 284(5), pp. 34-43(2001)
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
82 ■ Improving Retrieval with Semantic Annotation
time
e.g., person xy
location yz
event abc
e.g., bibliographical data,geographical data,encyclopedic data, ..
Metadata Extraction
Entity Recognition/ Mapping
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
83 ■How to Explore the Web of Data?
dbpedia:Ernest_Hemingway
Wie soll das semantischeNetzwerk um dbpedia:Ernest_Hemingwayherum durchsucht werden?
http://dbpedia.org/page/Ernest_Hemingway
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
Explorative Suche - ein einfaches Beispiel• Suche im Grunddatenbestand nach ,Ernest Hemingway‘
• Identifikation einer Entität dbpedia:Ernest_Hemingway
• Bestimmung eines geeigneten „Properties“
• Nutzung des Properties zur Navigation/Visualisierung
• Erweitere Suche mit asoziierten Entitäten
• „Suche Texte von Autoren, die ähnlich schreiben wie Ernest Hemingway.....“
84
dbpedia:ontology/influences dbpedia:ontology/influences
Ezra Pound Ernest Hemingway Jack Kerouac
Vom Suchen zum FindenDer Weg ist das Ziel
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
29
Waitelonis, Sack: Augmenting Video Search with Linked Open Data, in Proc. I-Semantics , Graz 2009.
mediaglobe.yovisto.com:8080/
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
86
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
87
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Wissenschaftliches Präsentieren im Internet-Zeitalter• Von der Rede zur animierten Präsentation
• ...wird dadurch das Verstehen einfacher?
• ...um zu Verstehen muss man Arbeit investieren
• Aufzeichnung der wissenschaftlichen Präsentation
• ...löst den Akt des Erkenntnisgewinns von Zeit und Raum
• ...beeinflusst die Form der Präsentation durch infrastrukturelle Restriktionen
• Die vernetzte Präsentation im WWW
• ...erschließt ein neues Publikum
• ...ermöglicht neue Wege der Interaktion und Nutzung (Wiederverwendung)
• ...ermöglicht direktes und indirektes Feedback
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
88
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Wissenschaftliches Präsentieren im Internet-Zeitalter
• Wie sucht man wissenschaftliche Präsentationen im WWW?
• Verlinkung über Homepages
• Verlinkung über Social Networking Werkzeuge
• Sammlung in (spezialisierten) Portalen
• allgemeine Suchmaschinen
• spezialisierte Suchmaschinen
• Beeinflusst die Möglichkeit der Suche (und des Findens) im WWW den Inhalt und die Form der Präsentation?
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
89
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Wissenschaftliches Präsentieren im Internet-Zeitalter
• Wie findet man wissenschaftliche Präsentationen im WWW?
• Automatische Analyseverfahren zur Extraktion inhaltlicher beschreibender Metadaten
• Aggregation der Metadaten zu semantischen Metadaten, deren inhaltliche Bedeutung maschinell erschlossen werden kann
• Explorative Suche kann zum Erkenntnisgewinn beitragen undzu unerwarteten Ergebnissen führen
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen, 13.10.2010, Dr. Harald Sack, HPI Potsdam
90
•Wissenschaftliches Präsentieren - ein persönlicher Rückblick
•Wissenschaftliches Präsentieren im Internet
• Archivierung und Suche wissenschaftlicher Präsentationen im Internet
• Vom Suchen zum Finden - Der Weg ist das Ziel
• Fazit
Archivierung, Analyse, Interaktion und Remix von wissenschaftlichen Online-Vorträgen
Kontakt:Dr. Harald SackHasso-Plattner-Institut IT Systems Engineering Universität PotsdamCampus Griebnitzsee14482 PotsdamTel: 0331 5509-527
http://www.hpi-web.de
Web: http://www.hpi.uni-potsdam.de/meinel/team/sack.htmlBlog: http://moresemantic.blogspot.com/Twitter-User: lysander07 / biblionomicon