trainingsmodul 2.4 rdf-vokabulare entwerfen und entwickeln die mitglieder des pwc netzwerks...
TRANSCRIPT
DATASUPPORT
OPEN
Trainingsmodul 2.4
RDF-Vokabulare entwerfen und entwickeln
Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.comPwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
DATASUPPORTOPEN
Diese Präsentation wurde von PwC erstellt
Autoren: Nikolaos Loutas, Michiel De Keyzer, and Stijn Goedertier
Metadaten der Präsentation
Folie 2
Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert.
© 2014 European Commission
Disclaimer
1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden.Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission.Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.
2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.
DATASUPPORTOPEN
Lernziele
Am Ende dieses Trainingsmoduls sollten Sie wissen:
• was die Best-Practices bei der Erstellung eines RDF Vokabulars sind, mit dem Sie Ihre Daten modellieren können.
•wo Sie RDF Vokabulare zur Wiederverwendung finden können.
•wie Sie Ihr eigenes RDF-Vokabular erstellen können.
•wie Sie Ihre RDF-Vokabulare veröffentlichen können.
• wie der Prozess und die Methodik zur Entwicklung semantischer Vereinbarungen funktionieren, die vom ISA-Programm der Europäischen Kommission entwickelt wurden.
Folie 3
DATASUPPORTOPEN
Inhalt
In diesem Modul geht es...
•um die einzelnen Schritte bei der Modellierung Ihrer Daten.
•darum, wie Sie vorhandene Vokabulare wiederverwenden können, um Ihre Daten zu modellieren.
• darum, wie Sie neue Klassen und Eigenschaften in RDF erstellen können.
• darum, wie und wo Sie Ihr RDF-Vokabular veröffentlichen können, damit es von Anderen wiederverwendet werden kann.
Folie 4
DATASUPPORTOPEN
RDF-Vokabular
Folie 5
„Ein Vokabular ist ein Datenmodell, das Klassen, Eigenschaften und Beziehungen beinhaltet, die dazu genutzt werden können Ihre Daten und Metadaten zu beschreiben.”
RDF Vokabulare sind Sammlungen von Begriffen, die dazu genutzt werden können Dinge zu beschreiben.
Ein Begriff ist entweder eine Klasse oder eine Eigenschaft.
Objekttyp Eigenschaften (Beziehungen)
Datentyp Eigenschaften (Attribute)
DATASUPPORTOPEN
Was sind Klassen, Beziehungen und Eigenschaften?
Klasse. Ein Konstrukt, das Dinge in der realen und/oder virtuellen Welt darstellt, z.B. eine Person, eine Organisation oder ein Konzept wie “Gesundheit” oder “Freiheit”.
Beziehung. Eine Verbindung zwischen zwei Klassen: zwischen einem Dokument und der Organisation, die es veröffentlicht hat (d.h. Organisation veröffentlicht Dokument); oder zwischen einer Karte und der geografischen Region, die sie zeigt (d.h. Karte zeigt geografische Region). In RDF werden Beziehungen als Objekttyp Eigenschaften kodiert.
Eigenschaft. Eine Eigenschaft einer Klasse in einer bestimmten Dimension, wie z.B. der offizielle Name einer Organisation oder das Datum und die Zeit, wann ein Beobachtung gemacht wurde.
Folie 6
DATASUPPORTOPEN Folie 7
Beispiele für Klassen, Beziehungen und Eigenschaften
http://.../org/2172798119
Orthttp://example.com/
site/1234
RegisteredOrganisation
Address
Dahliastraat 24, 2160 Wommelgem“Nike”
a a
fullAddress
legalName
Kla
sse
Eig
en
sch
aft
Beziehung
DATASUPPORTOPEN
Modellieren Sie Ihre DatenWie Sie andere Vokabulare wiederverwenden, Ihre eigenen Begriffe definieren und Ihre Vokabulare veröffentlichen und bewerben können, um damit Daten zu beschreiben.
Folie 8
DATASUPPORTOPEN
6 Schritte bei der Modellierung Ihrer Daten
Beginnen Sie mit einem festen Domainmodell, das nach einem strukturierten Prozess und Methodik entwickelt wurde.
Recherchieren Sie vorhandene Begriffe sowie deren Nutzung und maximieren Sie die Wiederverwendung dieser Begriffe.
Dort, wo neue Begriffe als Spezialisierungen von vorhandenen Begriffen betrachten werden können, erstellen Sie Unterklassen und Untereigenschaften.
Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein.
Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren.
Folie 9
1
Siehe auch:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
2
3
45
6
DATASUPPORTOPEN
Beginnen Sie mit einem robusten Domainmodell
Folie 10
1
class Domain Model
RegisteredOrganisation
- identifier- name- registrationDate- status- type
Address
- identifier- fullAddress- postcode
ContactPoint
- identifier- name- telephone- email- fax- website
Activ ity
- identifier- name
Certificate
- identifier- name
location
organisationCertificate
contactInformation
organisationActivity
DATASUPPORTOPEN
Verwenden Sie vorhandene Begriffe und Vokabulare wieder
•Universalvokabulare: DCMI, RDFS
•Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel
•Um Leute zu beschreiben: FOAF, vCard, Core Person Vocabulary
•Um Projekte zu beschreiben: DOAP, ADMS.SW
•Um eine semantische Interoperabilität zu beschreiben: ADMS
• Um registrierte Organisationen zu beschreiben: Registered Organisation Vocabulary
•Um Adressen zu beschreiben: vCard, Core Location Vocabulary
•Um öffentliche Dienstleistungen zu beschreiben: Core Public Service Vocabulary
•Um Datensätze zu beschreiben: DCAT, DCAT Anwendungsprofil, VoID
Folie 11
2
DATASUPPORTOPEN
Anwendungsprofile erstellen
• Unterschiedliche Domains haben unterschiedliche Anforderungen an die domainspezifische Semantik, z.B. Klassifikationskonzepte.
• Generische RDF-Vokabulare liefern normalerweise die Basisklassen, die benötigt werden, um Erweiterungen zu erlauben, mit denen, sofern erforderlich, spezifische Unterklassenstrukturen oder Klassifikations-schemen hinzugefügt werden können.
• In solchen Fällen werden Wiederverwender dazu ermutigt, Anwendungsprofile einer speziellen Anwendungsdomain zu definieren, indem sie (sofern erforderlich) Unterklassen, Untereigenschaften und kontrollierte Vokabulare spezifizieren.
• Zum Beispiel:
DCAT Anwendungsprofil für Datenportale in Europa
Registered Organization Vokabular als Anwendungsprofil der Organisations-Ontologie.
Folie 12
Siehe auch:joinup.ec.europa.eu/asset/dcat_application_profile/home
DATASUPPORTOPEN
Vorteile der Weiterverwendung
• Weiterverwendung fördert die Interoperabilität Ihrer Daten in hohem Maße.Beispielsweise bewirkt die Verwendung von <dcterms:created>, dessen Wert ein Datumsformat vom Typ 2013-02-21^^xsd:date sein sollte, dass die Daten sofort von vielen Maschinen verarbeitbar sind. Wenn Ihr Schema Datenherausgeber dazu zwingt ein abweichendes Format für Bezeichnungen und das Datum, wie ex:date "21 February 2013“ zu benutzen, dann ist für veröffentlichte Daten, bei denen Ihr Schema genutzt wird, eine weitere Verarbeitung erforderlich um sie anderen Daten anzugleichen.
• Weiterverwendung erhöht die Glaubwürdigkeit Ihres Schemas.Es zeigt, dass es mit genügend Sorgfalt und Professionalität veröffentlicht worden ist, was die Weiterverwendung weiter fördert.
• Weiterverwendung ist einfacher und billiger.Durch die Weiterverwendung von Klassen und Eigenschaften gut definierter und richtig gehosteter Vokabeln vermeiden Sie, dass Sie die Bemühung ihrer Erstellung wiederholen müssen.
Folie 13
DATASUPPORTOPEN
Hier können Sie vorhandene Vokabulare finden…
Folie 14
http://joinup.ec.europa.eu/
http://lov.okfn.org/
DATASUPPORTOPEN
Erstellen Sie Unterklassen und Untereigenschaften
• RDF-Schemata und Vokabulare enthalten oft Begriffe, die sehr generisch sind.
• Durch die Erstellung von Unterklassen- und Untereigenschafts-beziehungen können Systeme, die die übergeordnete Eigenschaft oder Klasse verstehen, in der Lage sein, die Daten zu interpretieren; selbst wenn die spezifischeren Begriffe unbekannt sind.
• Vermeiden Sie es, Unterklassen und Untereigenschaften aus dem einzigen Grund zu erstellen, damit Sie Ihren eigenen Begriff verwenden können, um etwas zu beschreiben, was bereits existiert.
Folie 15
3
DATASUPPORTOPEN
Erstellung von Untereigenschaften - Beispiel
Das Registered Organization Vokabular definiert drei Untereigenschaften von „org:classification“: ‚companyType‘, ‚companyStatus‘ und ‚companyActivity‘.
Folie 16
DATASUPPORTOPEN
Eine Untereigenschaft in RDF definieren
<rdf:Property rdf:about="rov:companyType">
<rdfs:label xml:lang="en">company type</rdfs:label>
<rdfs:comment xml:lang="en" rdf:parseType="Literal">
This property records the type of company. Familiar types are SA, PLC, LLC, GmbH etc. Each jurisdiction will have a limited set of recognised company types and these should be used in a consistent manner using a skos:Concept as described in the <a href="#skos:Concept">Code</a> Class.
</rdfs:comment>
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/> <rdfs:range rdf:resource="skos:Concept"/>
<rdfs:subPropertyOf rdf:resource="org:classification" /> <dcterms:identifier>legal:companyType</dcterms:identifier>
</rdf:Property>
Folie 17
DATASUPPORTOPEN
Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.
Klassen beginnen mit einem Großbuchstaben und sind immer Singular, z.B. skos:Concept.
Eigenschaften beginnen mit einem Kleinbuchstaben, z.B. rdfs:label.
Objekteigenschaften sollten Verben sein, z.B. org:hasSite.
Datentypeigenschaften sollten Substantive sein, z.B. dcterms:description.
Verwenden Sie Großbuchstaben, wenn ein Begriff aus mehr als einem Wort besteht, z.B. foaf:isPrimaryTopicOf.
Folie 18
4
DATASUPPORTOPEN
Definieren einer neuen Klasse - Organisation
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Class rdf:about=“org:Organisation">
<rdfs:label xml:lang="en">Organisation</rdfs:label>
<rdfs:comment xml:lang:”en”>
Legal entity that is registered in an official national or regional
register.
</rdfs:comment>
</rdf:Class>
Folie 19
DATASUPPORTOPEN
Definieren einer neuen Eigenschaft - registrationNumber
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Property rdf:about=“org:registrationNumber">
<rdfs:label xml:lang="en">registrationNumber</rdfs:label>
<rdfs:comment xml:lang:”en”>
The number that a registered organisation receives upon registration in the official register.
</rdfs:comment>
</rdf:Class>
Folie 20
DATASUPPORTOPEN
Definieren von Domain- und Bereichsbeschränkungen
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”
xmlns:locn=“http://www.w3.org/ns/locn#”>
<rdf:Property rdf:about=“org:isLocated">
<rdfs:label xml:lang="en">isLocated</rdfs:label>
<rdfs:comment xml:lang:”en”>
The official address of the registered organisation’s headquarters.
</rdfs:comment>
<rdfs:domain rdf:resource=“org:Organisation”/>
<rdfs:range rdf:resource=“locn:Address”>
</rdf:Class>
Folie 21
http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels
DATASUPPORTOPEN
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein
•Wählen Sie einen stabilen Namensraum für Ihr RDF-Schema (z.B. W3C, Purl...)
• Folgen Sie Good Practices bei der Veröffentlichung von persistenten Uniform Resource Identifier (URI) Sets, sowohl in Bezug auf das Format als auch auf Entwurfsregeln und Verwaltung.
• Beispiele: http://www.w3.org/ns/adms
http://purl.org/dc/elements/1.1
Folie 22
5
Siehe auch:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris
DATASUPPORTOPEN
Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren
Sobald Ihr RDF-Schema veröffentlicht wurde, werden Sie wollen, dass die Leute es kennenlernen. Um ein breiteres Publikum zu erreichen, registrieren Sie es auf Joinup und Linked Open Vocabularies.
Folie 23
6
Refine the search results via the faceted search filters.
2
1
3
http://joinup.ec.europa.eu
http://lov.okfn.org
DATASUPPORTOPEN
Schlussfolgerungen
Folie 24
Beginnen Sie mit einem robusten Domainmodell, das nach einem strukturierten Prozess und Methodik entwickelt wurde.
Recherchieren Sie vorhandene Begriffe sowie deren Nutzung und maximieren Sie die Wiederverwendung dieser Begriffe.
Dort, wo neue Begriffe als Spezialisierungen von vorhandenen Begriffen betrachten werden können, erstellen Sie Unterklassen und Untereigenschaften.
Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß allgemein anerkannter Best-Practices.
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen Umgebung, die erstellt wurde um persistent zu sein.
Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services registrieren.
Analysieren
Modellieren
Veröffentlichen
DATASUPPORTOPEN
Gruppenübung
Folie 25
Erstellen Sie in Zweiergruppen die RDF Beschreibung für ein Vokabular, das einen Bürger darstellt.
Was sind, Ihrer Meinung nach, die größten Hindernisse für die Weiterverwendung vorhandener RDF-Vokabulare?
http://www.visualpharm.com
http://www.visualpharm.com
Machen Sie auch den Online-Test!
DATASUPPORTOPEN
Vielen Dank!...und jetzt IHRE Fragen?
Folie 26
DATASUPPORTOPEN
Referenzen
Folie 9:
• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Folie 10-23:
• ISA Programme. Cookbook for translating Data Models to RDF Schemas. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 16, 18-21:
•W3C. An organization ontology. http://www.w3.org/TR/vocab-org/
Folie 23:
• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Folie 27
DATASUPPORTOPEN
Weiterführende Literatur
Linked Data Cookbook, W3C Government Linked Data Working Group,
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
EC, ISA Process and methodology for developing semantic agreements, https://joinup.ec.europa.eu/community/core_vocabularies/document/process-and-methodology-developing-semantic-agreements
EC ISA, Cookbook for translating Data Models to RDF Schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 28
DATASUPPORTOPEN
Verwandte Projekte und Initiativen
Joinup, http://joinup.ec.europa.eu
Linked Open Vocabularies (LOV), http://lov.okfn.org/
EC ISA, e-Government Core Vocabularies,https://joinup.ec.europa.eu/community/core_vocabularies/home
W3C Schools – Learn RDF http://www.w3schools.com/rdf/default.asp
EUCLID, http://euclid-project.eu/
XML Summer School http://xmlsummerschool.com/
Folie 29
DATASUPPORTOPEN
Werden Sie Teil unseres Teams...
Folie 30
Besuchen Sie uns
Kontaktieren Sie uns
Lernen Sie uns kennen
Folgen Sie uns
Open Data Supporthttp://www.slideshare.net/OpenDataSupport
http://www.opendatasupport.eu Open Data Supporthttp://goo.gl/y9ZZI
@OpenDataSupport [email protected]