kl10tch.school : Введение в linked data и semantic web

Post on 16-Jul-2015

181 Views

Category:

Technology

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Введение в Linked Data и Semantic Web

24.02.2015 #semwebpeter

Козлов Федор и Колчин Максим

Интернет

Интернет ≠ Веб

Тим Бернерс-Ли

CERN, 1994

TED, 2009

Веб

Веб = Интернет + ссылки + документы

Веб стандартыи технологии

URI

HTTP

Мы склонны зацикливаться на документах...

Все хорошее, что открывает для нас Веб, начинается с ссылок

● вики● постоянные ссылки● твиттер● обмен информацией● социальные сети в целом

Если ты можешь на что-то указать, то ты можешь говорить и

обмениваться этим

Есть одна проблема

● люди не особо заинтересованы в документах

● на самом деле они заинтересованы в тех вещах, которые записаны в документах

Нам надо перейти от этого...

...к этому

Но есть другая проблема...

...люди могут читать документы и тем самым извлекать их значения

...но машины не могут

Нам нужно помочь машинам понимать Веб...

...для того чтобы машины помогали нам извлекать значения документов

Semantic Web

Semantic Web - ...

● попытка создавать документы, которые машины способны понимать

● с использованием RDF и OWL

RDF - это ...

● модель данных● не формат данных (аля XML или JSON)● может быть записан в XML● или в HTML (как RDFa)● или N3● или Turtle● или даже JSON (см. JSON-LD)

RDF

● Тройка «субъект-свойство-объект»● Направленный граф● Формальные описания

Пример:<Федор Козлов> <это> <человек>

OWL

● Описание онтологий● Классы, объектные свойства и данные● Отношения между сущностями

Онтологии уже готовы!

● Метаданные (Dublin Core)● Персоналии (Friend of a Friend)● Классификация (SKOS)● Образование (AIISO)● Наука (LSC)● Библиография (BIBO)● Медиа-ресурсы (MA-ONT)

26

Разные люди знают разную информацию об объекте

isst:FedorKozlov rdf:type foaf:Persongoogle:FedorKozlov foaf:familyName “Kozlov”

vk:KozlovFedor123 foaf:age “24”facebook:KozlovF foaf:knows facebook:MaxKolchin

27

owl:sameAs

isst:FedorKozlov owl:sameAs google:FedorKozlovisst:FedorKozlov owl:sameAs vk:KozlovFedor123isst:FedorKozlov owl:sameAs facebook:KozlovF

Linked Data

Четыре принципа Linked Data

● URI для именования вещей● HTTP URI● RDF и SPARQL для описания вещей● Ссылки на URI сторонних источников в

описании вещей

Основные репозитории

Wiki: DBpedia, Freebase, WikidataMusic: BBC Music, Last FM, Music BrainzGeoData: Linked GeoData, Geo NamesScience: DBLP, BNBNews: New York Times,Отрытые гос-данныеМедицинские данныеОбразование, университеты и предметные области

Стек технологий

Новый язык запросов - SPARQL

● Запросы к данным в RDF● Выборка из графа● Федеративные запросы● Естественный язык в запросах (NL-

SPARQL)● Получение данных через открытые

SPARQL-endpoint

Reasoning

1. Воробьи - это птицы2. У всех птиц есть крылья

Вопрос:У воробьев есть крылья?

Reasoning

1. world:Sparrow rdfs:subClassOf world:Bird2. world:Bird world:has world:Wings

Результат reasoning:world:Bird world:has world:Wings

Средства разработки

Кто, Кому и Зачем?

Компании: разработчики

Компании: клиенты

Публикация и интеграция данных

NASA : POPS

*http://www.w3.org/blog/2011/05/semantic-web-its-not-rocket-sc/

● информация начиная с 1921 года● о 140 000 сотрудниках● 4 источника

В последствии была развернута в US Army и связана с NASA.

● 800+ динамических страниц генерируемых из SPARQL запросов

● среднее кол-во запросов/день: 2 миллиона

● среднее кол-во SPARQL запросов/день: 1 миллион

Результаты:● переиспользование информации● улучшение поискового трафика● контексто-зависимая реклама● автоматизация создания контента

Увеличение поискового трафика на ~30%

*http://readwrite.com/2010/06/30/how_best_buy_is_using_the_semantic_web

Семантический поиск

Открытые (государственные) данные

data.gov.spb.ru

data.mos.ru

5 звезд

*http://5stardata.info/

...в Linked Open Data Cloud

18.05%

* Август 2014

...и другие

● культурное наследие (музеи, библиотеки)○ www.researchspace.org

● интернет вещей○ www.internetofthings.fi

● медицина и разработка лекарственных средств○ www.openphacts.org

Полезные ссылки

1. EUCLID (Educational Curriculum for the usage of Linked Data), http://www.euclid-project.eu/2. Semantic University, http://www.cambridgesemantics.com/semantic-university/getting-

started-semantics3. “The next web” by Tim Berners-Lee at TED2009, www.ted.

com/talks/tim_berners_lee_on_the_next_web4. What is Linked Data? http://youtu.be/4x_xzT5eF5Q5. Introduction to Linked Data: Background Technologies and Standards, Motivating Application

Scenario, http://videolectures.net/eswc2013_hogan_mcginnis_linked_data6. A Semantic Web Primer, http://www.ics.forth.gr/isl/swprimer/7. Linked Data: Structured data on the Web, http://manning.com/dwood/,8. Semantic Web - Books, http://www.w3.org/2001/sw/wiki/Books9. Schema.org

bit.ly/semwebpeter

top related