Перспективы применения семантических технологий при...
DESCRIPTION
Перспективы применения семантических технологий при построении виртуальных научных сообществ. Денис Голомазов аспирант механико-математического факультета МГУ младший научный сотрудник НИИ механики МГУ [email protected]. План доклада. Что такое семантические технологии? - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/1.jpg)
4 февраля 2010 года
Денис Голомазоваспирант механико-математического факультета МГУ
младший научный сотрудник НИИ механики МГУ[email protected]
![Page 2: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/2.jpg)
Что такое семантические технологии?
Зачем они нужны?
Каково текущее состояние дел?
Каковы перспективы?
![Page 3: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/3.jpg)
Модель данных RDF Онтологии Логический вывод
![Page 4: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/4.jpg)
Рассмотрим утверждения вида «субъект – предикат – объект» (тройки) Земля является планетой Земля находится в солнечной системе
«Земля», «является», «планета», «находится», «солнечная система» - ресурсы, определяемые уникальными адресами
Так можно описывать действительность – мы задали модель данных
![Page 5: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/5.jpg)
Онтология – совокупность утверждений-троек Онтология состоит из терминологической и
фактологической частей Терминологическая часть (словарь):
«Планета – это небесное тело» «Звезда – это не планета» «Планета имеет орбиту» «Планета имеет массу (действительное число > 0)» «Планета может иметь спутники»
Фактологическая часть: «Земля – это планета» «Земля имеет массу 6x10^24 кг» «Луна – спутник Земли»
![Page 6: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/6.jpg)
Мы хотим автоматически выводить новые факты из существующих Например: «Земля является планетой», «Планета является
небесным телом» -> «Земля является небесным телом»
Для этого вводим специальные ресурсы, имеющие значение (правило выведения новых троек) Например, ресурсы «класс», «являться членом класса»,
«быть подклассом». Значение ресурсов: если существуют тройки «C – это
подкласс D», «x – член класса C», то из этого выводится новый факт «x – член класса D».
![Page 7: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/7.jpg)
Единая модель данных (RDF) Общее видение предметной области Компьютеру доступен смысл информации
![Page 8: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/8.jpg)
Новый уровень поиска Более сложные запросы Решение вопросов синонимии и мультиязычности Конкретизация/обобщение запроса
Интеграция информации Поддержка принятия решений Выявление скрытого знания
![Page 9: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/9.jpg)
9
![Page 10: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/10.jpg)
Какова космическая стратегия Китая в следующие 20 лет?
Как связаны стратегии Китая и США? Как решалась задача открытия экзопланет в
прошлом? Какие есть алгоритмы сейчас? Какова лучшая методика в данной ситуации? Какие новые алгоритмы были описаны в
публикациях за последний год в этой области?
![Page 11: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/11.jpg)
Управление информацией как активом (жизненный цикл информации)
Анализ трендов и изменений в индустрии Накопление и использование опыта
Перевести скрытое знание из отчетов и голов экспертов в единую систему
Возможность просмотра информации с различным уровнем детализации
Общий доступ к информации Взаимодействие с приложениями
11
![Page 12: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/12.jpg)
Оптимизация принятия похожих решений чтобы не повторять ошибок
Оценка решений выбор решения с наибольшей выгодой с учетом рисков
Моделирование последствий решений разные модели и общее видение разных моделей
12
![Page 13: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/13.jpg)
Готовые тройки: Файлы .rdf (Google: 2.5 млн документов)
созданные вручную сгенерированные сервисами (livejournal, facebook etc)
Структурированные данные: Конверторы *->rdf (таблицы, реляционные БД) Микроформаты RDFa
Неструктурированные данные: Конверторы HTML->RDF (“scrapers”)
![Page 14: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/14.jpg)
Переведем в RDF существующие базы данных в открытом доступе
Проставим ссылки из баз друг на друга Получим большую коллекцию связанных RDF-
троек
![Page 15: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/15.jpg)
Главная проблема: у каждой базы своя онтология
![Page 16: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/16.jpg)
Google: 186 тыс. онтологий Онтологии общей направленности: SKOS,
Dublin Core, YAGO, DBpedia, Umbel Специализированные онтологии, всевозможные
тематики: люди, сообщества, наука, проекты, веб-ресурсы, теги,
бизнес, языки, география, биология, музыка, еда,…
![Page 17: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/17.jpg)
Медицина и науки о человеке Активно используют онтологии
Нефтегазовая индустрия Semantic Web for Oil&Gas Workshop
Финансовые услуги Промышленность Социальные сети Правительство Медийный бизнес
![Page 18: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/18.jpg)
Перевод информации в RDF Автоматическое создание онтологий Разработка согласованных словарей Интеллектуальная собственность
18
![Page 19: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/19.jpg)
Интернет – семантически единое информационное пространство
Взаимодействие человека с Сетью осуществляется посредством интеллектуальных агентов, которые: Отвечают на сложные вопросы Взаимодействуют друг с другом
![Page 20: Перспективы применения семантических технологий при построении виртуальных научных сообществ](https://reader035.vdocuments.site/reader035/viewer/2022062314/56813493550346895d9b7bcb/html5/thumbnails/20.jpg)
Система анализа научного прогресса на основе информации из отчетов научных сотрудников
Цель: отвечать на запросы вида Какие направления активно исследуются в данной области
знаний? Какие публикации по данному направлению вышли за
прошедший период? В каких еще задачах используются методы данного
направления? Какие конференции посвящены данному направлению? Каков научный вклад данного ученого/подразделения за
прошедший период?