05. representação e raciocínio aplicações na web semântica luiz a m palazzo universidade...
TRANSCRIPT
05. Representação e Raciocínio
Aplicações na Web Semântica
Luiz A M PalazzoUniversidade Católica de Pelotas
Centro Politécnico
Abril de 2010
Na Linha do Tempo
1970 - ARPANET
1980 - BITNET NSFNET INTERNET
1990 - World Wide Web
2000 - Web 2.0 - Web Social
2010 - Web 3.0 - Web Semântica
2020 - Web 4.0 - Web Ubíqua
Fontes: Hobbes Internet Timeline - http://www.zakon.org/robert/internet/timeline/ Radar Networks - http://www.radarnetworks.com/
05 - Representação e Raciocínio 2
A Evolução Tecnológica
05 - Representação e Raciocínio 3
Outra Visão a Longo Prazo
05 - Representação e Raciocínio 4
A Web Hoje
O tamanho da Web Indexada é estimado em mais de 57 bilhões de páginas (WorldWideWebSize.com, abril de 2010)
A maior parte é dirigida ao consumo humano:
Mesmo o conteúdo gerado automaticamente a partir de bases de dados é usualmente apresentado sem a estrutura original da base de dados.
Alguns usos típicos da Web hoje:
Pesquisar e utilizar informação,
Buscar e entrar em contato com outras pessoas,
Pesquisar recursos, produtos e lojas on-line,
Adquirir produtos e serviços.05 - Representação e Raciocínio 5
A Web 2.0
Uma Web social• Participativa• Exemplos:
• Google Apps• Wikipedia• Blogging• Second Life• Tags (folksonomias)
05 - Representação e Raciocínio 6
A Web Semântica
Uma Web de dados (descritos por metadados)
Capaz de ser entendida por humanos e máquinas simultaneamente
Gradualmente incorporada à Web Sintática
Permitindo a realização de inferências sobre o seu conteúdo
Oferecendo suporte a aplicações inteligentes e inovadoras
05 - Representação e Raciocínio 7
Uma Web de Dados!
05 - Representação e Raciocínio 8
A Proposta Original
05 - Representação e Raciocínio 9
Scientific American Magazine, maio de 2001
Uma Web em Camadas
05 - Representação e Raciocínio 10
Onde estamos agora?
05 - Representação e Raciocínio 11
Ainda... em construção
Novos modelos estão gradualmente sendo propostos, testados e aceitos
Baseia-se em conceitos fundamentais sobre o relacionamento semântico entre as linguagens de cada camada
As camadas mais baixas estão mais consolidadas
As últimas camadas (Lógica, Prova,Confiança) estão ainda em fase de pesquisa
O Nível Léxico: UNICODE
05 - Representação e Raciocínio 12
Padrão de codificação de caracteres
Em substituição ao ASCII (8 bits – 256 caracteres)
16 bits (65.536 caracteres)
Símbolos de linguagens internacionais
Símbolos matemáticos
Símbolos financeiros
Outros símbolos especiais
Cerca de 49.000 símbolos usados
16.000 combinações livres para uso customizado
URI / IRI
05 - Representação e Raciocínio 13
URI: Uniform Resource Identifier
IRI: Internationalized URI
Superconjunto de:
URL (Uniform Resource Location)
URN (Uniform Resource Name)
URC (Uniform Resource Classification)
Elemento básico da estrutura a partir do qual os demais componentes são construídos
XML: eXtensible Markup Language
05 - Representação e Raciocínio 14
É uma linguagem de marcação, como HTML
Ambas são baseadas em tags
<titulo> Minha Página </titulo>
Mas, HTML é voltada para a formatação, enquanto que XML tenta capturar a estrutura da informação
XML também permite a criação de novas tags para atender aplicaçõesespecíficas
Comparando HTML e XML
HTML
<h2>Context-Dependent Reasoning</h2>
<i>por <b>V. Marek</b> e <b>M. Truszczynski</b></i><br>
Springer 1993<br>ISBN 0387976892
XML
<livro><título>Context-Dependent Reasoning</título><autor>V. Marek</autor><autor>M. Truszczynski</autor><editora>Springer</editora><ano>1993</ano><ISBN>0387976892</ISBN>
</livro>
1505 - Representação e Raciocínio
Vocabulários XML
Aplicações para a Web devem concordar em um vocabulário comum (nomes de tags) para se comunicar e colaborar.
As comunidades e setores empresariais estão definindo seus vocabulários especializados: Matemática (MathML) Bioinformática (BSML) Recursos Humanos (HRML) Recursos na Web (Dublin Core) Pessoas (FOAF) …
1605 - Representação e Raciocínio
Namespaces
Identificadores podem ter mais de um significado Os namespaces contextualizam identificadores Os identificadores são únicos dentro de um
namespace
<h:mesa xmlns:h="http://www.w3.org/TR/html4/"> <h:tr> <h:td>Maçãs</h:td> <h:td>Bananas</h:td> </h:tr> </h:mesa>
<f:mesa xmlns:f="http://www. ... /mobilia"> <f:nome>Mesa de Jantar</f:nome> <f:largura>160</f:largura> <f:comprimento>240</f: comprimento> </f:mesa>
1705 - Representação e Raciocínio
RDF: Resource Description Framework
05 - Representação e Raciocínio 18
Representação de metadados
Acessível por máquinas
Significado codificado em triplas
Recurso (1) tem propriedade (2) que tem valor (3)
Recurso: qualquer objeto do mundo real descrito de forma única por um URI
Propriedade: aspectos específicos que caracterizam e descrevem um recurso
Declarações: associações entre um recurso específico, uma propriedade qualquer e o valor dessa propriedade, para esse recurso.
RDF: Com a Sintaxe do XML
05 - Representação e Raciocínio 19
<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:mydomain="http://www.mydomain.org/my-rdf-ns">
<rdf:Descriptionrdf:about="http://www.cit.gu.edu.au/~db">
<mydomain:site-owner>
Homer Simpson
</mydomain:site-owner>
</rdf:Description>
</rdf:RDF>
RDF Schema
05 - Representação e Raciocínio 20
RDF Schema (RDFS) é um modelo de tipos de dados simples que permite a criação de classes e propriedades.
Principais conceitos: Recurso (rdfs:Resource) Classe (rdfs:Class) Propriedade (rdf:Property)
RDF Schema (RDFS)
05 - Representação e Raciocínio 21
O RDFS não fornece ainda todos os detalhes necessários para descrever recursos:
Não possui restrições de domínio ou escopos específicos. Não possui restrições de existência ou cardinalidade. Não possui propriedades transitivas, inversas ou
simétricas.
Mesmo assim:
Tornou-se um padrão de fato para a Web Semântica Possui suficiente potencial de expressividade Permite obter estruturas de informação sem
ambiguidades.
Ontologias
05 - Representação e Raciocínio 22
São especificações formais compartilhadas dos conceitos de um determinado domínio
Vem da filosofia (estudo do ser) e foram incorporadas pela Ciência da Computação, especialmente nas áreas de Inteligência Artificial e Representação do Conhecimento
Constituem o núcleo da Web Semântica, que não pode ser construída sem elas.
OWL: Web Ontology Language
05 - Representação e Raciocínio 23
Padrão desenvolvido pelo W3C para a representação de ontologias para a Web Semântica
Baseia-se no modelo da orientação a objetos com elevada expressividade semântica herdando a mesma sintaxe de XML/RDF
Apresenta-se em três versões, voltadas para diferentes aplicações:
Lite
DL (Description Logics)
Full
OWL: Web Ontology Language
05 - Representação e Raciocínio 24
SPARQL
05 - Representação e Raciocínio 25
É uma linguagem de consulta para os padrões de grafos RDF/RDFS
Está para a Web Semântica assim como SQL está para as bases de dados relacionais
Formada por:
Padrões de consulta
Protocolo para uso com HTTP
Formato XML para saída dos resultados
É um padrão W3C desde janeiro de 2008
SPARQL
05 - Representação e Raciocínio 26
RIF: Rule Interchange Format
05 - Representação e Raciocínio 27
GIF, KIF... RIF
Proposta de um formato padronizado para o compartilhamento de regras entre diferentes comunidades: empresariais, acadêmicas etc.
Tecnologia em desenvolvimento por um grupo de trabalho no W3C
http://www.w3.org/2005/rules/wiki/RIF_Working_Group
Lógica Unificadora
05 - Representação e Raciocínio 28
Representação unificada de expressões SPARQL, RIF e ontologias (descritas em OWL)
O objetivo é oferecer um framework único para possibilitar a combinação dos elementos das camadas inferiores
Abordagens ainda em estudo incluem lógica modal para a caracterização de ações, lógicas auto-epistêmicas, lógicas de descrição, entre outras
Prova
05 - Representação e Raciocínio 29
Mecanismos de inferência devem ser especificados para o uso das regras previamente definidas
Validação de informações com uso de agentes:
Software executado sem controle humano direto ou supervisáo constante para cumprir objetivos definidos por um usuário
Coletam, filtram e processam informações na Web, eventualmente com o auxílio de outros agentes
Criptografia
05 - Representação e Raciocínio 30
Transversalmente às diversas camadas da Web Semântica, muitas vezes é necessário garantir a segurança e privacidade das informações.
Com esta finalidade, mecanismos de criptografia são integrados às camadas, especialmente em aplicações mais sensíveis.
Por exemplo, com o emprego de dupla chave (pública/privada).
Confiança
05 - Representação e Raciocínio 31
Após a informação desejada ser obtida, é necessário determinar a suaautenticidade
Entidades confiáveis podem ser definidas (p.ex: bibliotecas virtuais, agências de autentificação, etc.)
Declarações de confiabilidade podem ser verificadas se houver confirmação de outra entidade (também confiável)
Por exemplo, pode-se acreditar que alguém é funcionário de uma loja se a loja também afirma que a pessoa é um funcionário e a loja pertence a uma lista de entidades confiáveis
Interface do Usuário
05 - Representação e Raciocínio 32
Uma das metas da Web Semântica é a personalização da interface do usuário em suas aplicações.
Para isso é necessário modelar as preferências, necessidades e interesses de cada usuário
Contribuem para essa meta o desenvolvimento (semi-)automatizado de ontologias pessoais com o uso de vocabulários controlados como o Dublin Core e o FOAF
Aplicações
05 - Representação e Raciocínio 33
Gerenciamento de Conteúdo
Business Intelligence
Interfaces Colaborativos
Comunicação entre Comunidades Virtuais
Gerenciamento de Dados Multi e Hipermídia
Educação formal e continuada
etc.
Em resumo...
05 - Representação e Raciocínio 34
A Web Semântica é hoje uma realidade Grande progresso realizado desde a proposta original de 2001 Muitas aplicações já estão disponíveis e o número continua
aumentando Crescente suporte oferecido pela iniciativa privada e o setor
governamental
O desenvolvimento continua É fácil participar: muitas ferramentas livres estão disponíveis Novas linguagens e técnicas começam a atingir uma massa crítica
Os próximos passos são instigantes: O “efeito rede”: conexão dos recursos da WS com os demais
As oportunidades de pesquisa e desenvolvimento continuam em
alta