tecnologías de modelado, procesamiento y gestión del

Tecnologías de modelado,

procesamiento y gestión del conocimiento

Quiénes somos

•  Miembros principales –  Rodrigo Mar2nez Béjar ([email protected]) –  Jesualdo Tomás Fernández Breis ([email protected]) –  Rafael Valencia García ([email protected]) –  Francisco García Sánchez ([email protected]) –  Marcos Menárguez Tortosa ([email protected])

•  Aprox 10 estudiantes de doctorado y 10 proyectos/contratos de invesNgación en marcha

•  Histórico: aprox. 30 tesis doctorales

•  Miembros del InsNtuto Murciano de InvesNgación Biosanitaria (IMIB-‐Arrixaca)

Web semántica (Berners-Lee 2001)

Que las máquinas entiendan el significado de los datos

Linked Data (Berners-Lee, 2006)

Estandarización semántica

Data schemas Data

Schema mapping

Mapping file, idenNty

condiNons

Ontology

Data transformaNon

RDF data

Linked Data sets

Linked dataset

Data enrichment

Enriquecimiento de ontologías (tesis doctoral 3 de diciembre)

Class `Alcohol Binding´ before the applicaNon of the enrichment.

Class `Alcohol Binding´ a3er the applicaNon of the enrichment.

Calidad de ontologías (tesis doctoral 21 de enero)

•  Existen más de 400 ontologías ¿cómo saber cuáles Nenen un mínimo de calidad?

7. PUBLICACIONES QUE COMPONEN ESTA TESIS

all of the ontologies, which can be accessed at http://miuras.inf.um.es/oquarewiki.

Analysis of the effect of the GoodOD guideline over thequality of the ontologies developedTo analyse the training effect over the ontologies developed by

the students, a training by topic two-way ANOVA model withinteraction term and balanced design for everyone of the 29evaluated subcharacteristics was applied. The 216 observationsfrom 24 untrained and trained students, corresponding to 36ontologies for each of the six topics (PRO, CLO, IMM, INF, CME

and SPA) were reused. This analysis showed that there is asignificant effect of the interaction training by topic for 22OQuaRE subcharacteristics (.000,p–value,0.03) (Figure 2).This means that the effect of the training could be differentdepending on the topic for those 22 selected subcharacteristics. Forthe other seven subcharacteristics there is no effect of theinteraction training by topic, neither by topic neither by training(see Table 3 and Figure 3).Figure 3 represents the mean values of the subcharacteristics by

topic, for untrained students, trained students and the goldstandard. The graph shows that the seven subcharacteristics with

Figure 2. Significant effect of training in some topics. 22 subcharacteristics presented significant effect due to the GoodOD based training forsome topics (PRO, IMM, CLO, CME, INF, SPA).doi:10.1371/journal.pone.0104463.g002

Table 3. P-values associated with the main effects in the two-way ANOVA with no effect of the interaction training by topic.

Sub-characteristic Trained Topic Trained X Topic

Reference Ontology 0.318 0.418 0.418

Text Analysis 0.318 0.418 0.418

Knowledge Reuse 0.586 0.069 0.952

Infering 0.318 0.418 0.418

Formalisation 0.318 0.418 0.418

Formal Relation Support 0.318 0.418 0.418

Consistency 0.318 0.418 0.418

doi:10.1371/journal.pone.0104463.t003

Evaluating GoodOD with OQuaRE

PLOS ONE | www.plosone.org 6 August 2014 | Volume 9 | Issue 8 | e104463

112

Anotación semántica de textos Semantic annotation

32!"

Ontology Population

39

Buscadores semánticos

36

Recomendación semántico-social Recommender systems

4

Item Score

I1 1

I2 0,3

i3 0,8

Recommender system

Recommendation list

User preferences

Community data

Items information

Knowledge models

Planificación y recomendación financiera

•

• nn

•

Minería de opiniones y detección de tendencias

•  Análisis del contenido de tweets

!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(

!"#$$%&'()*+',-."#&*( ( 78(

90'+:;#*.( ;0+( <0.$"'#*="+( >( '?5".0( )"( @*;0.*$%0'"+( )"( $*)*( <0;*.%)*)( *+%2'*)*+(

*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(";(+%+#"5*A(

90'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(

90'+:;#*.( ;0+( :+:*.%0+( 56+( 5"'$%0'*)0+( "'( ;0+( #:%#+( >( ;0+( :+:*.%0+( B:"( 56+( #:%#+(

<:C;%$*'("'(,-%##".A((

90'+:;#*.(;*+(<*;*C.*+(56+(%5<0.#*'#"+(:#%;%D*)*+(<0.(;0+(:+:*.%0+()"(,-%##".A(

90'+:;#*.(;0+(#:%#+(56+(."#-%##"*)0+("'(,-%##".A(

E"*;%D*.(:'*(C?+B:")*(50'0F#G.5%'0H(:+:*.%0I(J*+J#*2(0(<*;*C.*('0.5*;("'(#0)0+(;0+(

#:%#+(*;5*$"'*)0+("'(";(+%+#"5*A(

!"#"$ %&'()*+,*-./'01()*+,*2.3-,/()4,'*5*/67,3.*+,*8)1.3)-&./,'*+,*-)+)*2.1)3&+)+**(

K+( ;*( @%+#*( <.%'$%<*;( )"( ;*( *<;%$*$%&'(-"CA( K+#*( @%+#*(5:"+#.*( *;( :+:*.%0( ;0+( <0.$"'#*="+( >( ";(

'?5".0()"(@*;0.*$%0'"+()"($*)*(<0;*.%)*)(*+%2'*)*+(*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(

";(+%+#"5*(L@".(M%2:.*(NOPA(

(!"#$%&'()*'+&',"-.&'/%"01"/&2'

(

(!"#$%&'34*'5"-.&'67'.706701"&-'

(

(

!"#"9 %&'()*+,*-./'01()*+,*(,/+,/-&)'*(

K+(;*(@%+#*(<*.*($0'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(Q*(@%+#*(

5:"+#.*( <0.( )"4"$#0( RS( #"')"'$%*+( 0.)"'*)*+( )"( 5*>0.( *( 5"'0.( %5<0.#*'$%*( >( <".5%#"(

!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(

!"#$$%&'()*+',-."#&*( ( 78(

*)"56+($*59%*.(":(';5".0()"(#"')"'$%*+(50+#.*)*+(<=".(>%2?.*(@ABC(D)"56+(+"(E?")"(F*$".(?'( $:%$( +09."( ?'*( #"')"'$%*( )"( :*( :%+#*( )"( #"')"'$%*+(50+#.*)*( E*.*( 09#"'".( ?'*( =%+#*( G?"($0'#%"'"( :0+( 7A( ;:#%50+( #?%#+( G?"( $0'#%"'"'( ":( F*+F#*2( H( :0+( E0.$"'#*I"+( H( ';5".0( )"( #?%#+(E0+%#%=0+J('"2*#%=0+(H('"?#.0+("'(#0)0(":(+%+#"5*(G?"($0'#%"'"'(":(F*+F#*2(+":"$$%0'*)0(<=".(>%2?.*(@K(H(>%2?.*(@@BC(((

(

!"#$%&'()*'+,-&./,-"0&,'.1'2&34%&0"451,'.1'$5&'-15.150"&'

(

!"#$%&'((*'6$1,-%&'.1'-$"-,'.45.1'&7&%101'$5&'-15.150"&'

(

!"#"# $%&'()*+),-.&/0'()*+)0-&)/&/(1%-&)23&)(,'%4-&)+.)56%''+1)( •  Clasificación de tweets por

la polaridad de su contenido: posiNvo, negaNvo, neutro

Historia clínica electrónica

Historia clínica electrónica

Interoperabilidad semánNca. “Traducción” de datos y modelos clínicos

Colaboración con Programa de Prevención de Cáncer de Colon y Recto

Formalizar los protocolos de clasificación de

pacientes por nivel de riesgo

Aplicación automá?ca a la base de datos de

pacientes

Estudio de discrepancias, modelos

predic?vos

Inteligencia de negocio clínica semántica (tesis doctoral 22 de diciembre)

•  Heterogeneidad de información (p.e., registros de cáncer) •  Desde la recogida de datos hasta cuadros de mando

personalizados con tecnología 100% semánNca •  Varios sistemas en producción en Hospital Virgen de la Arrixaca

Estudio de regiones del cerebro (Premio mejor TFM Bioinformática 14-15)

¿La regionalización tradicional del cerebro sigue siendo válida?

Otras líneas en estado inicial

•  Análisis basado en técnicas de RNA-‐Seq de genes implicados en procesos relacionados con implantación embrionaria

•  Historia clínica electrónica genómica

•  Modelos de análisis de información y conocimiento genéNco y genómico para el estudio de cánceres

•  ERP semánNco

Colaboradores

•  Universidades y Centros de Investigación: –  Europa: Reino Unido (Manchester, UCL, Liverpool), Alemania

(Friburgo, Institute of Medical Biometry and Medical Informatics), Austria (Graz), Francia (IRIT, LABRI), Italia (La Sapienza, Udine), Noruega (NTNU, Osfold)

–  No Europa: Australia (UNSW, Wollongong), Brazil (Sao Paulo, Portoalegre, Minas Gerais), Venezuela (Mérida), Cuba (Holguín), México (Aguascalientes, Sonora, Veracruz), Canadá (Carleton), China (Jilin), EEUU (Stanford), National Institute of Basic Biology (Japón)

–  España: UPV, UPM, UC3M, CBGP, UJI, Oviedo, Centro de Regulación Genómica

Colaboradores

•  Empresas: –  Grandes empresas: Indra, Atos Origin –  PYME: Aquiline Computer, Global Metanoia, Innopole, NETEX

Knowledge Factory, Quality Objects, Edosoft factory, ERS, Base Compañía de Soporte Lógico, Veratech for Health

–  Empresas surgidas del grupo: IMET, Vocali Sistemas Inteligentes

•  Entidades sanitarias •  Mayo Clinic (USA) •  Hospital Universitario Virgen de la Arrixaca •  FFIS •  Amsterdam Medical Center (Holanda)

Tecnologías de modelado,

procesamiento y gestión del conocimiento

tecnologías de modelado, procesamiento y gestión del

Documents