tecnologías de modelado, procesamiento y gestión del
TRANSCRIPT
Tecnologías de modelado,
procesamiento y gestión del conocimiento
Quiénes somos
• Miembros principales – Rodrigo Mar2nez Béjar ([email protected]) – Jesualdo Tomás Fernández Breis ([email protected]) – Rafael Valencia García ([email protected]) – Francisco García Sánchez ([email protected]) – Marcos Menárguez Tortosa ([email protected])
• Aprox 10 estudiantes de doctorado y 10 proyectos/contratos de invesNgación en marcha
• Histórico: aprox. 30 tesis doctorales
• Miembros del InsNtuto Murciano de InvesNgación Biosanitaria (IMIB-‐Arrixaca)
Web semántica (Berners-Lee 2001)
Que las máquinas entiendan el significado de los datos
Linked Data (Berners-Lee, 2006)
Estandarización semántica
Data schemas Data
Schema mapping
Mapping file, idenNty
condiNons
Ontology
Data transformaNon
RDF data
Linked Data sets
Linked dataset
Data enrichment
Enriquecimiento de ontologías (tesis doctoral 3 de diciembre)
Class `Alcohol Binding´ before the applicaNon of the enrichment.
Class `Alcohol Binding´ a3er the applicaNon of the enrichment.
Calidad de ontologías (tesis doctoral 21 de enero)
• Existen más de 400 ontologías ¿cómo saber cuáles Nenen un mínimo de calidad?
7. PUBLICACIONES QUE COMPONEN ESTA TESIS
all of the ontologies, which can be accessed at http://miuras.inf.um.es/oquarewiki.
Analysis of the effect of the GoodOD guideline over thequality of the ontologies developedTo analyse the training effect over the ontologies developed by
the students, a training by topic two-way ANOVA model withinteraction term and balanced design for everyone of the 29evaluated subcharacteristics was applied. The 216 observationsfrom 24 untrained and trained students, corresponding to 36ontologies for each of the six topics (PRO, CLO, IMM, INF, CME
and SPA) were reused. This analysis showed that there is asignificant effect of the interaction training by topic for 22OQuaRE subcharacteristics (.000,p–value,0.03) (Figure 2).This means that the effect of the training could be differentdepending on the topic for those 22 selected subcharacteristics. Forthe other seven subcharacteristics there is no effect of theinteraction training by topic, neither by topic neither by training(see Table 3 and Figure 3).Figure 3 represents the mean values of the subcharacteristics by
topic, for untrained students, trained students and the goldstandard. The graph shows that the seven subcharacteristics with
Figure 2. Significant effect of training in some topics. 22 subcharacteristics presented significant effect due to the GoodOD based training forsome topics (PRO, IMM, CLO, CME, INF, SPA).doi:10.1371/journal.pone.0104463.g002
Table 3. P-values associated with the main effects in the two-way ANOVA with no effect of the interaction training by topic.
Sub-characteristic Trained Topic Trained X Topic
Reference Ontology 0.318 0.418 0.418
Text Analysis 0.318 0.418 0.418
Knowledge Reuse 0.586 0.069 0.952
Infering 0.318 0.418 0.418
Formalisation 0.318 0.418 0.418
Formal Relation Support 0.318 0.418 0.418
Consistency 0.318 0.418 0.418
doi:10.1371/journal.pone.0104463.t003
Evaluating GoodOD with OQuaRE
PLOS ONE | www.plosone.org 6 August 2014 | Volume 9 | Issue 8 | e104463
112
Anotación semántica de textos Semantic annotation
32!"
Ontology Population
39
Buscadores semánticos
36
Recomendación semántico-social Recommender systems
4
Item Score
I1 1
I2 0,3
i3 0,8
Recommender system
Recommendation list
User preferences
Community data
Items information
Knowledge models
Planificación y recomendación financiera
•
• nn
•
Minería de opiniones y detección de tendencias
• Análisis del contenido de tweets
!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(
!"#$$%&'()*+',-."#&*( ( 78(
90'+:;#*.( ;0+( <0.$"'#*="+( >( '?5".0( )"( @*;0.*$%0'"+( )"( $*)*( <0;*.%)*)( *+%2'*)*+(
*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(";(+%+#"5*A(
90'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(
90'+:;#*.( ;0+( :+:*.%0+( 56+( 5"'$%0'*)0+( "'( ;0+( #:%#+( >( ;0+( :+:*.%0+( B:"( 56+( #:%#+(
<:C;%$*'("'(,-%##".A((
90'+:;#*.(;*+(<*;*C.*+(56+(%5<0.#*'#"+(:#%;%D*)*+(<0.(;0+(:+:*.%0+()"(,-%##".A(
90'+:;#*.(;0+(#:%#+(56+(."#-%##"*)0+("'(,-%##".A(
E"*;%D*.(:'*(C?+B:")*(50'0F#G.5%'0H(:+:*.%0I(J*+J#*2(0(<*;*C.*('0.5*;("'(#0)0+(;0+(
#:%#+(*;5*$"'*)0+("'(";(+%+#"5*A(
!"#"$ %&'()*+,*-./'01()*+,*2.3-,/()4,'*5*/67,3.*+,*8)1.3)-&./,'*+,*-)+)*2.1)3&+)+**(
K+( ;*( @%+#*( <.%'$%<*;( )"( ;*( *<;%$*$%&'(-"CA( K+#*( @%+#*(5:"+#.*( *;( :+:*.%0( ;0+( <0.$"'#*="+( >( ";(
'?5".0()"(@*;0.*$%0'"+()"($*)*(<0;*.%)*)(*+%2'*)*+(*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(
";(+%+#"5*(L@".(M%2:.*(NOPA(
(!"#$%&'()*'+&',"-.&'/%"01"/&2'
(
(!"#$%&'34*'5"-.&'67'.706701"&-'
(
(
!"#"9 %&'()*+,*-./'01()*+,*(,/+,/-&)'*(
K+(;*(@%+#*(<*.*($0'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(Q*(@%+#*(
5:"+#.*( <0.( )"4"$#0( RS( #"')"'$%*+( 0.)"'*)*+( )"( 5*>0.( *( 5"'0.( %5<0.#*'$%*( >( <".5%#"(
!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(
!"#$$%&'()*+',-."#&*( ( 78(
*)"56+($*59%*.(":(';5".0()"(#"')"'$%*+(50+#.*)*+(<=".(>%2?.*(@ABC(D)"56+(+"(E?")"(F*$".(?'( $:%$( +09."( ?'*( #"')"'$%*( )"( :*( :%+#*( )"( #"')"'$%*+(50+#.*)*( E*.*( 09#"'".( ?'*( =%+#*( G?"($0'#%"'"( :0+( 7A( ;:#%50+( #?%#+( G?"( $0'#%"'"'( ":( F*+F#*2( H( :0+( E0.$"'#*I"+( H( ';5".0( )"( #?%#+(E0+%#%=0+J('"2*#%=0+(H('"?#.0+("'(#0)0(":(+%+#"5*(G?"($0'#%"'"'(":(F*+F#*2(+":"$$%0'*)0(<=".(>%2?.*(@K(H(>%2?.*(@@BC(((
(
!"#$%&'()*'+,-&./,-"0&,'.1'2&34%&0"451,'.1'$5&'-15.150"&'
(
!"#$%&'((*'6$1,-%&'.1'-$"-,'.45.1'&7&%101'$5&'-15.150"&'
(
!"#"# $%&'()*+),-.&/0'()*+)0-&)/&/(1%-&)23&)(,'%4-&)+.)56%''+1)( • Clasificación de tweets por
la polaridad de su contenido: posiNvo, negaNvo, neutro
Historia clínica electrónica
Historia clínica electrónica
Interoperabilidad semánNca. “Traducción” de datos y modelos clínicos
Colaboración con Programa de Prevención de Cáncer de Colon y Recto
Formalizar los protocolos de clasificación de
pacientes por nivel de riesgo
Aplicación automá?ca a la base de datos de
pacientes
Estudio de discrepancias, modelos
predic?vos
Inteligencia de negocio clínica semántica (tesis doctoral 22 de diciembre)
• Heterogeneidad de información (p.e., registros de cáncer) • Desde la recogida de datos hasta cuadros de mando
personalizados con tecnología 100% semánNca • Varios sistemas en producción en Hospital Virgen de la Arrixaca
Estudio de regiones del cerebro (Premio mejor TFM Bioinformática 14-15)
¿La regionalización tradicional del cerebro sigue siendo válida?
Otras líneas en estado inicial
• Análisis basado en técnicas de RNA-‐Seq de genes implicados en procesos relacionados con implantación embrionaria
• Historia clínica electrónica genómica
• Modelos de análisis de información y conocimiento genéNco y genómico para el estudio de cánceres
• ERP semánNco
Colaboradores
• Universidades y Centros de Investigación: – Europa: Reino Unido (Manchester, UCL, Liverpool), Alemania
(Friburgo, Institute of Medical Biometry and Medical Informatics), Austria (Graz), Francia (IRIT, LABRI), Italia (La Sapienza, Udine), Noruega (NTNU, Osfold)
– No Europa: Australia (UNSW, Wollongong), Brazil (Sao Paulo, Portoalegre, Minas Gerais), Venezuela (Mérida), Cuba (Holguín), México (Aguascalientes, Sonora, Veracruz), Canadá (Carleton), China (Jilin), EEUU (Stanford), National Institute of Basic Biology (Japón)
– España: UPV, UPM, UC3M, CBGP, UJI, Oviedo, Centro de Regulación Genómica
Colaboradores
• Empresas: – Grandes empresas: Indra, Atos Origin – PYME: Aquiline Computer, Global Metanoia, Innopole, NETEX
Knowledge Factory, Quality Objects, Edosoft factory, ERS, Base Compañía de Soporte Lógico, Veratech for Health
– Empresas surgidas del grupo: IMET, Vocali Sistemas Inteligentes
• Entidades sanitarias • Mayo Clinic (USA) • Hospital Universitario Virgen de la Arrixaca • FFIS • Amsterdam Medical Center (Holanda)
Tecnologías de modelado,
procesamiento y gestión del conocimiento