5' incontro isko italia venezia : 1 aprile 2011 maria taverniti erika pasceri 1 urt – sistemi...
TRANSCRIPT
5' Incontro ISKO ItaliaVenezia : 1 aprile 2011
Maria Taverniti
Erika Pasceri
1
URT – Sistemi di indicizzazione e classificazione
Attività di Progetto Laboratorio di
documentazione
• Gestione della conoscenza, di informazione e documenti– Definizione di metodologie e costruzione di sistemi di organizzazione e
di accesso alla conoscenza/informazione• Basi di conoscenza, Thesauri, Sistemi di indicizzazione e di
classificazione automatica, …
Presentazione L@bdocLaboratorio di documentazione
(1996) e Centro di Eccellenza in
Gestione della Conoscenza(2002)
URT (Unità di Ricerca presso Terzi) del CNR – Sistemi di
indicizzazione e classificazione(2007)
2
ProgettiFSE
Fascicolo Sanitario Elettronico
Thesaurus efficienza energetica e applicazione fonti rinnovabili agli usi finali civili
Standard per la
formalizzazione della
conoscenza
L’informatizzazione degli
uffici giudiziari: il fascicolo del PM
CL.Au.D.IoCLassificazione
Automatica DI dOcumenti
15248
Realizzazione di un prototipo software, con strumenti open source, per la classificazione automatica di documenti all’interno di un sistema di Document Management
Sistema di protocollo informatico
Integrazione nei prodotti presenti nelle PA
Rassegna stampa Barilla Group
CL.Au.D.Io (2008)
Obiettivo Soluzione
4
Thesaurus efficienza energetica
(2010) Obiettivi Metodologia
5
Obiettivi◦ Prevalenza di conoscenza tacita◦ Scarsa formalizzazione del
know-how◦ Pochi esperti di dominio
Progetti◦ Laboratorio Sperimentale di
artigianato e Design (L.R. 15 Marzo 2002 n.15) Artigianato Orafo
◦ Sviluppo dei saperi artigiani tradizionali e integrazione dei sistemi produttivi in Marocco e in Italia Artigianato tessile
Formalizzazione della conoscenza
(2007)
6
L’informatizzazione degli uffici giudiziari:
Fascicolo del PM(2009)
CNR
7
Avvio del Progetto•Finanziamento all’interno del “Programma Calabria per il Potenziamento delle misure di Sicurezza”;
Soggetti coinvolti e motivazioni•Procura della Repubblica con elevato carico di lavoro; •Organico non proporzionato al carico;•Situazione logistica non ottimale:
•Elevati volumi documentali e informativi;•Elevato numero di attori/produttori della documentazione e scarsastandardizzazione
Partner IndustrialeGruppo Abramo Soluzione
Avvio (Convenzione del 08/05/2009)
• Task A7.3– Definizione di modelli
ontologici e vocabolari a supporto del FSE
• Deliverable D9– Versione italiana di un
linguaggio medico interoperabile e di una tassonomia di classificazione
FSE
8
Continuazione (Convenzione del 17/12/2010)
• WP 3 - Realizzazione network interregionale per l’interoperabilità delle soluzioni territoriali di FSE
• Attività 3.3 - Definizione delle specifiche, progettazione e sviluppo di metodologie e componenti software per la codifica univoca degli assistiti
Linguaggio medico/thesaurus italiano di refertazione
5' Incontro ISKO Italia, Venezia, 1 aprile 2011
9
Knowledge Organization biomedica e standard di rappresentazione
Piano e-government 2012 Piano e-government 2012 Ministero per la Pubblica amministrazione e l’innovazione: Ministero per la Pubblica amministrazione e l’innovazione:
Consiglio Nazionale delle Ricerche
Progetto “Infrastruttura tecnologica del Fascicolo Sanitario Elettronico”
Il Fascicolo Sanitario Elettronico
• Semplificare e digitalizzare i servizi elementari (prescrizioni, certificati di malattia digitali, sistemi di prenotazione online)
• Creare le infrastrutture per un’erogazione di servizi sanitari vicini alle esigenze dei cittadini (fascicolo sanitario elettronico e innovazione delle aziende sanitarie)
10
Il nostro obiettivo
1. Linguaggio
medico/thesaurus italiano
di refertazione
2. Codifica italiana standardizzata
deirisultati degli
esamidi laboratorio
Definizione di modelli ontologici e vocabolari a supporto del Fascicolo
Sanitario Elettronico
11
1.Linguaggio medico/thesaurus italiano di refertazione
12
Regole Tecniche
ICD-9 CM(International Classification
of Diseases 9th Revision - Clinical Modification)
LOINC(Logical Observation Identifiers
Names and Codes)
Diagnosi
Esami dilaboratorio
13
Perché aggiornare ICD9-CM2007:Un campione di test
Tab.1: * Corrispondenze ottenute mediante verifica automatica e manuale
Sovrapposizioni AOBO / ICD9-CM Numero
Sovrapposizioni% Lessico contenuta in ICD9
AOBO (Codificato)
5054 90,54% *
AOBO (Libere) 278 0,92%**
** Corrispondenze ottenute mediante verifica automatica
Totale termini ICD9-CM : 16037
Totale termini AOBO (codificati) : 5486
Totale termini AOBO (liberi): 30379
14
Sovrapposizioni AOCS / ICD9-CM Numero
Sovrapposizioni% Lessico contenuta in ICD9
AOCS(Libere)
64 5,91%
Perché aggiornare ICD9-CM2007: un secondo campione di test
Tab.2: Corrispondenze ottenute mediante verifica manuale
Totale termini AOCS: 1082
Totale termini MMG: 3420
Tab.3: Corrispondenze ottenute mediante verifica automatica
Sovrapposizioni MMG CS / ICD9-CM Numero
Sovrapposizioni% Lessico contenuta in ICD9
MMG* 108 3,15%
* Campione estratto dai database di Medici di Medicina Generale 15
Gli esempi: Termini non presenti in ICD9-CM2007
* Ipoema e Ifema sono sinonimi, manca la gestione delle variabili
** Obesità, manca termine singolo
16
Obiettivo : Creazione di un Lessico/Thesaurus di destinazione
convenzionalmente definito ‘ICD9-CM Plus’
ICD9-CM
L 1
.
.
.L10
+ =ICD9-CM Plus
Verso ICD9-CM Plus
17
Lo Strumento
V.I.L.M.A.
Vocabolari Italiani Lessici di Medicina e sAnità
18
VM: il termine del corpus viene relazionato al termine di ICD9-CM Plus come variante morfologica, ma non inserito;
UF: il termine del corpus viene inserito come sinonimo o quasi sinonimo del termine di ICD9-CM Plus;
BT: il termine del corpus viene inserito come termine sovraordinato del termine ICD9-CM Plus;
NT: il termine del corpus viene inserito come termine subordinato del termine di ICD9-CM Plus;
RT: il termine del corpus viene inserito come termine correlato al termine di ICD9-CM Plus (vedi anche…);
Inserisci in ICD9-CM Plus: inserisce il termine del corpus come termine principale all’interno di ICD9-CM Plus senza relazionarlo.
Definizione delle relazioni
19
Per inclusione: seleziona tutti i termini del ICD9-CM Plus che contengono la parola, in qualunque posizione;
Per prefisso: contiene l’elenco di tutti i prefissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che iniziano per il prefisso selezionato. (Es. iper-, ipo-, ecc.);
Per suffisso: contiene l’elenco di tutti i suffissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che terminano per il suffisso selezionato. (Es. –ite, -osi, ecc.).
La ricerca dei termini
Permette di filtrare i termini in ICD9-CM Plus da confrontare:
20
ICD9-CM2007 Plus
Sovrapposizioni AOBO / ICD9-CM Plus Numero
Sovrapposizioni% Lessico contenuta in ICD9 Plus
AOBO (Codificato)
5918 93,46%* (90,54%)
AOBO (Libere)
863 2,84%** (0,92%)
•Totale termini di ICD9-CM Plus : 60241
•Totale termini AOBO (codificati) : 5486
•Totale termini AOBO (liberi): 30379
Tab.4: * Corrispondenze ottenute mediante verifica automatica e manuale
** Corrispondenze ottenute mediante verifica automatica
21
Tab.5: Corrispondenze ottenute mediante verifica automatica
Sovrapposizioni MMG CS / ICD9-CM Plus
NumeroSovrapposizioni
% Lessico contenuta in ICD9 Plus
MMG* 518 15,14% (5,91%)
* Campione estratto dai database di Medici di Medicina Generale
Sovrapposizioni AOCS / ICD9-CM Plus Numero
Sovrapposizioni% Lessico contenuta in ICD9
AOCS(Libere)
342 31,61% (3,15%)
Tab.6: Corrispondenze ottenute mediante verifica manuale
•Totale termini AOCS: 1082•Totale termini MMG: 3420
ICD9-CM2007 Plus
22
I MMG usano un linguaggio italiano nativo totalmente disallineato rispetto alla codifica ICD9-CM;
La traduzione italiana di ICD9-CM non è allineata al lessico di dominio corrente;
La codifica è, di fatto, una forzatura;
ICD9 – CM:
Possibili soluzioni:1. Revisione e contestualizzazione della traduzione;
2. Obbligatoria gestione delle relazioni.
23
2. Codifica italiana standardizzata dei risultati degli esami di laboratorio
Indianapolis, IN
24
«The purpose of LOINC® is to facilitate the exchange and pooling of clinical results for clinical care, outcomes management, and research by providing a set of universal codes and names to identify laboratory and other clinical observations»
[Fonte: <http://loinc.org/>]
LOINC
25
LOINC - URT
26
www.labdoc.it
LOINC: ?•Facilita lo scambio e la condivisione dei dati clinici provenienti dai laboratori fra i diversi operatori del settore biomedico;
• La banca dati LOINC fornisce un insieme di nomi universali e codici ID per l’identificazione dei risultati di test clinici e di laboratorio
• Ogni record del database LOINC è identificato da un codice numerico e da un formal name, costituito da 6 parti:
1. Component2. Property3. Time aspect4. System5. Scale type6. Method type
27
LOINC: La traduzione
28
LOINC: La traduzione (2)
29
LOINC ITALIAN TOOL
30
Loinc Italian Tool: Il nostro obiettivo • Realizzazione di un ambiente software
condiviso per la mappatura delle analisi
effettuate da ogni laboratorio italiano verso il
rispettivo nomenclatore tariffario
regionale e verso lo standard LOINCCreare un modello
di riferimento per
gli operatori del
settore
esportabile anche nelle altre regioni italiane
31
Il problema della mappatura I laboratori italiani codificano le analisi svolte autonomamente,
identificandole con un codice ad uso interno e associandole ai
codici del nomenclatore/tariffario regionale di afferenza.
Ad un singolo codice regionale possono corrispondere
più analisi del laboratorio (1:N)
La singola analisi comprende più voci del tariffario (N:1)
N:N ad ogni codice regionale possono corrispondere più codici interni e viceversa
ASSOCIAZIONE TARIFFARIO
32
Il problema della mappatura LOINC
Ogni laboratorio mappa secondo le proprie esigenze senza
tener conto dei criteri utilizzati dagli altri.
Questo porta ad una forte eterogeneità della codifica
italiana.
Se la stessa analisi fatta daLaboratorio diversi viene mappata rispetto a codici
LOINC differenti
(N:N) -> Errato
ASSOCIAZIONE LOINC
Ad un singolo codice interno del generico laboratoriopossono corrispondere più codici LOINC [(1:N) localmente]
Se la stessa analisi fatta daLaboratorio diversi viene mappata rispetto a codici
LOINC uguali
(1:N) -> Esatto
33
L’interfaccia
LOGIN Laboratoristi
CNR
Comitato scientifico
34
L’interfaccia : Gestione delle analisi Navigare all’interno del proprio catalogo analisi Caricare nuove analisi
35
Dove si ricerca il codice LOINC?
LOINC
LOINC ENG LOINC ITA CUMUL Altre assoc.
V. 2.30 V. 0.1 Parte italiana Di tutti i laboratori
36
L’interfaccia: Mappatura verso un codice LOINC Creare associazioni (N codici LOINC : N analisi di laboratorio) con il
LOINC, visualizzando: Le mappature fatte dagli altri utenti verso un generico codice
LOINC I dettagli di ogni termine LOINC
in inglese in italiano (se presente) nella traduzione cumul (se presente)
Elenco analisi del laboratorio X
Codici LOINC
Dettagli LOINC
37
URT (CS) – Molinette (TO)
Azienda Ospedaliera Universitaria Molinette,Torino
(dott.ssa Claudia Bessone)
Obiettivo:
Consentire la condivisione e lo scambio di informazioni tra istituzioni ed
organizzazioni che cooperano alla realizzazione di una codifica italiana
standardizzata degli esami di laboratorio basata su LOINC.
38
Grazie per l’attenzione!
www.labdoc.it
[email protected]@unical.it
5' Incontro ISKO Italia, Venezia, 1 aprile 2011
URT – Sistemi di indicizzazione e classificazione