supporting clinical trial data curation and integration with table mining

19

Supporting clinical trial data curation and integration with table mining Nikola Milosevic 1 , Cassie Gregson 3 , Robert Hernandez 3 , Goran Nenadic 1,2 1 School of Computer Science, University of Manchester 2 The Farr Institute @HeRC 3 AstraZeneca

Upload: nikola-milosevic

Post on 14-Apr-2017

149 views

Category:

Data & Analytics

1 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Supporting clinical trial data curation and integration with table mining

Supporting clinical trial data curation and integration

with table miningNikola Milosevic1, Cassie Gregson3, Robert Hernandez3, Goran Nenadic1,2

1School of Computer Science, University of Manchester2 The Farr Institute @HeRC3AstraZeneca

Page 2: Supporting clinical trial data curation and integration with table mining

Clinical trial publications• Around 800 000 clinical trials in PubMed• Difficult to digest/search• Text mining approaches• But tables and figures are

often not processed

Page 3: Supporting clinical trial data curation and integration with table mining

Tables in publications• Present factual information• Usually:• Experimental settings (i.e. demographics)• Findings and results (e.g. DDI, side effects, adverse events…)• Background information (previous research, datasets, etc.)• Examples

• Important information about trials

Page 4: Supporting clinical trial data curation and integration with table mining

Extraction and curation of table data

Page 5: Supporting clinical trial data curation and integration with table mining

Challenges• Complex structure• Table dimensionality (1, 2, multi-dimensional)• Visual relationships

• Dense content• Ambiguous short text• Lack of context• Acronyms and abbreviations• Incomplete information

Page 6: Supporting clinical trial data curation and integration with table mining

Page 7: Supporting clinical trial data curation and integration with table mining

Table analysis overview

Page 8: Supporting clinical trial data curation and integration with table mining

Table types (1)• 4 types: list, matrix, super-row and multi-tables• List table:

Page 9: Supporting clinical trial data curation and integration with table mining

Table types (2)• Matrix table

Page 10: Supporting clinical trial data curation and integration with table mining

Table types (3)• Super-row table

Page 11: Supporting clinical trial data curation and integration with table mining

Table types (4)• Multi-table

Page 12: Supporting clinical trial data curation and integration with table mining

Example of decomposition

Page 13: Supporting clinical trial data curation and integration with table mining

Example of decomposition

Page 14: Supporting clinical trial data curation and integration with table mining

Example of decomposition

Page 15: Supporting clinical trial data curation and integration with table mining

Results

Page 16: Supporting clinical trial data curation and integration with table mining

Next steps• Add semantic annotations• Link patterns in data cells with its meaning• Build/Expand knowledge bases• Relate to existing knowledge on the semantic web

Page 17: Supporting clinical trial data curation and integration with table mining

Annotation schema• Meta-data• Paper (name, abstract, authors, publisher)• Authors (names, emails, affiliations)• Table (caption, footers)• Cells (content, role)• Inter-cell relationships• Semantics (links to ontologies, dictionaries, knowledge bases)

Page 18: Supporting clinical trial data curation and integration with table mining

Summary• Tables contain valuable information such as settings or

results • System for extraction and curation of table data• Decomposition and annotation of the tables• Accuracy of 85%

• Semantic analysis and information extraction

Page 19: Supporting clinical trial data curation and integration with table mining

[email protected]

Bugaychuk curation

Curation edp2500

Sequence Curation

Content Curation

1001portails Curation

SAB 2008 LITERATURE CURATION Overview & Integrated Phenotype Curation

SUPPORTING DIGITAL SCHOLARSHIP AND …222 Supporting Digital Scholarship and Individual Curation based on a Meme-and-Cloud- ... • Digital personal and personalized knowledge is always

Assignement « curation»

Supporting Policy Relevant Reviews and Trials Trial Funding Tool (TFT) D5, WP3

PowerPoint Curation

Data Curation Malcolm Crowe, UWS. Digital Curation Curation techniques are for archives Curation techniques are for archives Librarians, to preserve documentsLibrarians,

DataPool · DataPool Building Capacity, Developing Skills, Supporting Researchers •Developing Skills ... 7 International Digital Curation Conference 5 th-7 December 2011

Content curation - Curation Tools for the Classroom

Rotation curation

Davydov curation

+ Sarah Jones Digital Curation Centre [email protected] Twitter: @sjDCC Supporting researchers with Data Management Plans

Supporting Teachers & Students in the Curation of Their Digital Footprint

Digital Curation: Curation Micro-services approach to building repositories

Digital Curation Centre webinar: Curation Costs Exchange (CCEx) 06052015

Data curation and preservation: the Digital Curation Centre

Curation for systemization of authentic content for ... · Curation • Rosenbaum (2011). Curation Nation • Curation is the future of online content • Curation: collection and

Learning Hands-on and by Trial & Error with Data Curation Profiles D. Scott Brandt assoc dean for research Framing the digital curation curriculum International

Aquipt. Inc. | Private & Confidential Deploying & Supporting a Modern Trial Site

Digital curation

Learning Hands-on and by Trial & Error with Data Curation Profiles

4D Curation Squad – Curious About Content Curation?

Curation - tau.ac.ililia1/curation.pdf · outline • digital science vs. analog science • curation - learning activity of the fourth science paradigm • curation - consequence

UC Curation Center / California Digital Library … Curation Foundations Page 1 of 29 UC Curation Center / California Digital Library UC3 Curation Foundations Rev. 0.13 – 2010-03-25

Supporting Content Curation Communities: The Case of the

La Curation qu'es aquòekladata.com/.../GG-Curation-Janvier2014.pdf · La curation ou le retour de l’humain •Les dimensions de la « curation » / du « curateur » – L’expertise

Digital | Curation | Centre Supporting Digital Curation to safeguard research data: adding value today and ensuring long-term access Dr Liz Lyon, DCC Associate