医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。...

31
国家心血管病中心 中国医学科学院阜外医院 赵韡 医疗领域大数据应用

Upload: others

Post on 04-Aug-2020

31 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

国家心血管病中心 中国医学科学院阜外医院

赵韡

医疗领域大数据应用

Page 2: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

1.大数据在Gartner技术曲线中的变化

2013 大数据开始由过热期转向低谷期

,大数据的核心问题还是取决于数据挖掘背后所能产生的价值。在经历了一段热潮之后,大数据的概念可能转向低谷期,开始实实在在的为企业解决问题。

Page 3: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

1.大数据在Gartner技术曲线中的变化 2014 虽然对大数据的兴趣依然不

减,但它已经离开高峰期,因为该市场已经安定下来,有了一整套合理的方法。

Page 4: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2015年度Gartner曲线医疗大数据相关技术 机器学习

可穿戴

自然语言

物联网

平民数据科学

数字安全

2015年已经看不到大数据了,这可能意味着大数据已不再是“新兴”技术,而是成为了“主流”技术了。

Page 5: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2011-2014年的美国互联网医疗风险投资

大数据分析——3.93亿美元

医疗消费者参与——3.23亿美元

数字化医疗设备——3.12亿美元

远程医疗——2.85亿美元

个性化医药——2.68亿美元

人口健康管理——2.25亿美元

投资额同比增长率在2013年短暂放缓为30%之后2014年猛增到125%,2011—2014年的复合年增长率达到了45%,2014年的4个季度还分别创造

了互联网医疗投资的单季度最大投资额,其中第2季度的

单季度投资额甚至就超过了2012年的总和。

Page 6: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

HIMSS分析应用与评估模型

2015年9月24日, HIMSS C&BI Community

Page 7: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

阶段 描述

阶段7,

个性化医学&规

范性分析

利用健康管理、身体和行为的功能性保健等多种分析来实现大规模的定制诊疗;实现文本的自然语言处理(NLP)和临床现场的规范性分析,改善

患者预后;全部生物特征数据、健康数据和基因组数据

阶段6,

临床干预风险&

预测分析

数据管理从诊疗过程扩展至全部利益相关者,高级分析需支持推广、教育、人口健康、分流、转介、行政回避及再住院等

阶段5,

管理金融风险的同时,实行三重目标&建议分析

在实际临床活动中具备分析能力,使个体患者医疗质量最优、同时满足人口管理及诊疗成本的要求;对面向结果的付费提供成本风险分析;数据范围扩展为包括床旁设备、家庭监控数据、外部药房数据等。

阶段4,

临床效果&

人口健康

企业数据仓库(EDW)标准化/基于临床证据,支持医疗团队的活动,专注于提高患者群体的健康,最大程度的减少浪费及减少可变性

阶段3,

自动运行、计划

和绩效管理报告

具备企业数据仓库(EDW),以模型方式管理全部经营、质量相关数据;

支持医院全部级别人员绩效分析;数据通过标准的政策和程序进行发布、对外发布数据全部进行审核/批准

阶段2,

核心数据关联 具备集中管理数据的企业库,通过主数据管理(MDM)方法管理就诊患者、临床和财务等数据

阶段1,

基础建设 数据集中管理,建立可搜索的元数据存储库,具备针对源系统的数据质量管理

阶段0,

分散解决方案 具备数据分析能力,但处于分散的状态,内容未管理,同时存在多个版本,分析报告需要大量的人力参与

Page 8: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.医疗领域大数据的应用及趋势

随着大数据的退烧,应用趋于理性

Page 9: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.1.助力公共卫生检测 2009年,Google

比美国疾病控制与预防中心提前1~ 2周预测到了甲型H1N1流感

爆发,此事件震惊了医学界和计算机领域的科学家。

Page 10: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

谷歌流感趋势的启示:大数据分析中的陷阱

2012-2014,该系统一直高估与流感相关的就医量,在这类

数据最有用的流感季节高峰期尤其预测不准确。在2012/2013流感季节,它预测的就医量是美国疾控中心(CDC)最终记录结果的两倍;

最大差异时段

恢复正常水平

Page 11: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

谷歌流感趋势的启示:大数据分析中的陷阱

流感预测中的巨大误差在很大程度上是可以避免的,这为大数据的应用提供了经验教训。

大数据的正确性风险

依赖于网站的大数据收集常常把一些用不同方法、有不同目的数据整合起来,有时候这会产生负面的影响。从这样的数据样本得出结论是需要冒风险的

算法动力学的影响(算法持续改进)

算法动力学是指算法的各种变化,这些变化一方面源自工程师为了改进商业服务而修改算法,另一方面源自用户使用服务过程中行为的改变。

大数据工作不是一劳永逸的,必须根据情况的变化不断修正

Page 12: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.2.利用社交网络发现药品副作用

波士顿大学(Boston University)、FDA、哈佛医学院(Harvard Medical School)及其他机构的研究人员,在7个月的时间里分析了Twitter的690万条发帖,研究“不良事件”。研究发现,有关肠胃问题或者精神影响等特殊类型症状的投诉占比与FDA的数据基本吻合。

证明了社交媒体研究不良反应的可行性

Page 13: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.3.临床数据分析——疾病预防

不通过昂贵的诊断技术就能诊断早期疾病,借助大数据做到这一点。例如充血性心脏衰竭的治疗费用非常高昂,通过数据分析,Seton的一个团队发现颈静脉曲张

是导致充血性心脏衰竭的高危因素。(而颈静脉曲张的诊断几乎没有什么成本)

Page 14: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.4.临床数据分析——疾病预测

冠状动脉介入治疗后续费用预测

克利夫兰诊所,利用大数据方法对患者费用进行预测,以应对将要进行的冠状动脉介入治疗捆绑付费;

该模型可以利用前期数据(例如急诊治疗)预测患者整体费用支出;72%

患者可利用急诊诊疗数据进行准确的分类预测(高、中、低);

利用该框架,能够在早期治疗阶段识别出高成本( resource-intensive )患者,

从而通过积极的治疗计划,降低整体成本;

Page 15: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.4.临床数据分析

患者血栓栓塞事件的预测

利用多个不同的电子病历系统中

的临床数据,进行了大型回顾性队列研究。

本次研究由5名研究者利用11周时间(125

工作小时),分析了13年,近100万患者数据

研究结论表式: 肥胖、高的对象与正常身高比较,较矮者VTE发平率,女性高

1.83倍,男性高1.21倍;

与白人相比,西班牙裔/拉丁裔患者VTE的风险较低,女性低0.47,男低0.41;非裔美国人具有相当高的风险,女性为1.83倍,男性1.76倍;

证明 利用电子数据,能够利用较少的资源可以进行大规模的临床试验

Page 16: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

2.5.大数据对隐私保护带来巨大挑战

信息泄露

过去三年中,每年的医疗数据漏洞超过200个,被盗的医疗记录数量6倍于信用卡号被盗;

信息重标识风险

通过不同渠道采集的信息,能够还原一个人接近完整的信息

Page 17: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

3.心血管领域大数据应用尝试

临床质量评价模型

辅助临床科研模式

患者诊疗干预

Page 18: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

3.1. 构建医疗质量评价模型

• 提供实时临床质量报告,提供

医疗质量客观评价。

• 对中心、病房、医生从费用、

质量、效率等多维度进行综合

评价,用数据说话。

数据说话,精细管理

Page 19: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

临床质量评价

Page 20: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

3.2.利用大数据辅助临床科研实践

•通过结构化电子病历,实现由电子病历数据直

接形成临床试验数据,提高临床实验数据采集效

率200%,大幅提高采集数据准确率

实现临床数据的直接转化

Page 21: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

疾病预测分析

用模型对胸痛患者进行诊断预测

探讨胸痛诊断中重要影响因素,优化诊断过程、减少误诊

提供第二诊断意见,为基层医疗机构提供诊断指导

胸痛待诊断?

支持ACS

心绞痛 心肌梗死

不支持ACS

主动脉夹层

张力性气胸

肺栓塞 其它

将清洗好的急诊数据用线性判别、最近邻法、决策树、支持向量机、

贝叶斯、人工神经网络、随机森林等方法不断尝试。

目前最优模型:随机森林(准确率83.1%)

急诊非创伤性胸痛诊断分类预测分析

Page 22: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

大数据辅助科研评价

大数据应用效果——科学评价

建立了适合我国患者的SinoSCORE风险评估模型

EuroSCORE高估了我国CABG的手术风险,AUC仅为0.72

利用心外科注册登记数据,建立了一个更加适合中国患者的围术期风险评估模型——SinoSCORE,AUC=0.794

多个单中心或多中心队列验证了SinoSCORE的适用性

为更多患者进行了手术治疗

Page 23: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

3.3.患者诊疗干预

出院 3个月 6个月 1年

在两个层次 进行干预

在临床医师绩效和坚持二级预防药物开写环节,体现了

“电子健康方案”的有效性;

提供了CABG患者术后管理的优化策略;

诊疗改善计划

Page 24: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

3.3.患者诊疗干预 针对主治医师的质量改善

使用微信

出院检查清单:

• 用药,患者教育

定期反馈:

• 绩效考核

Page 25: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

患者诊疗干预 针对患者的质量改善

Page 26: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

4.1.心血管专科,电子病历数据调研 序号 EMR 厂商 结构化 专科病历 专科结构化 LIS PACS 手麻 输血 医嘱 1 √ 自研 √ √ √ √ √ √ √ √ 2 √ 厂商A √ × × √ √ √ √ √ 3 √ 厂商B √ √ × √ √ × √ √ 4 √ 厂商B √ √ × √ √ × × √ 5 √ 厂商C √ × × √ √ √ √ √ 6 √ 厂商D - √ × √ √ √ √ √ 7 √ × × × √ √ √ √ √ 8 √ 厂商E √ × × √ √ × √ √ 9 √ 厂商F √ √ × √ √ × √ √ 10 √ 厂商G √ √ × √ √ √ √ √ 11 √ 自研 √ √ √ √ √ √ √ √ 12 √ 厂商C √ × × √ √ √ × √ 13 √ 自研 √ √ × √ √ √ √ √ 14 √ 厂商B - - × √ - - - √ 15 √ 厂商F √ × × √ √ × √ √ 16 √ 自研 √ √ × √ √ × √ √ 17 √ 厂商H √ √ × √ √ × √ √ 18 √ 厂商H √ √ × √ √ × √ √ 19 √ 厂商I × × × √ √ √ √ √ 20 √ 厂商F √ √ × √ √ × √ √ 21 √ 厂商J √ × × √ √ √ × √ 22 √ 厂商E √ √ × √ √ √ √ √ 23 √ 厂商E √ × × √ √ × × √ 24 √ 厂商K,1 √ √ × √ √ × √ √ 25 √ √ × × √ √ √ √ √

调研涉及25家医院的“心血管外科”临床信息系统使用情况,全部医院为“三级甲等”

Page 27: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

我国心血管专科数据情况

系统应用深度不足、数据集成不充分

数据质量不佳(范围窄,数据少),可用于分析的不多

决策支持系统的知识缺乏

缺少数据安全和隐私保护的法律法规

Page 28: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

4.2.美国大数据广泛应用的主要障碍

9%

17%

17%

23%

34%

35%

37%

0% 5% 10% 15% 20% 25% 30% 35% 40%

经费超出预期

不知从何开始

数据所有权不清

内部缺乏技术储备

不知如何利用数据

数据分享的文化

获取数据的能力

Page 29: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

5 新的尝试

以CHI TA 为平台,积极开展研究工作

国家卫生计生委规划与信息司,卫生计生事业发展“十三五”规划前期研究重大课题—

—我国心血管病专科大数据应用架构的预研;

国家食品安全风险评估中心,心血管病人饮食健康流行病学病历对照研究与人才培养。

Page 30: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

国内外心血管领域大数据应用模式及典型应用

了解我国心血管专科信息化建设情况和数据基础

完善心血管专科大数据应用数据基础

形成心血管病专科大数据的应用架构

尝试打通临床数据与食品数据的共享障碍,建立跨领域大数据应用模式

国内外大数据

应用调研

国内各领域

专家访谈

国内专科数据

情况调研

专科大数据应用模式

专科大数据应用情况

专科数据基础

跨领域应用模式

专科大数据应用架构

Page 31: 医疗领域大数据应用Œ»疗领域大...这为大数据的应用提供了经验教训。 大数据的正确性风险 依赖于网站的大数据收集常常把一些用不同方法、有不同目

感谢您的聆听