大数据分析在医疗机构中的作用以及潜在优势(上)

大数据与数据科学家2018-12-05 16:01:19


摘要


当下,医疗产业尚未全面地利用大数据分析的巨大潜在优势。由于目前大多数关于大数据分析的研究都是以技术为导向,亟需对于大数据所带来的战略性影响进行深入理解。为了解决这个需求,这项研究重点探讨了大数据分析的发展历程、架构设计和组件功能。从对26个医疗领域大数据分析应用案例的内容分析中,我们发现了大数据分析的五项作用:对于医护模式的分析能力、对于非结构化数据的分析能力、决策支持能力、预测能力以及追踪能力。我们同时会揭示大数据分析驱动在信息技术架构层面、运营层面、组织层面、管理层面和战略层面所带来的优势。

 


1.导论


在美国的医疗产业中,医疗信息系统缺少集成性、医疗数据管理欠佳等信息技术相关的问题严重阻碍其IT价值向商业价值的转换过程。医疗产业以前所未有的速度产生海量多元的数据洪流更增加了问题的复杂性,其结果就是增加了不必要的医疗成本,同时增加了病人和医疗服务提供者的时间成本。因此,医疗机构在寻找有效的IT解决方案来帮助他们有效地利用组织资源来提升患者的医护服务体验、提升组织绩效,甚至建立新的有效的数据驱动的商业模式。


       大数据分析为解决上述问题带来了希望。大数据分析是从商业智能和决策支持系统发展而来的,商业智能和决策支持系统帮助医疗组织快速地分析来自医疗网络大量多元的数据, 从而支持基于经验的决策以及行动方案的制定。大数据分析包含多种分析技术,如描述性分析、挖掘性/预测性分析,这些方法对于很大一部分基于文本的医疗文件和其他非结构化的诊疗数据的分析来说是非常理想的方法。一些新的数据库管理系统,如MongoDB和用于数据集成和获取的Marklogic、Apache Cassandra,让数据可以在传统和新兴的操作系统中转换。为了存储海量、多元格式的数据,出现了Apache HBase和NoSQL系统。这些有着复杂功能的大数据分析工具协助医疗数据的集成,为医疗机构满足患者需求和未来市场需求,提高医护质量以及经济效益提供了全新的视角。


       尽管计算机科学家们从技术方面对大数据分析有详尽深入的研究,然而医疗机构依旧很难从大数据分析上得到收益,并且有人质疑大数据分析对医疗产业转型的作用。调查表明,只有42%的医疗机构采用了严密的决策支持分析方法;只有16%的机构有采用不同分析方法的丰富经验。这意味着医疗产业的实践者们尚未清楚地认识到大数据分析如何为他们的组织创造价值。因此,本项研究的两个主要目标就是识别大数据分析的能力与作用;第二,探索大数据分析带来的潜在收益。

 

2. 背景


2.1 医疗大数据分析系统架构


大数据分析的历史与数据科学紧密相关。“大数据”这个术语是1997年被Michael Cox和David Ellesworth在一篇论文中第一次提出的。大数据分析系统的架构一般包括以下几个部分:


  • 数据层:包含支持日常运营和解决商业问题的各种数据源,涵盖结构化的数据(如电子病历)、半结构化的数据(如健康设备的监控日志)、非结构化的数据(如诊疗影像等)。从内外数据源获取这些数据后,会被立刻存入合适的数据库。

  • 数据集合层: 负责处理来自不同数据源的数据,包括数据获取、转化到存储。数据获取是指读取来自不同信道、频率、大小、格式的数据,  这一步骤通常是实施大数据分析时在早期阶段的难点。在转化阶段,要移动、清晰、分割、转译、合并、分类、验证数据。例如,从医疗信息系统的电子病历中获取的结构化数据要被转化成标准的数据格式,按照特定标准进行分类并按照数据质量标准进行验证,最后被加载进目标数据库(如Hadoop)。

  • 分析层: 负责处理和分析各种信息,这些信息主要分为三类:Hadoop的Map/Reduce; 流计算;以及库内分析。Map/Reduce方法是大量并行式处理环境中批量处理大量数据的常用的程序模式。流计算可以实时或接近实时地高效处理流数据。通过时间序列分析,用户可以动态追踪数据,快速对非预期事件做出反应。例如,在医疗诈骗检测问题中,流计算可以预测非法交易或对客户账户的恶意误用的可能性。交易和账户会被实时分析并产生及时预警。库内分析是在数据仓库之中搭建分析平台进行分析的数据挖掘手段。这种方法有高速并行处理能力强、可拓展性强、安全保密性强等优势。然而,数据仓库中的数据不是实时数据,所以无法进行动态预测。通常,这种方法对于预防性医疗手段和药品管理是有效的。因此,分析层通过分析电子病历、医护模式、医疗体验、患者习惯以及医药记录可以有效地辅助基于实证的医疗实践。

  • 信息展示层: 这一层产生各种可视化报告、实时信息监控以及从分析层得出的商业洞见。对于医疗产业,最重要的输出是实时信息监控和预警、实时数据导航、关键运营绩效指标(KPI)。这些信息只能从手机、个人医疗设备中产生,被发送到监控主板中以实时监控患者的健康、预防医疗事故。

  • 数据统筹管理层: 这一层包含主数据管理(MDM)、数据生命周期管理,以及数据安全和隐私管理。这一层侧重于“如何”利用组织中的数据。主数据管理是数据管理的流程、政策、标准和工具。数据可以通过适合的方式被标准化、清除、涵括,从而产生实时、完整、准确、易用的主要数据来支持数据分析和决策制定。

图2 医疗大数据分析


数据生命周期管理是指管理医疗数据的整个生命周期:从存储、维护数据仓库、测试和部署不同应用系统到删除和处理数据。数据的安全和隐私管理是提供配置评估、监控、审计以及保护等企业级数据活动的平台。由于数据管理的复杂性,组织通常会面对道德、法律法规的数据管理问题。尤其是在医疗领域,为了预防信息泄露和保护患者隐私,对于高度敏感的医疗数据实施严格的数据规则和管控机制是十分必要的。可以通过采取合适的政策、标准和要求,限制用户权限来保证新的系统满足医疗法规要求,为患者信息的合理使用创建一个安全的环境。



 

2.2 医疗大数据分析作用/能力


大数据分析能力指的是管理海量分散数据的能力,让用户可以通过数据分析采取相应措施。相关研究也表明大数据分析能力可以最大化企业商业价值,具体包括将原始数据转化为可用信息的转化速率、及其在整个组织中的普及率。从应用分析的角度,可以将大数据分析分为三个层次,侧重于通过商业分析来实现成本压缩、运营优化、增加盈利和做出目标性投资。从应用优势的角度,将大数据分析能力定义为从历史顾客、现有顾客那里收集大量结构化、非结构化数据来得到支持决策的有用的知识,通过预测性分析预测客户行为,通过提供实时产品服务来保留有价值的客户。从基于资源的理论视角,大数据分析能力是“使用资源来基于IT资产与其他公司资源之间的交互,实施一个商业分析任务。”


在本文中,我们通过信息生命周期管理(ILM)的视角来定义大数据分析能力。通常,系统中任何结构的数据都有其从收集、存储、处理到被分散的一个生命周期,使用政策、流程、实践、服务、工具等来确保信息的商业价值与性价比最高的基础架构一致。因此,在信息生命周期的概念上,我们定义医疗产业中的大数据分析能力为:

获取、存储、处理和分析大量健康相关的各种形式的数据,并且及时地向用户提供有意义的信息来帮助他们发现商业价值与洞见。



2.3 医疗大数据分析潜在收益的概念化


为了明确大数据分析的潜在优势,我们采用了一个多维优势框架来对收集的26个医疗行业的案例进行分解,如下表。其中包含IT基础设施优势、运营优势、组织层面优势、管理层面优势以及战略层面优势。(选择这个理论框架的原因详见原文)

 


本文介绍了大数据分析在医疗领域的背景现状、医疗大数据分析系统的五层架构,并简单介绍了医疗大数据分析的能力以及潜在收益的分析框架。关于具体的研究方法以及分析结果且听下回分解。求知若渴的小伙伴们也可以戳原文提前一睹为快哦。

 


“大数据与数据科学家”公众号

主编:王宏志

特邀副主编: 朱劼

副主编: 丁小欧

责任编辑: 齐志鑫,宋扬,万晓珑、魏龑,张荣恩

编辑: 陶颖安


-精彩内容,记得分享到朋友圈-

长按下图并点击 “识别图中二维码”,即可关注大数据与数据科学家微信公共号 



Copyright © 古田计算器虚拟社区@2017