7种大数据方案重塑医疗行业
医疗行业的数据分析到达临界点
怀疑主义是一把双刃剑。如果没有怀疑主义的话,IT经理可能会去投资那些没有用处的软件。足够的怀疑,可以让IT部门等待足够的证据,以证明特定的平台可以带来好结果。
大数据分析现在已经到达了医疗行业的临界点。一些供应商承诺在减少开支的同时,会提供更好的医疗质量,但有证据表明这些说法是有争议性的。同样,一些大数据运动的批评者指出,医疗行业在开展大的项目之前,可以从小数据集榨取情报。
举例来说,在最近的一篇博客文章中,顾问兼医学博士David C. Kibbe和Vince Kuraitis争论说道,运营商最好专注于使用小数据,而不是屈从于大数据分析的诱惑力。换句话说,集中于临床上已有的以数字化的形式保存的数据,致力于使用那些直接适用于护理管理的IT工具。
另一方面,大数据分析试图从许多不同的来源,解析成堆的数据,试图发现那些对于解决问题来说有用的模式。例如,研究人员采用了大数据的方法来研究遗传和环境因素在多发性硬化症上的表现,从而寻找个性化的治疗方法。
一些研究可能会带来令人兴奋的回报,但IT公司已经迫不及待了。就像Kibbe 和Kuraitis指出的,科技公司都在鼓吹大数据分析是医疗保健系统必须具备的,而医生群体的目标是成为可信赖的医疗机构或者在纳税人的支持下,成立像ACO类似组织。由于这些ACO和医疗机构尝试得到共享储蓄或金融风险的合同的利润,这些大数据支持者声称,大数据可以帮助他们整合数据,使得质量提高的同时,能够降低成本。
一些供应商已经在病人护理方面使用大数据。据《商业周刊》的消息,许多供应商正在转向如微软、SAS、IBM、戴尔和甲骨文这样的公司,去获得数据挖掘的专业知识。医疗保健分析是一个不断发展的业务。Frost&Sullivan的研究显示将有一半的医院在2016年使用先进的分析软件,而现在是10%。
医疗服务提供者已经为大数据分析做好准备了么?他们能够对更有限的数据分析功能内置到他们的电子病历系统和指向新政策和程序的关系数据库感到满意么?
在最近接受《信息周刊》医疗保健栏目采访时,说到权衡大数据和小数据,国家健康协调IT办公室的前负责人大卫·布卢门撒尔表示:“这不是一个选择问题。大数据是从小数据开始的。我们有更多关于健康、疾病以及护理模式的信息,这些信息将给我们提供有益的见解,告诉我们什么在起作用,什么却没有以及什么是疾病的自然史。它使我们能够更快、更有效地做研究......但是我们会需要一段时间,才能弄清楚如何使用这些数据。
听到许多大数据评论家的质疑,Blumethal说:“我们坚信科学提供了机遇,同时大部分时间证明,我们的信念是正确的。”
从这个角度出发,笔者总结了7家公司以及大型医疗中心的工作,指出他们已经在做类似的尝试。
Explorys
克利夫兰诊所的产品Explorys,提供了一个基于云的性能管理平台,给医疗服务者提供临床、财务和运营方面的数据管理,这是以前从未有过的模式。在它的客户中,有圣若瑟卫生系统、MedStar和天主教健康伙伴。
与老派的依赖于关系型数据库的分析方法不同,该公司的服务依赖于Cloudera公司。这是一个基于Hadoop的软件的服务公司,可以帮助工程师和信息专家处理做繁重的工作。
Explorys平台允许供应商做三件事情:在患者人群和保健场所搜索,以帮助确定疾病的发展趋势;坐标规则驱动的病人登记;性能指标——如果一个组织打算满足ACO的要求的话,这是一个关键因素。
当然,如果它不产生过硬的数据,去表现出更好的医疗质量并降低成本,这一切努力都是毫无意义的。
Explorys的首席医疗信息官兼医学博士Anil Jain解释说:“因为该公司相对来说比较年轻,还尚未产生这些结果。换一句话说,没有证据证明,它可以减少糖尿病患者截肢的人数或减少先天性心脏疾病的患者死于心肌梗死的数量。
但Explorys所产生的数据表明,它正在接近这一目标。例如,在与辛辛那提天主教健康伙伴合作时,分析平台有助于提高肺炎疫苗14%的接种率,乳癌筛检率增加了13%,增加了糖尿病患者3%的糖化血红蛋白检测率——这是一个长期血糖控制的衡量标准。
美国医学信息学协会杂志(哈福)最近在一份报告中概述了Explorys的项目,它从几个不同的医疗保健系统近100万患者的电子病历中收集数据。分析可以帮助医生找出那些位于四肢和肺部中最危险的血液凝块。该分析只需花费125小时,所需的也是最少的人力。这样一个分析项目,使用传统的研究方法的话,通常需要几年时间才能完成。
Humedica
Humedica提供了一个基于云计算的人口分析系统。它连接了患者在不同的医疗设置产生的信息——门诊和住院病人以及时间段产生的病人的护理的纵向视图。公司拥有30多个国家近25万患者的数据,可以使得个人化的客户与一个非常大的人口数据来比较他们的身体性能。
该公司的服务整合、标准化和验证临床数据,是从护理的不同层面开展的,不仅包括药物治疗、实验室检测结果、生命体征、人口统计、住院和门诊,也包括医生的笔记和实验室检测结果,结构化和非结构化数据均得到了利用。它的客户基础来自四大类:综合交付网络(IDN)、大型学术医学中心、多医院的医疗系统和多实践的大医疗集团。
一个典型的例子:中哈得逊医疗集团的以病人为中心的医疗家已经使用Humedica的MinedShare分析服务,来衡量其患者群体,并将其与行业最佳实践服务做比较。
例如,125-医生的做法是提取糖尿病患者的数据,以确定最近一次问诊时,其HgA1c的读数在7%(小于最佳的血糖控制的迹象)以上,并指出哪个病人在最近一年内没有看医生。因为使用该系统,医院能够关注到这些高危患者,并且保证在该项目开展的前8个月,大约有三分之一的人能够得到至少一次的回访。
在这一组中,有三分之一的患者实现了HgA1c的数字保持在8%以下的目标,60%HgA1c的数字超过9%的患者,正通过频繁的造访初级保健医生,努力降低血糖。
进一步的证据表明,中哈得逊是看中了Humedica MinedShare提供的临床指标的投资回报率,而且现在该供应商已取得了由国家质量委员会(NCQA)颁发的3级识别标志。
InterSystems
InterSystems喜欢提醒医疗服务提供者,即使是大型企业级数据仓库也可能是不够用的,能够在提供高质量的护理并显著节省开支的情况下,提供所有必需的智能。负责保健机构和类似支付的性能模式的出现所需要的智能,目前是最迫切需要的。
InterSystems公司提供的HealthShare医疗卫生信息平台,其内置的有源分析组件,能够解决这个问题。像许多其他大数据供应商一样,收集、聚集、规范化并展示从各种孤岛得来的病人的数据,以帮助决策者提供临床以及财政上的支持。
罗得岛州正在全州范围内使用HealthShare,来促进健康信息的交流,并收集和分析病人的数据。这使得国家的医疗实践队伍能够做临床的总结交流,以改善护理的质量,这是ACOS的一个重要组成部分。
罗得岛州质量协会的首席信息官加里·克里斯腾森,在InterSystems网站上称赞HealthShare,他说:“HealthShare给RIQI提供了节约成本和一定质量水平的护理的服务,这是医生不能从自己的记录中得到的分析结果。”在最近一次接受采访时,克里斯腾森表示:“他的团队使用InterSystems公司的分析工具,得出在罗得岛州超过四分之一的的人口所进行的实验,8%至12%的测试是重复的,医学上来说不必要的。
瑞典也已发觉了使用HealthShare InterSystems的好处,它创建一个900万人口的国家电子病历系统。该系统以浏览器为基础,能够显示病人的人口统计资料、药物清单、实验室数据、过敏和相关信息。
Pervasive
保险诈骗是医疗保健行业最棘手的问题之一,占用了Pervasive大量的时间和精力。Pervasive的DataRush,是一个高速并行数据处理的多核心电脑和多台电脑联网的应用程序框架和分析引擎,可以在服务供应商协同国家机构在检测医疗补助欺诈行为方面,提供帮助。在一个案例研究中,该公司在其网站上强调,Pervasive可以帮助恢复医疗赔偿,而那些本来应该是私人保险公司偿付的。
为了检测欺诈行为,一些服务提供商为了匹配保险文件,使用SQL Server,这是一个长时间的乏味的过程。DataRush快速模糊匹配系统搜索两个数据库,其中一个包含从国家获得的医疗补助的名字,另一个是参加私人计划的病人的名字,最终是为了找到重叠部分。根据Pervasive情况报告,最终的结果是降低运营成本和获得更快的投资回报率。
临床查询
临床查询可能不会有和商业大数据公司相同的利润动机,但可以肯定的是,在尚未开发的医疗数据方面它有自己的优势。
临床查询是一个在贝斯以色列女执事医疗中心使用的医疗信息平台,它能够在降低成本的同时,提高产品质量。为了实现这两个目标,医生不仅需要重点关注坐在他们面前的病人,还有关注那些有着相同病症或情况的人群——所谓的人口健康管理。这一任务需要的数据分析工具,比以往任何时候都复杂的多。
BIDMC的首席信息官约翰·哈拉姆卡,把“进入临床查询”作为一个临床试验或者临床研究商业智能系统。这是一个与拥有病人病历庞大的数据库连接起来的搜索引擎,能够让医院员工测试到底是什么原因导致一种疾病的发生,例如测试药物、饮食或生活习惯这些可能导致疾病发展的变量。
该库包含了220万名患者的200万个数据点,包括药物服用、诊断和实验室值。查询工具能够浏览20000条使用布尔表达式的医学概念。所有的数据被映射到标准的医疗语言代码。例如诊断映射到ICD-9,药物映射到RxNorm代码,实验室数据映射到逻辑观察标识符名称和代码(LOINC)。
在临床查询的帮助下,临床医生或研究人员可以搜索记录,以找出多少名乳腺癌患者也服用ACE抑制剂,这是一类用于治疗高血压的药物。如果药物和恶性肿瘤之间显示出很强的相关性,医院可以做更深入的分析,并建立一个正式的研究项目来做调查。
最终目标是发现一个新的医疗方法,以改善整个乳腺癌患者的生存状况。
哈拉姆卡说:“临床查询的独特之处是,它是完全的自助式服务。我没有必要去聘请分析师。我也不需要从我们的机构审查委员会得到特别许可,就能使用它。”
IBM/Memorial Sloan-Kettering Cancer Center
在纽约电子健康协会最近主办的数字健康会议上,IBM首席医学科学兼医学博士马丁·科恩和纪念斯隆-凯特琳癌症中心(MSKCC)在纽约的首席信息官 Pat Skarulis,提出共同利用沃森超级计算机的大数据处理能力,以帮助肿瘤学家为MSKCC的患者提供更好的服务。
科恩指出,沃森不仅是类固醇的“搜索引擎”,甚至是一个庞大的数据库。 它依赖于并行概率算法来分析在病人的病历和医学文献中数以百万计的网页的非结构化的文本,找到最相关的答案,以诊断和治疗相关的问题。
全球90%的数据在过去的两年被制造出来,80%的数据是非结构化的。 任何一个有着未读医学期刊一大堆的临床医生都知道,收集的大量信息并没有包含在人们所阅读的文献中。
沃森为这些人阅读这些文献,并且提高了速度。
借助自然语言处理 (NLP),计算机不仅翻译出有关条款,以符合临床医生在查询中的搜索条件,同时也了解英语中的成语和其他特殊表现形式。在时间、统计释义和地理空间算法的帮助下,能够在临床医生的问题和收集的大量医疗事实以及理论之间,找到有意义的联系。
Skarulis表示,MSKCC决定与IBM合作,以“打造智能引擎来提供特定的诊断测试和治疗建议”。这两个组织现在将把从MSKCC而来的被称为Darwin的庞大的数据库,与屈臣氏的自然语言处理能力的数据相结合。
IBM正在使用医疗中心所有的结构化的病人的数据和它的NLP工具,致力于将医疗中心的免费文字咨询说明转换成可用的数据。 Skarulis希望推出一项试点工程,使得不久的将来,将允许超级计算机能够为真正的医疗情况而工作。
甲骨文/匹兹堡大学医学中心
匹兹堡大学医学中心(UPMC)在响应大数据倡议方面更进了一步,投资1亿美元建立了一个全面的数据仓库,汇集了整个UPMC、UPMC健康计划及其他关联实体的200多个数据源的数据。
为了收集、存储、管理和分析保持在数据仓库中的信息,UPMC将使用OracleExadata的数据库机,这是一个高性能的数据库平台。运用IBM的COGNOS来做软件商业智能和财务管理。同时运用Informatica的数据集成平台和dbMotion的基于SOA的互操作平台,它集成了医疗机构和卫生信息交流而来的病人的病历。这些工具将管理流经UPMC的业务部门的3.2千兆字节的数据。
我们的目标是帮助医生进入一个更加智能的电子病历时代。比如根据实验室检测结果,关注指标微妙的变化,知晓患者肾功能衰竭的风险,还比如根据患者的遗传基因和临床信息,为乳腺癌患者提供最有效的、同时毒性最小的治疗方案。在乳腺癌这种情况下,大部分工作将通过分析患者群体完成,使得研究人员和医生在一段时间内,关注病人对治疗效果和自己的健康状况做出的反应。
UPMC的官员解释说,他们将开始使用新的分析工具,他们收集的是先前研究的一组140例乳腺癌患者的数据。研究人员已经拥有了这些患者的基因组学和电子病历数据,在寻求理解个人的差别和他们对治疗的反应方面,这给研究人员提供了一个良好的开端。
甲骨文健康科学高级副总裁兼总经理尼尔·克雷申佐说:“创新性对于甲骨文和UPMC来说都是非常重要的,因为他们正在开发的企业医疗分析平台,集成了从临床、基因组学、金融、管理到运营整个组织的数据。所有这些领域都需要他们的工作流程能够提高工作效率,因为这是UPMC要完成的挑战,以应对数据的指数增长。
为了完成排序这个数据挑战,UPMC将广泛的使用Oracle工具,其中包括了Oracle企业医疗分析和Oracle健康科学网。UPMC还将利用“甲骨文融合分析”以及多个组件,比如用甲骨文融合中间件中的Oracle HyperionProfitability和成本管理,来支持以成本为基础的会计;用甲骨文身份和访问管理套件来加强合规性和数据保护。
上一篇: Android面试系列之二