总之,医疗数据让人“既爱又恨”,爱是因为复杂值得研究;恨是因为太复杂让人烦恼。在讨论数据分析之前,让我们先来认识一下医疗数据。
01数据分布
与自然界和其他行业的数据不同的是,医疗数据并不呈现出正态分布的状态,而是呈现整体资源消耗随着人群年龄的增加而增加(图1),人均医疗资源消耗也呈现同样的趋势(图2),数据来源:美国健康服务和保障中心(CMS)。这种偏态分布的数据却给分析工作带来巨大挑战。
图1 医疗费用 vs 年龄段
图2 人均医疗费用 vs 年龄段
02数据特性
■绝对值:常见于财务统计,比如今年增加了多少收入,是好事,同时节省了多少成本,也是好事,全年呈现亏损状态,是坏事。对于绝对值来说,只要把数据按汇总和平均就可以得出准确结论。绝对值在个案病例中也十分常见,比如某个病人住了多少天院,用了多少药等。
■相对值:由于存在疾病和患者个体的风险差异,有些指标不能简单地把平均值当做好与坏的评价标准,这其中包含对死亡率、平均住院天数和各种费用均值的评价。比如平均住院天数的下降,并不一定是好事,可能是因为收治了病情更轻的病人,牺牲技术和治疗难度,才让住院天数下降。
03数据类型
■临床数据vs管理数据:基于不同的应用目的,我们又将医疗数据分为临床型数据和管理型数据两大类型,两者的应用场景有非常大的差异。
◇临床数据:基于病人的基本信息、治疗信息(诊断、手术、用药)、和相关的临床测量系统(检查、检验、影像科、病理等)所获取的信息,组成了临床数据集。1999年定义大数据的时候,是1G,而今天定义大数据集更是以1T(1000G)以上的数据量起计。人们常常说的医疗大数据指的就是临床数据,由于各种临床测量系统,尤其引入基因信息之后产生海量的数据,加上疾病的复杂性,已经超过传统统计学的数据处理能力,为此临床数据逐渐成为大数据技术应用的广阔天地,包括计算生物、循证医学、临床试验、基因分析等领域
◇管理数据:相对临床数据来说,管理数据的子集就变得非常小了,主要指的是病人的总结性数据(病案首页)、HIS收费信息和流程信息、HRP的物资信息等。这些数据的特征是有规范和结构化的数据格式,现有的信息技术处理起来完全不成问题。虽然每天都在产生新的病人数据,但只是数据量的不断增加而已,所以说,管理数据叫“大量数据”更加妥当。
不过,有一点需要说明的是,由于复杂和多元化的病人和疾病信息,在管理数据分析中,我们仍然可以采用大数据技术,比如利用神经网络技术来建立数学模型,从而提升对疾病风险预测性分析的准确性【摘自中科厚立的疾病风险建模方法】 。有兴趣的读者朋友可以去找资料,在这里我们就不再详细介绍。
■集约型数据:数据特征是数据量足够大,受数据的偏态分布影响相对较小的数据集,比如,医院的CMI、平均住院天数和药品费用等,除非有相关的改进措施,一般情况下,不太会有较大的变化,基本反映了医院的真实情况,比如公立医院绩效考核中的很多指标都是基于医院(而非科室、甚至更小单元)这个大单元的集约型数据的统计值。
■小样本数据:指的是无法满足正态分布、中心极限定理的数据集,一般来说,医疗数据小于30都被认为小样本数据,比如某个医生治疗某种病种的病例只有十几例,就不能简单地用平均值来判断每个病例的对错,因为如果有一两个极值(病人死亡)情况出现,就容易抬高或者压低评价标准,导致失真和偏颇的结论。
小样本数据也常常是临床医生用来“对抗”管理的利器:管理看的是整体,临床看的则是个体,视角不同,得出的结论也各有不同。最好的解决方案是把大家都拉回到对个案病例的同一判断标准之上,才能让临床医生心服口服,达成共识。【摘自中科厚立的疾病风险调整方法学】
04分析目的
本文只涉及管理数据的分析和应用,数据分析是运用专业的分析方法和分析工具,发现数据背后隐藏的规律,通过总结分析得出有价值的信息,为改进和提升的管理决策提供辅助支持(图3),图中显示“洞见”是管理分析的重点,其中包括诊断性和预测性的数据分析:为什么会发生?可能会发生什么?一个是追因溯源,另外一个则是预测未来。
◇追因溯源:临床有询证医学,同理,管理也有询证管理,就是通过既往发生的某些事件来反推出是否因为系统设置的不完善导致的原因。常见的RCA根因分析、SPC统计流程控制分析、FMEA失效和后果分析等都是典型的诊断性分析方法。
◇预测未来:只有准确地预测未来,才能保证有稳定的流程,而只有稳定的流程才能保证质量和高效率。在《医疗精益管理》的一文中,我们知道等待也是一种浪费。在日常工作中,常常因为无法准确预判出患者流量,导致只能安排更多的人员做好等待;常常因为病人的突发情况导致手术暂停,医护只能等待下一台手术等等“司空见惯”的情况。这些都是非增值活动产生的额外成本。随着人工智能技术的日渐成熟和普及医院,预测性模型的精准度也在不断提升,未来在医疗数据分析中应该会涌现出越来越多的预测性分析。
图3数据分析目的
指导性分析是帮助决策者做出决策的过程,也叫决策分析。我们在下一篇《运营管理决策分析》的文章中会专门讨论这种分析方法,这里就不再赘述。欢迎感兴趣的读者朋友继续关注我们。
本文中的内容大多是基于我本人在从业过程中的切身体会和对讨论议题的个人看法,若有不妥之处,敬请谅解,也欢迎在评论区留言。感谢大家的点赞、评论加关注。咱们下期再见!