概括来说,数据科学家(Data Scientist)的职责是能够用数据来描述和解释所发生的现象,并为企业提供最佳的决策。具体而言,基本职责包括:
●与分析相关的数据收集和治理;
●使用各种不同的分析工具发现趋势和数据集之间的关联关系;
●应用统计和预测模型完成数据分析;
●建立可视化的数据展示平台,制作分析报告,完成与用户之间的有效沟通;
●为用户提供最佳的决策方案。
虽然各个行业对数据科学家的要求有所不同,但具备分析思维能力和良好的沟通技巧是数据科学家所必备的最基本素质,这些都需要在实践中不断训练才能提升的。
最后我们来说说数据科学与数据分析和统计学之间的差异。
① 数据科学 vs 数据分析
数据科学与数据分析之间虽然有共同之处,但是对数据科学家的知识储备和工作技能的要求也更高,毕竟两者的薪资有明显差异,图1是数据科学家网站对数据分析师和数据科学家的工作性质描述,简单也易理解。
图1数据科学 vs 数据分析
继续教育可以让我们掌握更多的工作技能,但是,保持好奇心、有逻辑推理的思维能力、对业务的深度理解和具备良好的沟通能力的确是大多数人的短板。只有经过严格的训练和在日常工作中不断历练自己,才能完成向一名合格和优秀的数据分析师和数据科学家的成功转型。
② 数据科学 vs 统计学
网上有关的论述观点很多,但要么是太过专业性用词,要么是太过关注具体的实操工具。图2是科学家咖啡杂志对数据科学家和统计学家的工作性质描述,我觉得讲得很清楚,也容易理解。
图2 统计学vs 数据科学
虽然数据科学源于统计学,但显而易见地说,它已经大大地扩展和超越了后者的工作范畴,真正去服务于企业的商业目标和生产系统,基于解决实际工作中的问题的出发点。在前篇《数据分析要做啥?》的文章中,我们提到数据分析的最高境界是指导性分析:通过建立预测模型,能够告诉用户该做什么,这也是数据科学的精髓所在。因此,只有服务于商业目的的数据分析才具有更大的商业价值和旺盛的生命力。
有关数据科学的介绍到这里就快结束了,可能有读者朋友会问:为什么不讲讲医院管理中的数据科学?的确,在临床数据中有大量的数据科学的应用场景,但是,在医院管理领域,非常遗憾地说,由于体制问题,封闭的数据环境,和长期处于公立体制的医院无论从管理理念到实践,都已经远远落后于其他行业:国内医院甚至连数据分析师的岗位都找不到,更不要说数据科学家了。我一个美国医院的分析师朋友放弃高薪职位,回到国内最前沿城市的三甲医院,竟然不能匹配到相同的职位,因为目前医院体制中根本就没有“分析师”这个职位。
然而,随着新医改的深入和越来越多的数据累计,医院也会逐步认识到数据应用的重要性,只是苦于没有相关的培训机构。但我坚信随着市场上相关培训的普及,未来一定会涌现出越来越多的,具备职业素养的优秀数据分析师和数据科学家群体,他们也将成为医院管理中的一道闪耀光芒!
本文中的内容大多是基于我本人在从业过程中的切身体会和对讨论议题的个人看法,若有不妥之处,敬请谅解,也欢迎在评论区留言。感谢大家的点赞、评论加关注。咱们下期再见!