网易云社区

个人签名

161篇博客

如何全面提升企业经营的远程决策和分析效率(一)

网易云社区2020-04-09 16:19

一、疫情突发:数据分析提供了怎样的服务与能力

这次我们选择了疫情的案例作为案例和出发点,大家近期对疫情也比较关注,简单来说疫情分为几个阶段,疫情开始、疫情爆发、出现拐点或者下降,比较重要的点是在舆情开始或者爆发之前进行疫情预警,这是第一阶段,防患于未然。

第二阶段大家开始复工了,或者说疫情逐渐好转时慢慢要考虑从疫情防患切换到工作和生活中,这时我们的视角是看企业员工有没有受到疫情的影响,或者受到疫情影响的严重程度如何?



这里截取的案例是疫情爆发以来市面上各种数据产品的更新思路演进,大家从这个演进上可以看出我们整个的分析方法和对数据的应用是逐渐深入的。

起初大家可能都会看丁香园的H5页面,当时看那个页面的时候会发现这个页面非常简陋,主要是确诊案例或者死亡案例这些数字,底下是疫情分布地图,再下面是一些实时报道,最初连趋势图也是没有的,更没有具体到某一个地区的图表了 。

疫情持续爆发的时候,我们会发现市场上的App或其他一些应用中渐渐都有疫情分析的主题栏目了。这时你会发现产品中增加了趋势的分析,但这时还是比较基本的全国和各大省份的趋势图。

图中最右侧是我截图的百度疫情分析栏目页面,这个栏目也经历了好几次改版,从最基本的疫情分析到目前的版本,包括确诊病例和疑似病例的比例,死亡率与治愈率的关系。同时会对湖北和非湖北数据进行对比,还有另一个比较有意思的是它会自动帮你选中所在区域,比如你是浙江的会帮你选中浙江的,让你关注所在区域的疫情。

这是一个非常经典的案例,代表着我们对数据的认识和应用的发展,从最基本的情况关注到大的宏观层面的情况,主要是几个指标的分析对比。



如图,这是我做的一个简单的模板,我在做的时候关注的也是针对疫情的各个维度,对比后我们可以发现之前市面上的疫情数据产品的分析思路还是仅从各个维度来看待疫情,这时带来的价值和洞察相对来说就会比较有限。简单来说,疫情期间,比如一个数字100,到底有什么意义?要放在一个更加宏观的环境里面看。

比如想看不同地区确诊病例与人口的比例,想看确诊病例与城市经济发展的情况,比如拿温州来说,温州疫情早期爆发的情况相对比较严重,为什么?因为温州经济比较发达,温州人在武汉做生意或者工作的比较多,所以我们会发现其实疫情的数据需要结合经济的发展,人口的迁移,人口的比例来看,这时可以得出更多的结论。我们还会看到很多地方的病例到现在可能还是0或者1,如果细想的话,它跟我们的经济发展或者和城市GDP都是有一定的关系的。

这个图我没有做特别多的数据展示,更多的出发点体现在下半部分,即通过全省的数据对比,可以看到不同地区的人口比例,以及不同地区的确诊率。拿湖北举例,武汉是千万级人口,它的数据是什么样,孝感是百万级人口,它的数据是什么样,或者神农架的数据是什么样?

左边是我做的图表分析案例,右边是分析思路,分析思路分为几个板块。第一块,是从汇总角度来看确诊病例、疑似病例、死亡比例的情况;第二块关注的是累计比例和环比数据,中间针对不同维度进行对比,比如对比的角度是死亡率与确诊率的比例关系,新增确诊和新增疑似之间的关系,这时会发现其实从二月十几号开始,甚至更早在2月8号拐点就已经出现了。总结下来,会看到市场上大家对数据的应用是沿着非常清楚的脉络在发展的。

第一步,关注的是一些简单的宏观数字,这时在H5页面就发现只有一个确定的数字,公众会觉得很慌。第二步慢慢随着时间的推移和数据积累,就会进一步发现趋势数据,这时也是相对比较简单的。第三步就是我们现在各类App或疫情分析产栏目上面看到的情况,它把地区的视角也体现出来了,再有一些数据的比例关系也拿出来了,我们可以对比死亡率和确诊率、治愈率的比例关系,对比同一个数值在湖北和非湖北地区之间的数据,还可以查看个人所在地区的对应数据,这是我们现在市场的情况。大家可以发现,数据的应用是从浅入深,从单一的维度向多维度分析发展。

再往后,我们要把疫情的数据与经济发展数据或人口迁徙数据进行对比,这时就会得出更多的结论,它遵循的脉络是维度越来越多,与我们实际生活的关联也越来越多,分析角度也越来越深刻,我们对疫情的认识也在逐步加深。



从这个案例里面主要体现出来什么问题呢?假设现在市面上的产品已经做到第三阶段,我们可以看到不同地区之间的对比,我们可以对各种指标进行分析与对比。可能发展到第四阶段的时候,我们会把这个数据与经济发展数据、与人口数据进行对比,会是另外一种情况。

这一系列分析背后体现的是一种数据的意识,具体表现在两方面:一方面通过数据分析,可以看到世界背后的规律,如果只是简单停留在前两个阶段,只关注宏观数字和趋势分析,这时对世界的认识是相对比较粗浅的,并不清楚疫情对我们的具体影响是什么。可能一开始大家都觉得疫情爆发的很快,但是其实对比查看自己所在地区的数据之后会发现情况还好,比如现在浙江的情况,会发现对你个人的影响没有想象中那么严重。只看数字是一种情况,但是把治愈率或者确诊率进行对比又是另一种情况,所以另一方面我们要从数据里面,从多个角度发现背后的规律,增加我们的认识。

如果从企业的角度,或者从我们日常运营角度来说,就会发现它可以帮你做很多事情。举个例子,以互联网业务对应的市场投放和数据量来说,同样的投放以前点击率很高,突然降低了,如果这时候单独去看降低这一单一维度,其实看不到什么,可能要从渠道上来看,从投放的内容来看,从关键词来看,从其他角度来看,这时才会发现到底是哪个因素带来的影响?是关键词不对,还是流程不对,或者是注册流程是不是有问题?或者渠道信息是否OK。从不同角度才能认识到是哪一个环节带来的影响,所以数据其实要和业务关联起来。

以疫情为例,我们现在看数据的时候,会发现一个关键点,就是数据分析产品会定位到你自己的城市或者区域,比如杭州已经定位到小区单位了,这就是我们所说的业务关联。就疫情对个人的影响来说,全国的数据意义相对有限,个人更加关注的是最小单位比如所在小区、所在城市是不是有影响,关注和自己实际相关联的信息。这个信息就是业务信息,这时才能真的帮助到个人,才能让个人获得具体的认识。

再假如以互联网为例,流量数据关注的是渠道信息,渠道信息是和业务相关联的,这才是数据意识的体现。首先,要有从这个角度来看数据可以帮助你提升认知的意识。第二,要把数据分析聚焦到和业务相关的地方,这就是疫情分析带给我们的启发。



我们再看第二个案例,是复工阶段的一个场景,这是我用有数做的一个简单的分析。第一,现在大家比较关注的也是企业和员工都在做的健康打卡。第二,大家打卡的时候进去之后要看具体信息的情况。

健康管理分成三步,第一步,发放表单,不管是用Excel、企业微信、钉钉或者是企业内部开发的工具;第二步,把打卡信息与其他信息关联起来,比如与员工信息它关联起来,员工信息包括哪些呢?首先是部门的信息,当然这个可能是针对一些较大的企业来说,员工所属部门信息是什么,组织信息是什么,这时才能看到疫情对不同部门的影响,哪个部门受到的影响比较大?哪个部门受影响比较小,这时需要看到数据才行。其次打卡数据还要和返程信息、疫情信息关联起来,这时要从不同的信息侧面找到不同的观察视角。

当企业需要复工的时候,需要将打卡信息与返程表单关联起来看,这时就可以看到哪些员工已经回来了,或者他已经打卡多长时间了,以及他是不是已经达到复工条件了,这时其实是需要将打卡信息和表单信息关联起来分析的。比如我们可以看到员工打卡信息或者返程信息,跟我们的疫情信息关联起来,这时就能看到哪些员工受影响比较大。一般来说,表单或者其他意见信息都可以获取到。

关于分析这部分,我做的比较简单,是部门和区域分析,以及打卡情况。但覆盖了表单分发到关联数据再到数据分析的完整链路。在数据分析基础之上,可以每天把邮件或部门打卡信息发给部门负责人,对没有打卡的员工进行预警,或者某个员工有健康异常情况时,企业也可以提前关注,这就是一个比较完整的链路。

上面这个案例,可以分为四步。第1步,是数据采集的阶段,我们要出个表单或者通过其他方式采集信息。第2步,是数据建模的阶段,相当于把表单信息跟其他信息关联起来,获得更多认识。第3步,是数据分析阶段,通过前两步做好的数据,可以通过部门、区域或者个人,来看到底哪部分受影响程度比较重或者哪部分需要特别关注。第4步,是在此基础上把这些信息定时推送给其他人,或者有预警的时候进行提前干预。

具体来说,到了第3步和第4步,大家就可以get到关键点,各个企业能做的事情也是比较相似的。更重要的是前两步,数据采集和数据建模的阶段。比如数据采集的时候是用Excel或者是用第三方工具,到第2步的时候就比较麻烦,因为员工信息或者其他一些硬性信息存放在其他地方,这时把数据关联起来看趋势并进行比较就会很痛苦。或者在第2步的时候还有一种情况就是存在数据孤岛的情况,员工信息或者其他信息在不同的地方中,这时可能就无法看到部门之间的信息,或者可以看到但是效率非常低,可能需要每天反复导入导出Excel,每天反复手工做,同事还会涉及到权限的问题。因此建议最好在前两步的时候就做到数据建设与业务发展保持一致。采集、建模和分析,缺一不可。在这个场景下,分析相对来说比较清楚,这块的重点在于数据建设要跟上。

数据建设分为两块,第1块是数据采集、建模以及分析,需要做到线上化、规范化,要把不同系统的数据放到一块进行统一的整合和分析。这个阶段需要做的工作还是比较多的,但目前大部分企业还是停留在线下的方式,这时想做分析的话相对比较痛苦的。第2块和第1块也有相似的地方,就是数据最后还是要服务于业务。

我们介绍了两个案例,即疫情的分析以及员工健康管理的分析,应该从什么视角来理解数据建设或数据分析的框架呢?我对数据的理解和对数据的应用,是从两个角度来看。