39问医生测评中所用方法的答疑(三)

作者Dr.2,珍立拍股份公司董事长     

       

在本文开头,我们要对628日发布的“39健康网之前世今生”一文中对39健康网的可能考证失误进行道歉。从股权结构来看,西藏数联持有广州启生45%的股权,它有可能是IDG在西藏注册的投资机构,可能主要为了税收和政策优惠等原因吧。因为数联这个名字的意思是“数据连接”,与IDG的全名美国国际数据集团(International Data Group)有含义上的关联。因此,虽然目前我们并没有查询到公开的西藏数联和IDG有关系的相关信息,但是我们有理由相信西藏数联大概率上可能就是IDG的关联公司。

但是我们还有一个质疑,按照39健康网的公开数据,2013年总收入超过1.07亿元,较2012年的6455万元增长66%,网站净利润近3572万元,同比增长264.5%2014年预计净利润突破4500万元。它每年都有非常健康的财务现金流,且能获得几千万的盈利,那为什么评估值(应包含账上现金和应收应付)还没有超过一年的利润?可能是赚来的钱每年都基本上被分红分掉了。一般情况来说,对于有很大发展的行业,企业在有稳定收入的时候会持续进行大投入来进行业务扩张,即使没有现金也会通过融资、贷款等方式进行。39健康网每年的利润就已经超过评估资产值了,它没有继续进行大规模扩张的原因(甚至移动端团队的业务做的如此之糟糕,非但没有进行修补,而且还继续放任自流),会不会是他们的业务已经进入了防守期,业务已经有了瓶颈,因此他们现在的想法是不求支出成本,只求最大的收入回报,然后来进行股东套现?会不会是已经看到自己业务的边界?这点值得我们深思。

上周末,我们有关于39问医生的调研文章和测评报告发出之后,有上百的读者朋友来加Dr.2的微信,我们进行了大量的交流,我收益良多。所以我汇总答疑并进行一些勘误,集中回复一些共性问题以拯救我脆弱的手指和迷离的眼睛。

有很多读者问我,你的测试方法中有一个是,用四个账号在“39问医生”中测试同一个问题,然后四个医生给了不同的回答,由此你就得出相应的判断,会不会太武断了?在测评报告中,限于时间和篇幅,Dr.2没有说明我们为什么这么做。因此,今天我就来系统性的讲述一下所用的方法和这么做的原因。

首先四个手机用不同账号在同一时间测试同一个问题,这根本不是为了测试医生的回答质量,然后从中挑医生的毛病,大批读者误解了。我们的目的是:

1. 测试在同一平台上,在同一时间,在同一个科室内,根据同一问题,获得答复之间的时间差,以及参与回复的医生的数量,并且查看医生是否有循环回答的情况。通过在同一科室内的反复测试就可以知道在这一时间段,平台上这一科室内真实有效的活跃医生的数量。在测试某雨和某大夫平台,我们同时用六个手机。

2. 随后,我们同步测试这一平台上所有的十几个科室,取加权平均,就可以进一步推测这个平台上这一时间内总活跃(所有科室)的医生的数量。

3. 最后,取多天多点时间,就可以大致推算出这个平台目前为止总活跃用户的数量和活跃程度(使用时间,因为我们在测评中发现有些医生总是在线,有些总是不在)。

而且用四个手机在同一时间提问同一个问题,不是为了测试医生的水平,会不会误诊。因为一般进行轻问诊的患者并不会有太严重的疾病,使用简单的文字描述和简单的图片描述,通常不会出现重大误诊,其实上面四个医生回答的都有道理。但由于没有进行规范病历采集,很难使医生准确了解疾病情况,问完之后再提问,回答然后再提问,但是这种问诊方式到底有多大用处,我们也保持很大的怀疑性。测试也是为了寻找轻问诊这种方法本身存在的系统性问题。同时我们可以看出这种单纯的问诊模式并不会具备多大的用户黏性。要想获得大量用户的使用,需要持续而巨大的市场营销投入。

我们在测试的时候,发现有些医生活跃的时间在上午,有些在下午,但是绝大多数的医生活跃时间都在中午12~1点多,以及晚上10点之后。所以我们推算出医生并不会在工作的碎片时间内来使用产品,而是多数在自己的个人休息时间段使用,因此这两个时间段是有效时间段。根据统计学分析,我们先做散点构图,得出医生活跃数据数量的分布图,随后我们可以反向推演出医生大致活跃的时间,然后我们进行分组和配对,避免以偏概全(防止有些人会觉得我们会不会选择一个医生不活跃的时间段来进行测试)。我们一般性选择极度活跃时间来测试,以上限来进行推定。

等到了我们要进行测试计量的时间段之内,我们进行测试的不同分组内还会有一些活跃的细微的差别。周末、节假日、工作日等因素都会导致结果之间有差别。因此在做分组统计之前,按统计学的方式,我们要做均衡性检验,查看分组检验和前后时间段中的样本是否足够,是否有代表性等。上期的测评我们没有介绍这些,但是我们是严格按照这个方法来做的。皮肤科和眼科是以形态学为主的科室,比较适合我们进行测试,急救可能会包括一些发烧,损伤等情况,慢性病又是涉及患者最多的,妇产科等又是涉及隐私最多的,比较容易在网上活跃,因此我们选择了有代表性的去测试,但是限于篇幅,只能公布几个。我们使用均衡性检验的目的是多点取样,多重因素回归,避免单一分析出现较大误差。

还有,我们可能从之前的测试中推断出某个科室的某个医生是非常活跃用户,然后我们为了反过来验证其是否是重度活跃用户,我们会把某个问题问这个科室的医生,再把同样问题问其他科室的医生,把其他科室医生的问题再拿回来问这个科室的医生等等,这是一个数学上循环代入、验证测试的方法。将之前推断出的活跃医生和重度用户进行反向推测验证,再将多个测试点的情况进行带入情况进行加权平均,看是否符合我们之前猜测的数学模型,是否需要修订结果,然后结果还要再取多次加权平均。同学们,你们被绕晕了吗?统计学就是这个德性,想要不被人质疑,就得多下功夫,多采集数据。

那么我们为什么要测医生流量呢?因为我们需要依靠医生流量来推测患者流量。我们不知道该平台覆盖的患者数量,但是患者是来这个平台是咨询医生的,所以我们可以根据这个平台上现有活跃医生的数量,计算出这个平台在某个时间内所能接待的最大患者数量,用这种方法进行反向推定上限。换句话说,根据平台上的医生数量,那每天有多少患者流量的上限肯定是能算出来的,这是使用间接法来测量。

为了便于理解,我给大家举一个我的孩子参加小学生奥数培训的一道题目来类比,用数学上行船顺流逆流的问题演算方法来进行患者流量的判断。顺流逆流其实是一个数学思想,我们并不知道目前水流的速度和我的船速,但是顺流速度=船速+水速,逆流速度=船速-水速,因此根据船分别在顺流和逆流中行进到达某目标的时间不同,我们就可以通过公式计算得到我们的船速和水流速度,或者两者的关系。在我们的流量测试中,这个概念是相同的——我不知道某具体流量情况如何,但是我们可以通过多点取样,反复代入来对相对的情况进行推测。

在对轻问诊平台做测试的时候,平台越大,我们的工作量就越大,耗费时间就越多。由此我们可以看出,做一个规范压力测试消耗的人力是非常巨大的,而这还只是整个产品测试的一部分而已。这就是为什么我们的6人测试团队用了一年多的时间也只测试了不到60个应用的原因,而且还要不断与时俱进,还需要反复不断验证避免偏差。为了测试收费平台,我们还注册了很多账号,花费了不少成本,而这些都会被统计成他们的收入,但是实际上是我们测试用的。在测试的时候,我们为了保护医生隐私,会将他们的头像和人名等敏感信息隐去,这也是对他们的尊重



上期我们用了易观国际4健康医疗APP活跃用户数统计图,下面我们结合5月份的数据统计图来看,第一名的春雨从4月的92.7万的月活下降到5月的84.2万, APP用户增速从29.2%变成增速-9.13%,其它产品的5月活跃用户数和APP用户增速相较4月,也都是呈下降趋势的。由此我们可以判断目前很多健康医疗APP流量都在往下走,原因是目前行业内新生公司的发展速度较快,竞争越来越激烈。月活第六名以下平台的数据情况早就已经惨不忍睹了,不管承认还是不承认,他们都已经没有太多的统计意义了。目前整个行业已经被引爆,未来会进入一个持续多竞争格局的发展态势。


 

(欢迎转载,注明作者和来源即可,愿意与Dr.2交流的请加微信号:2823095726)


浏览次数:634次