文 / 66TEAM · 在下
引言:我们在《如何通过留存预测未来DAU与LTV》实现了通过几个曲线上的点来进行曲线拟合的方式来预测之后的留存。有些同学体验过以后就立刻了发现问题所在,通过曲线求解出的留存,往往在7天或者15天以后就变成了负数,这时候对于游戏统计分析来说是没有意义的。这也就是在上文最后结尾,提出的几个思考点,那么本文将着重去讨论这些方面对于预测的影响。
业务模型
我们返回到业务本身来看一看。对于某一日新增的用户来说,在新增之前,或者之后究竟会有哪些因素对于留存会有影响呢?
1.导入之前
我们做一个例子来讨论,假设有一个卡牌游戏,它在11.1导入了400个新增用户,分别来自4个广告导入渠道,A,B,C,D。其中A为MMO网站,B为SNS渠道,C为AN广告联盟,D为其它方式的导入。A导入的用户大部分是喜欢MMO的玩家,而B导入的用户存在较多的跟风用户,C导入的用户存在较多的卡牌用户玩家。其它渠道导入的用户属性未知。不说从数据角度,光从我们体验角度来说,作为一个喜欢MMO的玩家,进入卡牌游戏后,都相较喜欢卡牌游戏的玩家来的流失迅速,单位时间内的流失量更高,即流失率高。
所以我们其实可以看到,导入的渠道用户的质量和属性对于留存的影响是相当大的。
注: 这里忽略过了在导入之前的各个节点的转化,一般说来在广告导入过程中会存在很多的转化节点。有兴趣的同学可以自行扩展考虑。
对于渠道的举例只是一个例子,具体大家可以根据自己游戏实际的属性去进行对应。
2.导入之中
说到导入之中,大家一定会觉得很奇怪,为什么导入的时候会对于流失造成影响呢? 不是越快导入越好吗?
我们来做一个通俗的比喻。
假如一个服务器是一池水,一边在进水(导入新用户),一边在放水(用户流失),而其中的每一条鱼是所导入的新用户。服务器的空间是有限的,一旦鱼太多,那么鱼就没有生存空间(太过用户,服务器对于个人来说没有足够的空间)。如果鱼太少呢,那么两条鱼就很难相遇(用户没有交互)。同时随着鱼 的增加,服务器本身的水位也在不断的上升。最终可能这个池子爆掉(服务器硬件扛不住)。
综合起来,在导入之中影响的因素也相当之多:
A.导入速度
B.服务器物理容纳人数
C.服务器逻辑容纳人数
D.水本身的营养程度
注: 用池子与鱼的理论来解释导入之前,可以这么来比较。这个池子只适合养鲤鱼,但是导入的不一定是鲫鱼。所以导入鱼的种类对于池子生态的发展也是相当重要。
水本身的营养程度较为抽象,可以理解成游戏系统本身对于留存的影响,比如玩法,版本。
3.导入之后
导入之后,我们的游戏用户会不断的成长或者流失,并且进行生命形态上的变化。继续用池子与鱼的理论来说呢,那么就是。有些鲤鱼,吃了很多资源变得原来越大,最后成功越过龙门,化身成龙。同样,我们的用户在经历新手期之后,会不断成长,最终到达稳定期,最后进入流失区。对于一批用户来说,这个属性是相对来说类似的。用户在新手期的流失的概率一般会大于成长或者稳定期。所以对于留存预测来说,这也是影响非常的一个变量。在上一节做数学模型的时候,我们并没有将这个因素纳入考虑之中。
4.综合
综合起来,对于我们留存影响较大的因素包括以下:
导入用户的质量: 一般对于手游来说会分类成激励用户和非激励用户。
游戏本身版本: 不同版本之间的用户差异是较为明显的。
导入速度: 这个因素在本节之中不做讨论,如果有兴趣,各位看官可以自行进行深入考虑。
玩家的生命形态: 新手期,成长期,稳定期。
其它因素: 本篇中也不再讨论其它因素的影响。
如何去修正预测
1.获取更多的留存数据
大家知道两点可以定一条直线,但是3点可以定出来的曲线非常多,所以对于我们上一节的预测来说,3个点所的出来的结果精度是很低的,很难进行一个实际的应用。所以在这里我随意填充了一些数据凑了十天的留存数据。
大家如果有兴趣的话,可以用上一节讨论的方式去求出最后结果。
2.如何处理不同渠道或者不同版本的导入用户?
其实处理方法很简单,分一条不同的曲线出来。当做是另外一款游戏。
对于一个游戏来说留存可以根据导入用户的属性不同可以分成N类,对于手游来说,最普遍的分类维度是激励用户与非激励用户。
思考点: 当一个游戏进行版本迭代的时候,老版本的留存会在新版本的留存趋势会跟随者老版本玩家呢,还是新版本玩家?
3.如何处理处于不同生命形态的用户的留存?
也是一个很简单的处理方式: 对函数进行分段。处于新手期玩家的留存为一个曲线,处于新手期一个曲线,处于成长期另外一个曲线,如果需要继续分下去的话,可以继续划分到付费用户,小R,中R,大R等维度。
那么如何对一个留存曲线进行分段呢? 这里提供三种办法,其中2种是经验之谈,无须过多的进行验证。
A.与数值策划或者系统策划进行讨论,了解他们对于游戏成长的一个设计。
B.目测法/经验判断法
我们再来看一下我之前捏造的这组数据:
从图上可以看出来,1->2天这个时期玩家的流失下降的非常迅速,结合我们实际上对于游戏的理解,我们可以理解基本上在前2~3天,游戏的留存下降的速度是远远高于后续的。从第3天到第十天,我们可以看到下降的趋势相对较缓,这时候我们分出另外一个函数来进行拟合。
于是我们的留存公式就变成了如下:
有兴趣的同学可以将这个留存分段按照第一节的方法进行求解,得出分段函数。
由于这部分我们之前有相关的文章阐述过,所以我就不再赘述了。
C.根据不同阶段用户的表现现进行聚类,得出实际在数据中的分段。
如何根据留存去得出活跃用户统计呢?
这里给出一个Excel表格,还有其他工具,有兴趣的同学可以点击阅读原文下载观察。