游戏快报

如何利用分类算法提升免费增值转化率

如何利用分类算法提升免费增值转化率

本文译自mobiledevmemo,作者Eric Benjamin Seufert,为GRG游戏研究组的独家供稿,未经授权请勿转载。

考虑到免费增值模式从根本上的低转化率。优化收入可以被看作是一个目标训练:营销活动目的是非常明确的,达到最大可能的转换,降低漏斗的尺寸或有针对性的营销活动,增加漏斗的尺寸。最有效的转化则是尽早在产品上线期间就使用某种分类算法。

通常使用的营销手段为网络效应,病毒式传播营销,和产品组合力度。另一个选择——用一种更广泛的营销漏斗对用户进行分类,潜在付费用户或非付费用户——在大多数情况下比第一种更适用。但分类算法很容易在免费增值中随意实现,特别是在大量小于10%的低转换率的情况下。

免费增值分类算法所带来最基本的问题是容易被转换数据,增加它的基本比率错误。因为免费增值的转化率很低,有付费意愿的用户概率也是非常低的。如果一个产品有5%的转换率,假设简单地划分每一个用户没有潜在付费的意愿,那么分类算法95%是正确的。

另外一个更敏感的,分类器(算法)的问题是如何梳理混乱的数据。鉴于该免费增值可盈利用户群占有非常少的部分,数据很容易被认为是非付费用户毫无意义的混杂。但这样做又会导致另一个问题:从丢弃付费用户的数据范围来看(即非付费用户数据),将作为更大的用户基数,而不是它所代表的很小部分。这很重要,因为它是构成分类的基础,它可以计算用户付费转化的条件概率。

两个条件概率语句:

1406647524626352.png
在Y事件发生的情况下,X事件发生的概率

1406647525848241.png
在X事件发生的情况下,Y事件发生的概率

这两个条件概率并不一定是相等的 – 也就是说,不能说是P(X | Y)= P(Y | X)。贝叶斯定理指出,P(X| Y)的计算公式为:

1406647526298375.png

大多数分类系统使用的人口数据,为付费用户/大量非付费用户建立的用户图表;在移动端,相对于地理位置和设备类型人口数据往往是没有更多的信息,下面的用户群:

1406647527160079.png

应用上述的条件概率格式,对上述数据集的分类系统尝试建立规则,以识别两个条件概率:

1406647527145477.png
满足某些(配置)条件的用户成为付费用户的概率

1406647528913126.png
付费用户满足某些(配置)条件的概率

第二个条件概率语句是非常吸引人的,但最终毫无用处:美国iPhone付费用户数,11位, 22位付费用户的50%,但是这些信息没有影响特定新用户是否会转换(例如,相对于加拿大 iPhone 转换率,美国的 iPhone 转换率是较低)。

换句话说,通过付费范围分类付费用户/非付费用户(500个用户中总共22个付费,或比例为4.4%),该分类系统 – 使用什么似乎合理的逻辑 – 完全歪曲了转换的概率。

使用人口统计数据来建立这样一个忽略基础利率的分类模型——也就是,免费商业模式的基本转换利率——可能会误导营销支出。在上述情况中,针对美国iphone用户在营销活动预算分配方面的增长。可能由于一个错误的转化条件概率引起。

在免费增值模式中普遍低转化率加剧了这一问题:关于产品的用户基础,庞大的用户基数和少量付费用户数可以促使错误的比较和华而不实的结论。