申请专栏作者
您的当前位置:主页 > yabo体育平台注册页 > 正文

经典机器学习:如何做到预流失与流失挽回?

来源: 时间:2019-08-07
请点击下面的广告后浏览!

导语:

预流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么;流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。文章介绍了如何通过经典的机器学习(Machine Learning, ML)方法来寻找那些流失可能性比较高的用户、寻找那些回流意愿比较大的用户。运营同学针对这些用户就可以重点干预,降低预流失用户比例,拉高用户的回流比例。 可思yabo88滚球sykv.com,sykv.cn

背景

可思yabo88滚球sykv.com

在日常游戏运营中,我们常常需要提高目标用户的留存率、提高流失用户的回流率、精准运营、节约运营资源。基于以上的述求,我们将经典机器学习实践于预流失和流失挽回两个场景。 内容来自可思yabo88滚球sykv.com

模型整体设计流程图如下: 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

? 可思yabo88滚球-人工智能资讯平台sykv.com

?

可思yabo88滚球-www.sykv.cn,sykv.com

预流失与流失挽回概述

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

1. 预流失 可思yabo88滚球sykv.com,sykv.cn

预流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么。

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

2. 流失挽回 可思yabo88滚球-www.sykv.cn,sykv.com

流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。 本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

获得训练yabo88滚球 内容来自可思yabo88滚球sykv.com

1. 基础yabo88滚球 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

?

可思yabo88滚球sykv.com,sykv.cn

? 本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

基础yabo88滚球是最基础也是最重要的第一步,需要我们去寻找、清洗各种原始yabo88滚球,原始yabo88滚球包括用户的登录yabo88滚球、充值yabo88滚球和用户yabo88滚球几个模块。 内容来自可思yabo88滚球sykv.com

模型训练自然是yabo88滚球越多越好的。 可思yabo88滚球sykv.com,sykv.cn

2. 给用户打标签 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

? 可思yabo88滚球sykv.com

?

可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

预流失,判断用户是否会流失,如果上上周活跃,上周不活跃则是流失用户,label=1;反之上周活跃,则label=0。我们可以以周为单位,读取过去四周、八周或者更多的原始yabo88滚球。 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

在流失挽回场景,label的判断逻辑正好相反,如下图所示 可思yabo88滚球-人工智能资讯平台sykv.com

?

可思yabo88滚球-www.sykv.cn,sykv.com

?

可思yabo88滚球-人工智能资讯平台sykv.com

准备训练测试yabo88滚球 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

1. 训练测试yabo88滚球划分 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

?

可思yabo88滚球sykv.com,sykv.cn

? 可思yabo88滚球sykv.com,sykv.cn

根据自己的yabo88滚球集大小合理的划分出三种yabo88滚球,验证集在训练的时候用于模型调参,测试集在最后的最后模型所有参数设定后用于验证模型效果。 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

2. 正负样本均衡

可思yabo88滚球sykv.com,sykv.cn

如果实际yabo88滚球中正负样本的比例严重不均衡,则有必要处理一下。处理办法是有放回的随机采样,code 示例如下:

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

? 可思yabo88滚球-www.sykv.cn,sykv.com

?

可思yabo88滚球-www.sykv.cn,sykv.com

特征工程 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

1. 特征选取 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

? 可思yabo88滚球-人工智能资讯平台sykv.com

?

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

这里只简单的截取了一些常用到的特征,大家可以根据自己的场景增加各种简单特征、组合特征。日期特征需要注意一下,不同的游戏上线时间不一样、日期格式的yabo88滚球也不方便运算,比如20181231,20190101,20190102其实都只差一天,但是数值上却差了很大,这里我们直接将日期转换成距今天天数,日期yabo88滚球数值化,很方便后续的计算处理。

可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

2. 特征处理

可思yabo88滚球-人工智能资讯平台sykv.com

?

可思yabo88滚球-www.sykv.cn,sykv.com

? 可思yabo88滚球sykv.com

2.1 缺失值填充 可思yabo88滚球sykv.com

在预流失场景中,我们针对登录yabo88滚球、充值yabo88滚球做了填0处理,针对日期时间yabo88滚球做填最大值处理。 内容来自可思yabo88滚球sykv.com

2.2 zscore标准化

可思yabo88滚球sykv.com,sykv.cn

不同特征的取值范围对模型训练的影响不言而喻,我们有必要对许多特征做一次标准化,比如登陆次数、充值金额等等。

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

2.3 onehot处理 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

对于枚举类型的特征,最常用的编码就是OneHot,比如性别。 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

训练模型 可思yabo88滚球sykv.com

1. 模型选择

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

预测流失Score和回流Score有许许多多的模型可以选择,本文以LR为例,早点介绍如何在生产过程中实践经典机器学习算法。LR详细介绍参考以下两个链接 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

Logistic regression Docs 可思yabo88滚球-人工智能资讯平台sykv.com

pyspark.ml.classification.LogisticRegression APIs 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

2. 模型调参 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

使用验证集yabo88滚球对模型进行调参,以下是LR的可配置参数

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

?

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

?

内容来自可思yabo88滚球sykv.com

离线模型评估

可思yabo88滚球sykv.com,sykv.cn

1. 评估指标

可思yabo88滚球-www.sykv.cn,sykv.com

离线评估的指标有AUC、准确率、召回率、F1值 可思yabo88滚球sykv.com

AUC的介绍可以查看博客AUC,ROC我看到的最透彻的讲解,AUC用来衡量一个模型的性能。准确率指的是预测为正样本中有多少是预测对了,召回率指的是有多少正样本被预测出来了。F1值是权衡准确率和召回率的一个数值。准确率、召回率、F1值随阈值的改变而改变,根据产品的实际场景合理的选择阈值。

可思yabo88滚球sykv.com

实现demo,提供三种计算AUC的办法 可思yabo88滚球-www.sykv.cn,sykv.com

? 可思yabo88滚球sykv.com,sykv.cn

?

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

2. 学习曲线 可思yabo88滚球sykv.com,sykv.cn

通过分析学习曲线,可以诊断高偏差、高方差问题

内容来自可思yabo88滚球sykv.com

? 可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com

? 可思yabo88滚球sykv.com

高偏差,欠拟合,随着训练样本数量增加,最后测试集、验证集的误差都停在高位,彼此很接近。

可思yabo88滚球-www.sykv.cn,sykv.com

尝试解决办法:获得更多的特征、增加多项式特征、减少正则化程度λ。 可思yabo88滚球sykv.com,sykv.cn

? 可思yabo88滚球sykv.com,sykv.cn

? 可思yabo88滚球sykv.com

高方差,过拟合,测试集和验证集的误差逐渐接近,但还是有一定的距离,随着样本数的增加误差正在逐渐趋于稳定。

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

尝试解决办法:更多的训练样本、减少特征的数量、增加正则化程度λ。 可思yabo88滚球sykv.com

预测yabo88滚球 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

1. 获得预测yabo88滚球

本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

预流失场景中预测yabo88滚球为本周活跃的用户,预测其是否会在下一周流失;流失场景中预测yabo88滚球为本周流失用户,预测其是否会在下周回流。

可思yabo88滚球-www.sykv.cn,sykv.com

2. 预测yabo88滚球分组

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

? 可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

?

内容来自可思yabo88滚球sykv.com

首先,将预测yabo88滚球分成模型预测、随机两组,模型预测组用模型预测Score值,随机预测组用rand的方法输出Score值,再比较Score值与阈值的大小来判断当前样本为正或者负;

可思yabo88滚球-www.sykv.cn,sykv.com

然后,将预测后的yabo88滚球分成2*2组,一个是线上干预组,另一组是线上不干预的对照组,用于对比线上干预的效果。 本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

3. 上线效果分析 可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

?

可思yabo88滚球sykv.com,sykv.cn

? 可思yabo88滚球-www.sykv.cn,sykv.com

如上图所示,效果分析分为模型效果和干预效果两个维度

可思yabo88滚球-人工智能资讯平台sykv.com

3.1 模型效果

可思yabo88滚球sykv.com,sykv.cn

分析模型效果时我们需要控制变量,排除干预、不干预的影响。预期模型预测的准确率普遍要好于随机预测的准确率。

本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

同干预的情况下,对比A组和C组的准确率;同不干预的情况下,对比B组和D组的准确率

本文来自可思yabo88滚球(sykv.com),转载请联系本站及注明出处

3.2 干预效果 可思yabo88滚球-www.sykv.cn,sykv.com

同样需要排除不同策略预测的影响,预期干预组的留存率或者回流率要普遍好于对照组的留存率或回流率。 可思yabo88滚球-人工智能资讯平台sykv.com

同模型预测情况下,对比A组和B组的留存率;同随机预测模型情况下,对比C组和D组的留存率

可思yabo88滚球-AI,sykv.com人工智能,深度学习,机器学习,神经网络

小结

可思yabo88滚球-AI,sykv.com智能驾驶,人脸识别,区块链,大yabo88滚球

将全流程串起来,给出如下demo

可思yabo88滚球-人工智能资讯平台sykv.com

?

可思yabo88滚球-yabo88滚球挖掘,智慧医疗,机器视觉,机器人sykv.com


作者:腾讯技术工程

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片 匿名?

关于我们?? 免责声明?? 广告合作?? 版权声明?? 联系方式?? 原创投稿?? 网站地图??

Copyright?2005-2019 Sykv.com 可思yabo88滚球 版权所有 ?? ICP备案:京ICP备14056871号

人工智能资讯?? 人工智能资讯?? 人工智能资讯?? 人工智能资讯

?扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭