编辑导语:在日常业务中,数据分析可以帮助我们挖掘业务增长点,提升转化效率,等等。那么,如何结合一款0代码机器学习智能工具实现数据分析?本篇文章里,作者结合Amazon SageMaker Canvas这款工具进行了转化意愿预测,让我们来看看他的体验评测吧。
引言
“数据驱动业务增长”是以业务线全链路海量数据的收集、存储、可视化、分析、挖掘作为核心支撑的,需要协同上下游参与且目标一致,最终将数据精准化、精细化为实现商业目的。
一、业务背景1. 业务介绍本产品主要是挖掘孩子的综合素质,覆盖思维、英语、语文等能力,帮助孩子在认识世界、探索世界的同时,打好全方位的能力基础,陪伴孩子共同成长。
2. 商业模式通过低价课吸引用户,经过一些列课程培养和体验服务,最终转化成年课用户。
3. 分析主题转化分析。
4. 现状痛点营销运营的目标不够清晰和聚焦,人效较低。很难快速掌握用户转化的核心痛点,转化率不高。5. 分析目标目前属于发掘的新业务,所以业务需要在招生分析的链路上,想要通过一系列的全面复盘和分析,核心提高转化率。
二、分析思路所有的分析思路都应该以场景作为切入点,以业务决策为终点,因此本次项目梳理了五个步骤:
挖掘业务含义梳理用户行为路径拆分场景特征构建模型预测推动数据决策1. 挖掘业务含义用户旅程图:从用户角度出发,以用户调研和业务场景中发现用户在整个使用过程中的痛点和满意点,思考产品的增长点。
2. 梳理用户行为特征
1)路径拆解
在用户旅程的大框架下,通过对用户行为数据的采集,监测获得的数据进行分析可以让更加详细、清楚地了解用户的行为习惯,将他们的目标、需求与商业宗旨相匹配。
2)用户行为
根据用户旅程的体验中,可以把用户分为三个阶段,其中包含:获客、留存、转化,每个阶段的衡量反应出的分析目标和逻辑则不同。
3. 拆分场景特征
1)相关性分析
主要用于研究用户行为事件的发生对转化的影响程度,针对这一行为特征进行相关性分析,确认导致该行为的影响因素和影响权重。
2)梳理特征(定义数据集)
涉及到原始的数据源,我们需要在亚马逊中找到S3的存储桶,将数据源文件传输至此。
数据源(行为特征):第一版本共梳理了70 特征因子,这一版本是通过产品和业务的直觉梳理和转化有的相关性,通过模型在去做筛选和相关性分析。
S3存储桶:亚马逊的数据源需要借用S3存储桶服务。
数据集:S3存储桶中数据源可以直接同步至画布的数据集,并且可以针对数据预览数据,这点两个功能点很棒,因为正式预览才发现数据源乱码的问题。
三、构建模型预测1. 构建模型
第一步:直接就选择上传的数据集就ok了,这一步非常的简单。
第二步:选择预测的指标很好理解,关键点在于模型的选择,转化预测本质是一个二分类的问题,预期是0-1的一个概率值,实战中选择的【xgboost】模型进行预测,通过和转化率强相关的因子和转化预测分层进行后续的营销策略。
这里的模型选择会根据我的数据集推荐模型,也会有一些内容的引导,不过other的模型有的不可选择,所以默认使用推荐的模型,看下初次效果。
还没有建模时候可以简单对目标的相关性做个分析对比。
2. 模型表现
1)模型能力
处理速度:模型个处理速度在耗时3min左右,还是蛮快的,比较超出预期。
模型得分:模型分数和预期(70-80)相比会较高一些,可能由于数据量级较小,造成数据得分偏高;自建模型训练环境中的F1=0.78、AUC=0.85。
特征分析:这个可以根据转化意愿分值进行查看指标的影响和分布,这个功能是非常棒的,在数据产品视角对模型分析师偏概览的,这个可以细致的挖掘更深层的理解。
2)特征相关性
根据初次筛选,得出一些和转化有显著相关性的指标因子,并且可利用分布情况,分析背后原因。
显著相关性概览:根据是否显著相关性整理一部分比较有趣,可以看出有一些认为有影响因素的其实问题并不大,有的标签其实和转化这个点关系并不强烈,但是可以作何核心的营销因素。
3)相关性排行
根据相关性整理了分值排行,更能直观看到哪些影响因子的重要程度。
3. 数据分析
1)分析理论
卡方检验:着重观察值与理论值的偏离程度,选择的考虑主要是基于特征的二分类问题和相互独立事件居多。斯皮尔曼相关性分析:核心针对两个连续性变量且成线性关系,所以需验证其相关性。2)地域分析
从地域人群量级和转化率上来看,整体手中人群集中在二三线城市,所以在产品的投放和布局中,需针对等级进行策略规划。
3)竞品分析
卡方校验非常显著,从此指标可以看出,用户安装了竞品,直接可以筛选到核心的种子用户,因为该用户对此有强烈的潜在需求。
4)留存分析
这里的留存主要指用户来学习的次数,分析图标看,用户持续学习提现出对产品课程的认可性,非常有利于后续营销转化。
4. 训练模型
1)持续训练
防止数据量稀疏和数据量较小(试用最大100w单元格),所以需要加大数据源的量级,加强预测能力,防止结果的偶然性。
2)模型调优
调整不合理指标,防止特征穿越(比如浏览产品详情页,这种标签穿越特别严重,其实在模型中做预测是不太可取,反而可以成为营销策略的用户标签)。对模型进行合理的剪枝规则,增强模型可解释性(针对特别明细标签,进行归因和聚合)。3)预测模型
重新上传一组数据对模型进行预测,通过预测结果和本地训练集进行比对,准确率在70%左右,整体来说已经不错了,后续可以加大投入力度进行验证和训练,尤其是双向结合的方式,效率会大大提高。
四、推动数据策略
数据分析也好、数据挖掘也罢,只是实现商业目标的手段,真正想赋能业务并且驱动业务,一定要从实际场景触发,找到切入点。
策略一:提效1)用户分层
根据用户的转化意愿预测值,进行用户分层,形成营销SOP清单,可以针对中高意愿以上的的用户进行精准触达,对于大部分销售人员可以减少人工判断成本,优先触达转化意向高的用户,合理分配时间和触达深度,并且可以制定标准的SOP动作,大大提高运营效率。
2)价值收益
提高了80%的人效,人效主要针对单个销售服务的用户比值。
策略二:抓手
1)用户标签
在营销工具中实时更新用户的高意向标签(沟通意愿强烈)或者策略标签(学习能力画像:中),可联动知识库进行组合式营销,为用户解决痛点,提供优质的服务。
比如:用户的能力画像中“思维能力”薄弱,那么可以根据用户在学习过程中哪些思维题做的不好,引导用户如何针对性、系统化的提升,解决核心痛点。
2)价值收益
提高了15%的转化率,转化率=购买年课用户/购买体验课用户。
五、参赛总结1. 产品体验
1)用户体验
① 产品设计
样式上紫色的主色调非常符合当前互联网人的视觉喜爱,紫色本来带有一些神秘感觉,在加上机器学习的加持,整体样式设计很足,而且紫白结合很干净和简洁。
② 产品交互
体验流程很顺畅,用起来很方便,比如在模型全链条是以流式,从选择数据集-构建模型-模型分析-模型评估,整体有从无到有的感觉,使用深度逐渐加深,比较符合预期。
③ 产品友好
功能细节上做的比较出色,感触较深的第一是数据集的预览,这样可以直接看见数据集的概览和样式,线上和本地会有数据解析的格式问题,第二个是模型的推荐,会根据内容的选择推荐相对应的模型,有充足的解释性引导和应用示例。
2)产品功能
模型构建:模型构建速度较快,这个有点超出预期。模型评价:模型分析可以直接查看到相关性已经数据更强的透视能力,这个能力提升了很多效率。3)优化功能
数据集兼容能力:这个针对不同数据源可以在上传做检验和预览,前置风险暴露能力。模型调优能力:增强平台对模型进行调优的能力,比如可以考虑多个特征因子的融合、指标区间分析等。数据源能力:可以把数据源的上传和存储考虑融合在产品内部。2. 心路历程参赛目标:首先想了解一下当前亚马逊的产品力;其次就是想在整个过程中梳理一下分析思路,复盘项目可以增加更多的思考。参赛总结:整体产品体验我觉得还不错,有一点超出预期,后续会持续关注产品,也感谢人人都是产品经理提供本次参赛的机会~本文由 @芥末先生 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
业务增长数据模型(数据驱动业务增长)
2024-11-22 12:56:36 作者:时髦绅士 网址:https://m.xinb2b.cn/life/xwn141120.html
- 生活大爆炸谢尔顿现实情况(为何生活大爆炸改了谢尔顿的原名)
- 2024-11-22为何生活大爆炸改了谢尔顿的原名由吉姆·帕森斯主演的《生活大爆炸》,是一部非常经典的情景喜剧在这部剧中,他扮演的是谢尔顿谢尔顿无疑是一个高智商天才,但是在社交方面,他却显得很无能谢尔顿无疑是《生活大爆炸》最经典的角色之一,这个角色甚。
- 普罗米修斯精神解读(解读安哲罗普洛斯对永恒的理解以及生命的价值)
- 2024-11-22解读安哲罗普洛斯对永恒的理解以及生命的价值西奥·安哲罗普洛斯是希腊国宝级导演,他与苏联导演塔可夫斯基属于同时代人,由于特殊的环境因素影响,其导演之路起步较晚,在35岁才拍摄了自己的第一部电影长片《重建》,不过与塔可夫斯基极为相似的是,他从小便。
- 制作蒸包子多久开盖(制作蒸包子什么时候开盖)
- 2024-11-22制作蒸包子什么时候开盖5分钟再开锅包子蒸熟后不要立马揭开盖子,否则包子容易收缩,要等包子稍微冷却后再揭盖包子是一种饱腹感很强的主食,并且还是人们生活中不可或缺的食物,它是由面和馅包起来的,或者是由素馅做成的,做好的包子皮薄。
- 观众看电影哭得撕心裂肺(你是否真正看懂了哭悲)
- 2024-11-22你是否真正看懂了哭悲#理娱plus计划##哭悲#此时此刻,凌晨一点,我作为平日里最喜欢刑侦、灵异、法医系列等等题材剧迷的女人,竟然看完了2022年度惊悚片《哭悲》这部影片上映后,很多影迷表示失望,甚至骂声一片然而大半夜。
- 热销爆款大全(去年全国叫这个名字的人最多)
- 2024-11-22去年全国叫这个名字的人最多近日,公安部户政管理研究中心依托公安部人口信息管理系统,发布最新全国姓名报告全国户籍人口中,男孩女孩使用频率最高的名字是什么?姓氏分布情况如何?一起往下看:1新生儿姓名用字情况截至2021年12月31。
- 梅州五华旅游景点大全6日游(收藏春节去哪玩)
- 2024-11-22收藏春节去哪玩农历兔年春节即将来临,小伙伴们想好去哪里玩了吗?记者从五华县文化广电旅游体育局获悉,今年春节假期,该县各景区为大家准备了丰富多彩的活动,一起来看看吧新丰寨旅游景区景区内以新丰茶、樟树、沉香、梅片等多类。
- 新车红布一般挂多久(新车挂红布条对汽车风噪有影响吗)
- 2024-11-22新车挂红布条对汽车风噪有影响吗在中国传统文化中,红色寓意着鸿运当头,代表着吉利,可以辟邪,消除霉运等,比如春节贴红色的对联,结婚穿红色的礼服,办寿宴也得大红大紫,高中状元挂红绸,开业大吉拉红横幅等不胜枚举于是乎,人们自然而然地联想。
- 胜率和概率的区别(概率胜率赔率与频率)
- 2024-11-22概率胜率赔率与频率接下来开始《概率、胜率、赔率与频率》系列,先简单解释下这4个词的含义,然后从最容易理解的赔率说起一、概念内涵(1)概率概率,就是大家日常理解的那个概率,我就不用统计学的概念来解释了,那样反倒复杂略举一。
- 羽毛球总决赛2022赛况积分(羽毛球比赛终于要采用11分制)
- 2024-11-22羽毛球比赛终于要采用11分制在羽毛球界喊了许久的11分制,这次或许真的要变成现实北京时间4月3日,世界羽联官网发布公告,表示会在今年5月22日举行年度大会而投票表决是否要采取5局3胜11分制,将成为大会的关键议题事实上,早在20。
- 曾经演喜剧的男人如今身患抑郁症(为了让我们开心)
- 2024-11-22为了让我们开心说起憨豆先生,大家一定都很熟悉罗温艾金森,这是憨豆的原名,其实他是一个博士,但却演了一辈子的傻子他陪我们度过了许多轻松快乐的日子每当咖啡色西装、袜子、皮鞋的人出现,我们都知道憨豆先生出来了他看起来不是。
- 沈阳地铁南延桃仙大街站出口(沈阳地铁二号线南延线有新消息)
- 2024-11-22沈阳地铁二号线南延线有新消息“我宣布盾构施工开始!”11月12日,随着沈阳地铁集团总经理巴放一声令下,沈阳地铁二号线南延线首台盾构机在中铁四局承建的沈本大街站顺利始发,正式开启沈阳地铁二号线南延线隧道区间施工线路信息地铁二号线南。
- 王者荣耀钻石玩家最高等级(王者荣耀玩家账号金币达到99万)
- 2024-11-22王者荣耀玩家账号金币达到99万王者荣耀当中里面有三大通用货币,一个是点券,一个是金币,另一个是钻石点券的主要作用用于购买皮肤金币的主要作用用于购买英雄,而钻石的主要作用用于获取铭文碎片,可以说每一个货币都有自己的主要作用这款游戏目。