编辑导语:在日常业务中,数据分析可以帮助我们挖掘业务增长点,提升转化效率,等等。那么,如何结合一款0代码机器学习智能工具实现数据分析?本篇文章里,作者结合Amazon SageMaker Canvas这款工具进行了转化意愿预测,让我们来看看他的体验评测吧。
引言
“数据驱动业务增长”是以业务线全链路海量数据的收集、存储、可视化、分析、挖掘作为核心支撑的,需要协同上下游参与且目标一致,最终将数据精准化、精细化为实现商业目的。
一、业务背景1. 业务介绍本产品主要是挖掘孩子的综合素质,覆盖思维、英语、语文等能力,帮助孩子在认识世界、探索世界的同时,打好全方位的能力基础,陪伴孩子共同成长。
2. 商业模式通过低价课吸引用户,经过一些列课程培养和体验服务,最终转化成年课用户。
3. 分析主题转化分析。
4. 现状痛点营销运营的目标不够清晰和聚焦,人效较低。很难快速掌握用户转化的核心痛点,转化率不高。5. 分析目标目前属于发掘的新业务,所以业务需要在招生分析的链路上,想要通过一系列的全面复盘和分析,核心提高转化率。
二、分析思路所有的分析思路都应该以场景作为切入点,以业务决策为终点,因此本次项目梳理了五个步骤:
挖掘业务含义梳理用户行为路径拆分场景特征构建模型预测推动数据决策1. 挖掘业务含义用户旅程图:从用户角度出发,以用户调研和业务场景中发现用户在整个使用过程中的痛点和满意点,思考产品的增长点。
2. 梳理用户行为特征
1)路径拆解
在用户旅程的大框架下,通过对用户行为数据的采集,监测获得的数据进行分析可以让更加详细、清楚地了解用户的行为习惯,将他们的目标、需求与商业宗旨相匹配。
2)用户行为
根据用户旅程的体验中,可以把用户分为三个阶段,其中包含:获客、留存、转化,每个阶段的衡量反应出的分析目标和逻辑则不同。
3. 拆分场景特征
1)相关性分析
主要用于研究用户行为事件的发生对转化的影响程度,针对这一行为特征进行相关性分析,确认导致该行为的影响因素和影响权重。
2)梳理特征(定义数据集)
涉及到原始的数据源,我们需要在亚马逊中找到S3的存储桶,将数据源文件传输至此。
数据源(行为特征):第一版本共梳理了70 特征因子,这一版本是通过产品和业务的直觉梳理和转化有的相关性,通过模型在去做筛选和相关性分析。
S3存储桶:亚马逊的数据源需要借用S3存储桶服务。
数据集:S3存储桶中数据源可以直接同步至画布的数据集,并且可以针对数据预览数据,这点两个功能点很棒,因为正式预览才发现数据源乱码的问题。
三、构建模型预测1. 构建模型
第一步:直接就选择上传的数据集就ok了,这一步非常的简单。
第二步:选择预测的指标很好理解,关键点在于模型的选择,转化预测本质是一个二分类的问题,预期是0-1的一个概率值,实战中选择的【xgboost】模型进行预测,通过和转化率强相关的因子和转化预测分层进行后续的营销策略。
这里的模型选择会根据我的数据集推荐模型,也会有一些内容的引导,不过other的模型有的不可选择,所以默认使用推荐的模型,看下初次效果。
还没有建模时候可以简单对目标的相关性做个分析对比。
2. 模型表现
1)模型能力
处理速度:模型个处理速度在耗时3min左右,还是蛮快的,比较超出预期。
模型得分:模型分数和预期(70-80)相比会较高一些,可能由于数据量级较小,造成数据得分偏高;自建模型训练环境中的F1=0.78、AUC=0.85。
特征分析:这个可以根据转化意愿分值进行查看指标的影响和分布,这个功能是非常棒的,在数据产品视角对模型分析师偏概览的,这个可以细致的挖掘更深层的理解。
2)特征相关性
根据初次筛选,得出一些和转化有显著相关性的指标因子,并且可利用分布情况,分析背后原因。
显著相关性概览:根据是否显著相关性整理一部分比较有趣,可以看出有一些认为有影响因素的其实问题并不大,有的标签其实和转化这个点关系并不强烈,但是可以作何核心的营销因素。
3)相关性排行
根据相关性整理了分值排行,更能直观看到哪些影响因子的重要程度。
3. 数据分析
1)分析理论
卡方检验:着重观察值与理论值的偏离程度,选择的考虑主要是基于特征的二分类问题和相互独立事件居多。斯皮尔曼相关性分析:核心针对两个连续性变量且成线性关系,所以需验证其相关性。2)地域分析
从地域人群量级和转化率上来看,整体手中人群集中在二三线城市,所以在产品的投放和布局中,需针对等级进行策略规划。
3)竞品分析
卡方校验非常显著,从此指标可以看出,用户安装了竞品,直接可以筛选到核心的种子用户,因为该用户对此有强烈的潜在需求。
4)留存分析
这里的留存主要指用户来学习的次数,分析图标看,用户持续学习提现出对产品课程的认可性,非常有利于后续营销转化。
4. 训练模型
1)持续训练
防止数据量稀疏和数据量较小(试用最大100w单元格),所以需要加大数据源的量级,加强预测能力,防止结果的偶然性。
2)模型调优
调整不合理指标,防止特征穿越(比如浏览产品详情页,这种标签穿越特别严重,其实在模型中做预测是不太可取,反而可以成为营销策略的用户标签)。对模型进行合理的剪枝规则,增强模型可解释性(针对特别明细标签,进行归因和聚合)。3)预测模型
重新上传一组数据对模型进行预测,通过预测结果和本地训练集进行比对,准确率在70%左右,整体来说已经不错了,后续可以加大投入力度进行验证和训练,尤其是双向结合的方式,效率会大大提高。
四、推动数据策略
数据分析也好、数据挖掘也罢,只是实现商业目标的手段,真正想赋能业务并且驱动业务,一定要从实际场景触发,找到切入点。
策略一:提效1)用户分层
根据用户的转化意愿预测值,进行用户分层,形成营销SOP清单,可以针对中高意愿以上的的用户进行精准触达,对于大部分销售人员可以减少人工判断成本,优先触达转化意向高的用户,合理分配时间和触达深度,并且可以制定标准的SOP动作,大大提高运营效率。
2)价值收益
提高了80%的人效,人效主要针对单个销售服务的用户比值。
策略二:抓手
1)用户标签
在营销工具中实时更新用户的高意向标签(沟通意愿强烈)或者策略标签(学习能力画像:中),可联动知识库进行组合式营销,为用户解决痛点,提供优质的服务。
比如:用户的能力画像中“思维能力”薄弱,那么可以根据用户在学习过程中哪些思维题做的不好,引导用户如何针对性、系统化的提升,解决核心痛点。
2)价值收益
提高了15%的转化率,转化率=购买年课用户/购买体验课用户。
五、参赛总结1. 产品体验
1)用户体验
① 产品设计
样式上紫色的主色调非常符合当前互联网人的视觉喜爱,紫色本来带有一些神秘感觉,在加上机器学习的加持,整体样式设计很足,而且紫白结合很干净和简洁。
② 产品交互
体验流程很顺畅,用起来很方便,比如在模型全链条是以流式,从选择数据集-构建模型-模型分析-模型评估,整体有从无到有的感觉,使用深度逐渐加深,比较符合预期。
③ 产品友好
功能细节上做的比较出色,感触较深的第一是数据集的预览,这样可以直接看见数据集的概览和样式,线上和本地会有数据解析的格式问题,第二个是模型的推荐,会根据内容的选择推荐相对应的模型,有充足的解释性引导和应用示例。
2)产品功能
模型构建:模型构建速度较快,这个有点超出预期。模型评价:模型分析可以直接查看到相关性已经数据更强的透视能力,这个能力提升了很多效率。3)优化功能
数据集兼容能力:这个针对不同数据源可以在上传做检验和预览,前置风险暴露能力。模型调优能力:增强平台对模型进行调优的能力,比如可以考虑多个特征因子的融合、指标区间分析等。数据源能力:可以把数据源的上传和存储考虑融合在产品内部。2. 心路历程参赛目标:首先想了解一下当前亚马逊的产品力;其次就是想在整个过程中梳理一下分析思路,复盘项目可以增加更多的思考。参赛总结:整体产品体验我觉得还不错,有一点超出预期,后续会持续关注产品,也感谢人人都是产品经理提供本次参赛的机会~本文由 @芥末先生 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
业务增长数据模型(数据驱动业务增长)
2024-11-22 01:14:35 作者:时髦绅士 网址:https://m.xinb2b.cn/tech/xwn141120.html
- 对永磁材料的性能要求有哪些(永磁材料有哪些)
- 2024-11-22永磁材料有哪些1.磁铁的历史:磁铁越来越广泛地被使用从高科技产品到最简单的包装磁体,钕铁硼磁体和铁氧体磁体是目前使用最广泛的磁体从发展史的角度中号agnets,在19世纪末和20世纪初,人们主要用碳素钢,钨钢,铬钢。
- 纪晓岚最大的官职
- 2024-11-22纪晓岚最大的官职原名纪昀,字晓岚,清朝乾隆年间著名大臣,在很多影视剧中,他都是聪明智慧的象征,与贪污成性、狡诈奸邪的和珅形成鲜明的对比,也因为此,他常常被刻画成和珅的死对头但事实上,纪晓岚与和珅并没有可比性,如果了解。
- 哪些地方是属于东南沿海
- 2024-11-22哪些地方是属于东南沿海位于我国东南沿海地区包括了福建省全省、浙江省南部地区以及广东省潮汕市其中东南沿海地区主要再福建省境内,浙江和广东也有部分海域属于东南沿海。
- 黄维语录(有些梦想可能只是平日里的一句玩笑)
- 2024-11-22有些梦想可能只是平日里的一句玩笑有些梦想可能只是平日里的一句玩笑,或者恍然间的“奇谈”,在当下没有实现的可能但老庄有云“无用之用,方为大用,”梦想是人类进步的助推剂,梦想终将照进现实——黄维人物百科:黄维,男,汉族,1965年5月生。
- 酸甜凉拌猪肝的做法
- 2024-11-22酸甜凉拌猪肝的做法食材清单猪肝适量、香葱适量、蒜末适量、辣椒油适量、麻油适量、白糖适量勺、陈醋适量、酱油适量、料酒适量烹饪步骤1/5把生猪肝切成小块,这样易熟,锅内加水,冷水下锅煮,锅中可以放点姜片,料酒去腥,重点是一。
- 为什么怀念初恋的好(我们在怀念初恋)
- 2024-11-22我们在怀念初恋我跟慕慕谈话的内容从嘘寒问暖上升到人存在的根本问题,搞笑的是我们俩个谁都没生过人,还在这谈人生说实话这种深奥的问题中国的孔孟、老庄,国外的亚里士多德、柏拉图都没能说清楚,更何况没读过几本书的我们但这些。
- 伊春最新发布防疫信息(伊春市疾病预防控制中心紧急提醒)
- 2024-11-22伊春市疾病预防控制中心紧急提醒广大市民:2022年10月11日,重庆市南岸区新增1例新冠肺炎确诊病例(轻型)(确诊病例3),系渝北区无症状感染者的密切接触者,现将其在渝期间主要活动轨迹通告如下:10月4日—10月5日在南岸区学府大。
- 乔峰之侠肝义胆拍摄地(欢乐园乔峰传感受豪侠远征)
- 2024-11-22欢乐园乔峰传感受豪侠远征江湖向来恩怨多,为情为仇数不尽纷争如此多,看谁笑最后欢乐园《乔峰传》豪侠远征玩法,体验久违的热血场面,恩怨情仇只在一剑之间,单挑或群殴任你选!集结武林人士,讨伐邪恶力量,一直是江湖中的正义规则在《乔峰。
- 家里的饺子怎么做成煎饺(煎饺快速烹饪的家用方法)
- 2024-11-22煎饺快速烹饪的家用方法一:水饺不粘不破皮的方法来啦[比心]饺子人人都会煮,可不是黏在一起就是破皮,学会这一招,饺子个个不粘连,完完整整最好吃!1:先煮皮后煮馅,盖锅盖煮皮,撇锅盖煮馅水开后,撇开锅盖煮饺子,饺子随滚水不停搅。
- 最简单的英文字母的简笔画(30秒速成字母简笔画)
- 2024-11-2230秒速成字母简笔画A:摇呼啦圈的小人B:鱼儿水中游C:扭来扭去的小蛇D:漂亮的瓢虫E:可爱的小猪F:高高的长颈鹿G:会说话的鹦鹉H:威风凛凛的老虎I:聪明的猴子J:长鼻子大象K:叽叽喳喳的小鸡L:呱呱叫的青蛙M:大尾巴。
- 羽绒被怎么清洗(羽绒被清洗的方法)
- 2024-11-22羽绒被清洗的方法先去污渍,再浸泡很多人清洗羽绒被的时候,将羽绒被放在水里浸泡很长时间或放在洗衣机里面洗很久,以为这样可以洗掉法污渍,其实是错误的正确的方法应该是先用手将局部脏污的地方洗净,再放入洗衣机中洗涤干净洗涤时。
- 重生后爱上渣男的死对头(七日生文文不是你想买就能买)
- 2024-11-22七日生文文不是你想买就能买近期热播的国产公路悬疑剧《七日生》里,石纯子饰演的文文是个绝对的关键人物,因为她,李晓宇才登上大巴车,结识简妮和其他众人;因为她,李晓宇才揪着好兄弟邱永邦不放,关系越闹越僵;因为她,霍雷兹帮、马赫德等。