python数据关联分析_数据挖掘典型应用:关联分析-程序员宅基地

技术标签: python数据关联分析  

关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。

那什么是关联分析呢?

对于商家而言,有两个很重要的指标对于扩大销售规模是很重要的:

第一,提高顾客重复购买次数;

第二,提高客户订单中的Basket size(即购物篮件数)。

而第二个指标提高Basket

size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?

在超市经常我们看到商品组合打包在一起优惠销售,例如:飘柔洗发水 玉兰油沐浴露、方便面 火腿肠,面包

牛奶,在这些产品组合的背后必然有相应的数据进行支撑,才敢推出相应的优惠组合套装,而这背后的原理就是涉及到数据挖掘中的关联分析。

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。

关联分析能用来做什么呢?

可以一句话来概括:最大限度地从你口袋里面掏出更多的钱买我的产品。

1. 通过关联规则,推出相应的促销礼包或优惠组合套装,快速帮助提高销售额。如前面所说的:飘柔洗发水

玉兰油沐浴露等促销礼包;全家里面推出的牛奶 面包、豆奶 面包的早餐组合。

2.

零售超市或商场,可以通过产品关联程度大小,指导产品合理摆放,方便顾客最购买更多其所需要的产品。最常见的就是超市里面购买肉和购买蔬菜水果等货架会摆放得很近,目前就是很多人会同时购买肉与蔬菜,产品的合理摆放也是提高销售的一个关键。

3.

进行相关产品推荐或者挑选相应的关联产品进行精准营销。最常见的是你在亚马逊或京东购买产品的时候,旁边会出现购买该商品的人,有百分之多少还会购买如下的产品,快速帮助顾客找到其共同爱好的产品。物以类聚,人以群分。

4.

寻找更多潜在的目标客户。例如:100人里面,购买A的有60人,购买B的有40人,同时购买A和B的有30人,说明A里面有一半的顾客会购买B,反推而言。如果推出类似B的产品,除了向产品B的用户推荐(因为新产品与B的功能效果比较类似)之外,还可以向A的客户进行推荐,这样就能最大限度地寻找更多的目标客户。

关联分析的准备工作分析前必须进行大量的产品梳理工作,区分不同等级的层次关系,并且给相应的产品打上合适的标签。产品梳理是一项纯手工的并且需要耗费大量的人力及时间才能完成的。一般的企业,其产品不会很多,就比如P&G的产品或者其SKU数也不过是几千个,但产品梳理的标准是很重要的。产品标准过于粗放,对于后期的关联分析意义不大;产品标准过于细化,如涉及到SKU的层面的话,关联分析出的规则也不一定很理想。所以选定好一个比较合理的产品梳理规范,对于关联分析的结果精准程度很重要。因为很多SKU一般只有产品名称及价格,对数据管理比较规范的企业会打上品牌标签,其他相应的信息都是需要进行手工梳理。具体的产品梳理示例如下:

sg_trans.gif

如果对于大零售超市或商场,其SKU数一般都是几十万甚至上百万,产品梳理工作是一项很痛苦的工作,但如果要从数据角度进行产品运营,建议可以开展相应的产品梳理咨询项目,通过半年多的产品梳理,形成标准化的产品梳理流程及产品目录。过去的半年里,在对某商场的产品梳理时候,发现目前的产品体系还是漏洞百出,很多还是很不规范的。做好关联分析或数据运营,请从产品梳理工作开始。

关联分析应主要事项

1.

注意购买产品赠送礼品的人为因素影响规则。有些挖掘师或分析师在做出关联分析后,看到了几条提升度及置信度都很高的规则,就兴奋不已地告诉客户:我觉得产品A和产品B有很大的关联性,从数字上看,捆绑销售肯定能够取得很好的销售效果。当拿到这样的结果的时候,客户很镇定地说:“你不知道我们在某月的时候,大量开展了购买产品A即可免费赠送产品B的活动么?”杯具,坑爹。对于这个时候的挖掘师是很悲催的。在筛选关联规则的时候,必须对该企业过去一年开展的活动有了解,还必须对不同时间段的主推产品进行提前沟通,确保关联规则不受人为因素影响。

2.

注意产品之间的位置摆放是否有很大的影响。在零售大商场中,产品摆放的位置对产品关联销售会产生很大的影响的,因为关联分析就是为了更方便地让顾客找到其需要的产品,购买更多其需要的产品。人流比较大的两个相隔货架之间的产品关联性比较大,在我们项目中会发现不少的这样规则。但其结果表明了货架关联性比较大,摆放在一起就肯定比较合理的。但在进行关联分析的时候,客户更希望能从其他不相隔的货架之间找出更好的关联销售机会,这决定了后期的关联规则挑选难题。

3. 注意关联推荐的规则合理性及流失成本的大小。后期的关联推荐应用于主要是三个方面:

重购:继续购买原来的产品;

升级:购买更高档次的产品;

交叉销售:购买相关的产品。

如果该规则的客户本来是买了50块钱的产品的,发现关联规则里面出现了推荐其购买30块的同类型产品,这等于给客户降档推荐了,会让销售额大幅减少,销售机会白白浪费并且造成了损失,所以在进行关联推荐的时候,那些涉及到了降档的规则一定要剔除。

关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。数据分析培训

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39606638/article/details/110374403

智能推荐

苹果https java_apple登录 后端java实现最终版-程序员宅基地

文章浏览阅读298次。import com.alibaba.fastjson.JSONArray;import com.alibaba.fastjson.JSONObject;import com.auth0.jwk.Jwk;import com.helijia.appuser.modules.user.vo.AppleCredential;import com.helijia.common.api.model.Api..._com.auth0.jwk.jwk

NLP学习记录(六)最大熵模型MaxEnt_顺序潜在最大熵强化学习(maxent rl)-程序员宅基地

文章浏览阅读4.7k次。原理在叧掌握关于未知分布的部分信息的情况下,符合已知知识的概率分布可能有夗个,但使熵值最大的概率分布最真实地反映了事件的的分布情况,因为熵定义了随机变量的不确定性,弼熵值最大时,随机变量最不确定,最难预测其行为。最大熵模型介绍我们通过一个简单的例子来介绍最大熵概念。假设我们模拟一个翻译专家的决策过程,关于英文单词in到法语单词的翻译。我们的翻译决策模型p给每一个单词或短语分配一..._顺序潜在最大熵强化学习(maxent rl)

计算机毕业设计ssm科研成果管理系统p57gs系统+程序+源码+lw+远程部署-程序员宅基地

文章浏览阅读107次。计算机毕业设计ssm科研成果管理系统p57gs系统+程序+源码+lw+远程部署。springboot基于springboot的影视资讯管理系统。ssm基于SSM高校教师个人主页网站的设计与实现。ssm基于JAVA的求职招聘网站的设计与实现。springboot校园头条新闻管理系统。ssm基于SSM框架的毕业生离校管理系统。ssm预装箱式净水站可视化信息管理系统。ssm基于SSM的网络饮品销售管理系统。

Caused by: org.xml.sax.SAXParseException; lineNumber: 38; columnNumber: 9; cvc-complex-type.2.3: 元素_saxparseexception; linenumber: 35; columnnumber: 9-程序员宅基地

文章浏览阅读1.6w次。不知道大家有没有遇到过与我类似的报错情况,今天发生了此错误后就黏贴复制了报错信息“Caused by: org.xml.sax.SAXParseException; lineNumber: 38; columnNumber: 9; cvc-complex-type.2.3: 元素 'beans' 必须不含字符 [子级], 因为该类型的内容类型为“仅元素”。”然后就是一顿的百度啊, 可一直都没有找到..._saxparseexception; linenumber: 35; columnnumber: 9; cvc-complex-type.2.3:

计算机科学与技术创新创业意见,计算机科学与技术学院大学生创新创业工作会议成功举行...-程序员宅基地

文章浏览阅读156次。(通讯员 粟坤萍 2018-04-19)4月19日,湖北师范大学计算机科学与技术学院于教育大楼学院会议室1110成功召开大学生创新创业工作会议。参与本次会议的人员有党总支副书记黄海军老师,创新创业学院吴杉老师,计算机科学与技术学院创新创业活动指导老师,15、16、17级各班班主任及学生代表。首先吴杉老师介绍了“互联网+”全国大学生创新创业大赛的相关工作进度,动员各级班主任充分做好“大学生创新创业大..._湖北师范 吴杉

【Android逆向】爬虫进阶实战应用必知必会-程序员宅基地

文章浏览阅读1.1w次,点赞69次,收藏76次。安卓逆向技术是一门深奥且充满挑战的领域。通过本文的介绍,我们了解了安卓逆向的基本概念、常用工具、进阶技术以及实战案例分析。然而,逆向工程的世界仍然在不断发展和变化,新的技术和方法不断涌现。展望未来,随着安卓系统的不断更新和加固,逆向工程将面临更大的挑战。同时,随着人工智能和机器学习技术的发展,我们也许能够看到更智能、更高效的逆向工具和方法的出现。由于篇幅限制,本文仅对安卓逆向技术进行了介绍和案例分析。

随便推点

Python数据可视化之环形饼图_数据可视化绘制饼图或圆环图-程序员宅基地

文章浏览阅读1.1k次。制作饼图还需要下载pyecharts库,Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。随着学习python的热潮不断增加,Python数据可视化也不停的被使用,那我今天就介绍一下Python数据可视化中的饼图。在我们的生活和学习中,编程是一项非常有用的技能,能够丰富我们的视野,为各行各业的领域提供了新的角度。环形饼图的制作并不难,主要是在于数据的打包和分组这里会有点问题,属性的标签可以去 这个网站进行修改。图中的zip压缩函数,并分组打包。_数据可视化绘制饼图或圆环图

SpringMVC开发技术~5~基于注解的控制器_jsp/servlet到controller到基于注解的控制器-程序员宅基地

文章浏览阅读325次。1 Spring MVC注解类型Controller和RequestMapping注释类型是SpringMVC API最重要的两个注释类型。基于注解的控制器的几个优点:一个控制器类可以控制几个动作,而一个实现了Controller接口的控制器只能处理一个动作。这就允许将相关操作写在一个控制器类内,从而减少应用类的数量基于注解的控制器的请求映射不需要存储在配置文件中,而是使用RequestM..._jsp/servlet到controller到基于注解的控制器

利用波特图来满足动态控制行为的要求-程序员宅基地

文章浏览阅读260次,点赞3次,收藏4次。相位裕量可以从增益图中的交越频率处读取(参见图2)。使用的开关频率、选择的外部元件(例如电感和输出电容),以及各自的工作条件(例如输入电压、输出电压和负载电流)都会产生巨大影响。图2所示为波特图中控制环路的增益曲线,其中提供了两条重要信息。对于图2所示的控制环路,这个所谓的交越频率出现在约80 kHz处。通过使用波特图,您可以查看控制环路的速度,特别是其调节稳定性。图2. 显示控制环路增益的波特图(约80 kHz时,达到0 dB交越点)。图3. 控制环路的相位曲线,相位裕量为60°。

Glibc Error: `_obstack@GLIBC_2.2.5‘ can‘t be versioned to common symbol ‘_obstack_compat‘_`_obstack@glibc_2.2.5' can't be versioned to commo-程序员宅基地

文章浏览阅读1.8k次。Error: `_obstack@GLIBC_2.2.5’ can’t be versioned to common symbol '_obstack_compat’原因:https://www.lordaro.co.uk/posts/2018-08-26-compiling-glibc.htmlThis was another issue relating to the newer binutils install. Turns out that all was needed was to initi_`_obstack@glibc_2.2.5' can't be versioned to common symbol '_obstack_compat

基于javaweb+mysql的电影院售票购票电影票管理系统(前台、后台)_电影售票系统javaweb-程序员宅基地

文章浏览阅读3k次。基于javaweb+mysql的电影院售票购票电影票管理系统(前台、后台)运行环境Java≥8、MySQL≥5.7开发工具eclipse/idea/myeclipse/sts等均可配置运行适用课程设计,大作业,毕业设计,项目练习,学习演示等功能说明前台用户:查看电影列表、查看排版、选座购票、查看个人信息后台管理员:管理电影排版,活动,会员,退票,影院,统计等前台:后台:技术框架_电影售票系统javaweb

分分钟拯救监控知识体系-程序员宅基地

文章浏览阅读95次。分分钟拯救监控知识体系本文出自:http://liangweilinux.blog.51cto.com0 监控目标我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。监控目标1.对系统不间断实时监控:实际上是对系统不间..._不属于监控目标范畴的是 实时反馈系统当前状态

推荐文章

热门文章

相关标签