基于协同过滤算法的推荐zhaowei121|协同过滤算法流程图_宠物用品

（本实验选用数据为真实电商脱敏数据，仅用于学习，请勿商用）

协同过滤算法是一种基于关联规则的算法，以购物行为为例。假设有甲和乙两名用户，有a、b、c三款产品。如果甲和乙都购买了a和b这两种产品，我们可以假定甲和乙有近似的购物品味。当甲购买了产品c而乙还没有购买c的时候，我们就可以把c也推荐给乙。这是一种典型的user-based情况，就是以user的特性做为一种关联。

本次实验选用的是PAI-Studio作为实验平台，仅通过拖拽组件就可以快速实现一套基于协同过滤的推荐系统。本实验的数据和完整业务流程已经内置在了PAI首页模板，开箱即用：

本次实验选用的是PAI-Studio作为实验平台，仅通过拖拽组件就可以快速实现一套基于协同过滤的推荐系统。

首先输入的数据源是7月份之前的购物行为数据，通过SQL脚本取出用户的购买行为数据，进入协同过滤组件，这么做的目的是简化流程，因为购买行为对这次实验分析是最有价值的。协同过滤的组件设置中把TopN设置成1，表示每个item返回最相近的item和它的权重。通过购买行为，分析出哪些商品被同一个user购买的可能性最大。设置图如下：

协同过滤结果，表示的是商品的关联性，itemid表示目标商品，similarity字段的冒号左侧表示与目标关联性高的商品，右边表示概率：

比如上图的第一条，itemid1000和item15584的相似度为0.2747133918，相似度越高表示两个物品被同时选择的概率越大。

上面是统计模块，左边的全表统计展示的是根据7月份之前的购物行为生成的推荐列表，去重后一共18065条。右边的统计组件显示一共命中了90条，命中率0.4%左右。

根据上文的统计结果可以看出，本次试验的推荐效果比较一般，原因在如下几方面：

THE END

基于协同过滤算法的推荐zhaowei121

基于SSM框架的ACG动漫周边交易平台设计与实现开题报告

基于Flink的机器学习算法平台Alink（二）推荐算法介绍

基于位置社交网络中地点聚类推荐方法

技术视角下高校图书馆创新实践最新章节程静著

关于个性化主页定制的新闻推荐算法研究传媒

产品经理如何做算法题?Worktile社区

基于协同过滤算法的推荐zhaowei121