在“创建召回策略”页面,您可以对目标数据选择不同策略进行离线计算,得到合适的候选集。
创建召回策略操作步骤如下:
您可以前往召回策略列表,查看作业的基本情况。在作业列表中,刚创建的作业“状态”为“计算中”,当作业“状态”变为“计算成功”时,表示作业运行结束,生成的候选集ID将使用于在线服务,为用户生成推荐列表。当作业“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。
参数名称
说明
默认值
策略别名
策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。
默认召回策略的名称
数据源
数据源类型有初始格式和通用格式2种可选。
默认选择初始格式
行为类型
在特定行为热度策略中使用,选择一种行为类型后基于该种行为热度进行推荐。
用户行为包含如下几种类型:
物品曝光
行为次数统计方法
统计物品记录数的方式。
默认pv
排序算法类型
不衰减
最大推荐结果数
最多生成多少个推荐结果。
该参数会运用在“输出数据”的推荐候选集上。
100
数据
是否必须
描述
USER_BEHAVIOR
是
用户操作行为表。
名称
类型
HOT_REC_OFFLINE_CANDIDATES
CANDIDATES_SET
特定行为热度推荐算法生成的候选集。
扩展功能
组合作业的资源选择数据源类型为“通用格式”时,会出现扩展功能选项。
创建“基于综合行为热度推荐”的召回策略时,当开启扩展功能,数据源类型仅支持通用格式。
该功能表名是否使用分组推荐功能,根据全局特征信息文件勾选的用户特征或物品特征进行分组。
默认关闭
行为权重
当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。
用户行为权重包含:
物品曝光1.0
全局特征信息文件
开启扩展功能时,此配置项生效。其中“数据源类型”您可以选择“用户特征”或者“物品特征”进行设置。
-
WEIGHT_BEHAVIORS_REC_OFFLINE_CANDIDATES
综合行为热度推荐算法生成的候选集。
30天
用户行为权重项包含如下几种类型:
物品曝光;1.0
物品最近邻域数
在ItemCF算法中使用,指定某个物品的若干个最近邻物品,构成该物品近邻集合。
50
相似性度量方式
计算用户或物品特征表达相似性的方式。在ItemCF算法中,每个物品会基于对它有过行为的用户表示为特征向量,向量每一维是一个
相似性度量支持如下方式:
基于余弦夹角的相似性计算
行数
用于筛选物品最近邻域的条件组合参数。该值越大,筛选条件越严格。
5
条数
用于筛选物品最近邻域的条件组合参数。该值越小,筛选条件越严格。
4
ITEMCF_REC_OFFLINE_CANDIDATES
ItemCF算法生成的用户-物品列表候选集。
ItemCF算法生成的物品-物品列表候选集。
用户最近邻域数
在UserCF算法中使用,指定某个用户的若干个最近邻用户,构成该用户近邻集合。
用于筛选用户最近邻域的条件组合参数。该值越大,筛选条件越严格。
用于筛选用户最近邻域的条件组合参数。该值越小,筛选条件越严格。
USERCF_REC_OFFLINE_CANDIDATES
UserCF算法生成的用户-物品列表候选集。
隐向量维度
在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。
10
最大迭代次数
指定迭代优化的最大迭代次数。如果离线计算失败,建议调小至10以下。
正则化系数
在ALS算法中使用,指定正则化系数,作为优化目标中参数项代价的系数,用于避免过拟合现象发生。
0.01
ALSCF_REC_OFFLINE_UIREC_CANDIDATES
AlsCF算法生成的用户-物品列表候选集。
物品曝光;1次
CUSTOMRULE_REC_OFFLINE_UIREC_CANDIDATES
CustomRule生成的用户-物品列表候选集。
策略名
策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。默认召回策略的名称。
OBS地址
用户可从此OBS地址中选择自定义物品列表。
输入数据
数据格式(.csv文件):
itemId1,score1
itemId2,score2
itemId为物品id,score为物品分数。score不是必选,如果不选则算法默认给物品分配分数。算法将物品列表根据分数排序后作为候选集
用户可从OBS中选择保存有人工编辑推荐结果的列表(即物品ID)。
MANUALRULE_REC_OFFLINE_UIREC_CANDIDATES
人工编辑候选集。
例如,127,1
默认召回策略的名称。
匹配类型
画像匹配类型,包括:
用户匹配物品
匹配特征对
推荐个数
推荐给用户的物品最大个数。
该值越大筛选相似项条件越严格。
该值越小筛选相似项条件越严格。
用户画像存储
物品画像存储
最小行为次数
在物品上产生过行为的最小用户数,其中一个用户在一个物品上只计算一次行为。
30
折中参数
令alpha为Exploration和Exploitation之间的折中参数,其取值范围为[0,1],alpha越趋近于0,则物品的得分对历史得分高的物品越有利,即Exploitation。反之,alpha越趋近于1,则物品的得分越倾向于探索新物品,即Exploration。
0.5
UCB_REC_OFFLINE_CANDIDATES
UCB算法生成的候选集。
在使用文档中是否遇到以下问题
意见反馈(选填)
请至少选择一项反馈信息并填写问题反馈
字符长度不能超过500
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨
多渠道服务支持
提供免费备案服务
云业务全流程支持
享无忧退订服务
优化改进建议
4000955988
950808
扫描二维码
华为云微博
华为云App
扫描下载华为云App
域名注册服务机构许可:黔D3-20230001代理域名注册服务机构:新网、西数