新闻推荐算法的问题及优化策略

以人工神经网络为代表的新的算法范式,对于推荐系统中许多难以解决的老问题,很可能会有非常好的效果。

供图/CFP

个性化新闻推荐系统在实际的应用中褒贬不一,通过对一些用户的访谈,笔者发现,个性化新闻推荐中往往含有一些劣质内容,利用人性的弱点,导致过度娱乐化的新闻泛滥。这些刺激感官的内容吸引人们点击,造成了点击量上的“虚假繁荣”以及用户的“信息成瘾”。

个性化新闻推荐算法的问题

(一)内容不符合用户兴趣

个性化推荐算法并不一定能把符合用户兴趣的内容推荐给用户,造成这个问题的原因有很多。

协同过滤算法本身的缺陷,亦造成了一些个性化推荐算法的推送内容不符合用户兴趣。一个经典的例子是,娱乐新闻往往很受欢迎,因此用户在协同过滤中的近邻群体多少都阅读过一些娱乐新闻,但这个用户可能从来不读娱乐新闻,强行推荐会使他反感。

(二)内容质量问题

(三)信息茧房与信息成瘾

信息茧房(InformationCocoons)指的是信息个性化技术使得人们可能减少阅读多样化内容的趋势。由于个性化推荐系统是根据用户已有的阅读偏好进行关键词匹配和推荐,因此相似性较低的内容基本上不会被推荐,这样用户的阅读内容会变得狭隘。在一次又一次阅读自己喜欢领域的信息后,用户不断地在自己与整个世界之间筑起一座高墙。许多人沉湎于这样的拟态环境中,无法自拔。

(四)可遗忘性

推荐算法的优化策略

(一)技术不断革新

运用以人工神经网络为代表的新的算法范式,对于推荐系统中许多难以解决的老问题,很可能会有非常好的效果。目前,以深度学习为代表的人工神经网络方法在图像识别、声音识别领域取得了巨大成就,人工神经网络方法,正在被许多研究者尝试运用到推荐系统中。

最简单直接且效果也比较好的方式是请用户直接表达出其喜好的资讯话题。很多应用都采用了这种直接的方法来获取新用户初次打开时的喜好。对于协同过滤算法可能存在的不恰当推荐问题,在应用上可以增加一个设置界面,允许用户设定明确不想被推荐的话题,增加算法的可预测性和可控制性。

算法的可遗忘性问题只需通过加入重置用户画像的功能,即可圆满解决。

(二)构建优质内容生态

从内容生态的构建角度,互联网企业应当考虑整个产业的长远发展,将回报向优质内容的生产者进行倾斜,同时遏制低俗内容的蔓延。

作为互联网公司,要改变单纯追求用户时长的KPI(关键绩效指标)评判标准,注意内容的消费升级。

(三)加大人工审核力度,加强立法管理

尽管自动化内容审核系统已经做得比较先进,但仍需要人工审核来进行最后把关。要积极通过立法方式规范监管,鼓励优质主旋律内容的生产和传播。同时政府机构应当发挥作用,对市场调节失灵的情况进行合理干预,让信息流消费市场不至于沦为低质量内容循环生产的垃圾堆。政府还应对互联网企业加以引导,鼓励企业将算法权重向优质内容倾斜,对频频出现三俗内容的产品加以约束。

THE END
1.推荐算法协同过滤协同过滤是迄今为止最成功的推荐系统技术,被应用在很多成功的推荐系统中。电子商务推荐系统可根据其他用户的评论信息,采用协同过滤技术给目标用户推荐商品。 协同过滤算法主要分为基于启发式和基于模型式两种。 其中,基于启发式的协同过滤算法,又可以分为基于用户的协同过滤算法(User-Based)和基于项目的协同过滤算法(Item...https://www.jianshu.com/p/5463ab162a58
2.基于流形近邻的协同过滤算法AET为了比较基于欧氏距离的协同过滤算法和基于最小最大距离的协同过滤算法,此处变化邻居数,加权方案取01VD,记使用欧氏距离的协同过滤方案为ECF,得到的实验结果如图2所示。 从图2可以看出,使用流形近邻的协同过滤算法优于使用欧氏距离的协同过滤算法。 3.3不同流形邻居数对实验结果的影响 ...http://www.chinaaet.com/article/3000016485
1.算法篇协同过滤协同过滤算法那么,在一个在线个性化推荐系统中,当一个用户A需要个性化推荐时,可以先找到和他有相似兴趣的其他用户,然后把那些用户喜欢的、而用户A没有听说过的物品推荐给A。这种方法称为基于用户的协同过滤算法。 算法核心:当一个用户A需要个性化推荐时,可以先找到他有相似兴趣的其他用户,然后把那些用户喜欢的、而用户A...https://blog.csdn.net/m0_37739193/article/details/119388606
2.协同过滤算法概述与python实现协同过滤算法基于内容(usr协同过滤(Collaborative Filtering)作为推荐算法中最经典的类型,包括在线的协同和离线的过滤两部分。所谓在线协同,就是通过在线数据找到用户可能喜欢的物品,而离线过滤,则是过滤掉一些不值得推荐的数据,比比如推荐值评分低的数据,或者虽然推荐值高但是用户已经购买的数据。 协同过滤的模型一般为m个物品,m个用户的数据,只...https://cloud.tencent.com/developer/article/1102304
3.利用数据分析量化协同过滤算法的两大常见难题但是对于一些老大难问题怎样分析数据,业内目前还没有一些较为全面和体系化的方法论。2018年在成都举行的 ICCCBDA 2018 会议刊登了一篇题为 Quantitative Analysis of Matthew Effect and Sparsity Problem in Recommender Systems 的论文,尝试着精准量化协同过滤算法中的两个常见难题:马太效应和稀疏性问题。https://www.51cto.com/article/595775.html
4.用Python实现协同过滤的教程python协同过滤 在 用户 —— 物品(user - item)的数据关系下很容易收集到一些偏好信息(preference),比如评分。利用这些分散的偏好信息,基于其背后可能存在的关联性,来为用户推荐物品的方法,便是协同过滤,或称协作型过滤(collaborative filtering)。 这种过滤算法的有效性基础在于: 用户的偏好具有相似性,即用户是可分类的...https://www.jb51.net/article/63730.htm