基于Hadoop平台的个性化新闻推荐系统的设计AET

(广西科技大学鹿山学院电气与计算机工程系,广西柳州545616)

关键词:Hadoop;MapReduce;聚类;个性化;Mahout

中图分类号:TP301.6文献标识码:ADOI:10.19358/j.issn.16747720.2016.23.006

引用格式:韦灵,黎伟强.基于Hadoop平台的个性化新闻推荐系统的设计[J].微型机与应用,2016,35(23):21-23,27.

0引言

1协同过滤算法介绍

个性化推荐主要分为协同过滤推荐、基于内容推荐、混合推荐。个性化推荐本质上是把用户与物品进行联系,使得用户能够发现自己所喜爱的物品,使得物品能够被所喜欢的用户所了解[7]。关于协同过滤的一个最典型的例子就是看电影,有时候不知道哪一部电影是我们喜欢的或者评分比较高的,那么通常的做法就是问问周围的朋友,看看最近有什么好的电影推荐。在询问时,都习惯于问与自己爱好相似的朋友,这就是协同过滤的核心思想。协同过滤推荐与传统的基于内容过滤推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成对该指定用户对此信息的喜好程度预测。协同过滤主要分为基于用户的协同过滤和基于物品的协同过滤。

1.1基于用户的协同过滤算法

俗话说“物以类聚、人以群分”,拿看电影这个例子来说,如果你喜欢《蝙蝠侠》、《碟中谍》、《星际穿越》、《源代码》等电影,另外有个人也喜欢这类电影,而且他还喜欢《钢铁侠》,则很有可能你也喜欢《钢铁侠》这部电影。所以说,当一个用户A需要个性化推荐时,可以先找到与他兴趣相似的用户群体G,然后把G喜欢的、并且A没有听说过的物品推荐给A,这就是基于用户的协同过滤算法。

1.2基于物品的协同过滤算法

基于物品的协同过滤算法(ItemCF)是业界应用最多的算法,主要思想是利用用户之前有过的行为,给用户推荐和之前物品类似的物品。依然以电影为例,如果喜欢《蝙蝠侠》的用户有A、B、C和D,喜欢《碟中谍》的用户有A、C、D。那么可以认为《蝙蝠侠》和《碟中谍》拥有相似的用户群体,则很可能B用户也会喜欢《碟中谍》这部电影,于是推荐《碟中谍》给B用户。这就是基于物品的协同过滤算法。

2协同过滤算法用户的模型构建

协同过滤算法所需要的数据结构是用户id+新闻id+评分,为了将数据库中的数据形成这样的数据结构,通过查询新闻表的用户表来确定所查询的用户是否在其中,然后得到该用户浏览过的所有新闻id,最后对该新闻的喜爱程度进行预测。根据式(1)计算出Preference喜好值,其中Preference为预测的结果,ct为新闻聚类结果簇的个数,cn为当前新闻所在簇的新闻个数,unt为当前用户浏览过的新闻总数,nct为该新闻的浏览数。

3协同过滤算法物品的模型构建

其算法流程图如图2所示。

4个性化新闻推荐系统实现

基于Hadoop平台聚类算法的个性化新闻推荐系统,其目的是为让广大网民在浏览新闻时,为其提供一个个性化的新闻推荐系统。大量的信息使得用户找到自己需要的信息变得很困难。为了使互联网用户快捷地查找所需信息,个性化推荐系统的优势得到了体现,本文利用Hadoop的MapReduce模型实现并行快速地聚类海量新闻数据,大大提高了数据处理的速度,聚类使得新闻之间的相似度得以体现,再利用不同的协同过滤算法实现个性化的新闻推荐。系统使用了JSP、Servlet技术及Mahout开源项目编写程序,首先利用Java将新闻数据按约定格式处理并将其传到Hadoop的HDFS上,在安装好Hadoop的Linux端定时调用shell脚本聚类处理新闻,然后使用MySQL数据库存储数据,实现对新闻数据的协同过滤推荐处理。新闻推荐系统主要功能包括前台与后台的设计,图3所示为系统整体功能结构图,前台主要负责展示推荐的新闻信息结果和供用户浏览新闻;后台处理新闻数据,并将处理好的数据插入数据库供前台使用。

图4为新闻推荐流程图。选择基于用户的协同过滤推荐,系统将自动启动基于用户的协同过滤算法引擎进行数据的计算并将数据推送到页面中。同理基于物品的协同过滤算法相同。这个过程中查询所有人的浏览记录是通过多次的数据库查询得到的。

基于用户的协同过滤推荐系统效果如图5所示。

(2)当用户进行基于物品的协同过滤推荐操作时,将触发baseOnItemSert类,该类将查询出系统中的所有用户,并过滤掉admin这个测试用户,将所有的用户进行基于物品的协同过滤算法推荐,所有推荐结果存储在一个专门设计的newsModeBean类中,其他的操作基本与基于用户的协同过滤推荐一样。基于物品的协同过滤算法,提交数据的格式与基于用户的协同过滤算法一样。首先提取出所有的新闻,计算并建立新闻的共轭矩阵。然后使用用户向量点乘共轭矩阵可以得到推荐分数。

基于物品的协同过滤推荐系统如图6所示。

5结论

参考文献

[1]JIANGS,HONGWX.Averticalnewsrecommendationsystem:CCNS—anexamplefromChinesecampusnewsreadingsystem[C].ICCSE2014:Proceedingsofthe20149thInternationalConferenceonComputerScience&Education.Piscataway,NJ:IEEE,2014:1105-1114.

[2]杨武,唐瑞,卢玲.基于内容的推荐与协同过滤融合的新闻推荐方法[J].计算机应用,2016,36(2):414-418.

[3]刘金亮.基于主题模型的个性化新闻推荐系统的研究与实现[D].北京:北京邮电大学,2013.

[5]文鹏,蔡瑞,吴黎兵.一种基于潜在类别模型的新闻推荐方法[J].情报杂志,2014,33(1):161-166.

[6]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.

[7]曹一鸣.基于协同过滤的个性化新闻推荐系统的研究与实现[D].北京:北京邮电大学,2013.

THE END
1.电影票系统课程设计.docx电影票系统课程设计一、教学目标本课程旨在让学生了解和掌握电影票系统的相关知识,包括系统的设计、功能、操作等。具体目标如下:知识目标:使学生了解电影票系统的基本概念、原理和结构,包括用户购票、影院管理、票务查询等功能。技能目标:培养学生能够运用电影票系统进行购票、退票、改签等操作,并具备一定的系统维护和故障...https://www.renrendoc.com/paper/358658492.html
2.基于协同过滤算法的电影推荐系统的设计与实现.docx基于协同过滤算法的电影推荐系统的设计与实现摘 要在本文中,我们设计了一个基于用户行为模型的系统,旨在增加电影的数量,计算用户之间的相似度,并实现可以对电影进行信息爬取,向用户推荐相似电影的功能。该系统在基于用户的协作过滤算法中使用欧几里得公式来计算用户之间的相似度,通过该方式可以得到用户之间的相似度,以...https://max.book118.com/html/2022/0610/6104050043004155.shtm
3....分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现...该【基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现 】是由【zzz】上传分享,文档一共【5】页,该文档可以免费在线阅读,需要了解更多关于【基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章...https://www.taodocs.com/p-974435453.html
4.联邦推荐系统——个性化推荐与隐私安全的兼顾者智能互联网时代,我们的生活正被各式各样的推荐系统包围着。 从电商购物、在线视频到新闻流,推荐系统已然成为智能时代的关键技术,为我们提供着“千人千面”的服务。为了实现精准的推荐效果,推荐系统会收集大量用户行为数据。一般而言,收集的数据越多,对用户和推荐内容的了解就越全面和深入,推荐效果越精准。但随着数据安全...https://xie.infoq.cn/article/6bebbf1a280406b9f143a703e
5.毕业设计网写毕业设计程序定制餐厅的大数据分析系统 基于python的高校就业数据可视化分析 基于python的机器学习二手车价格分析预测系统 基于python电影推荐系统 Python开发培训原创课程来袭, 开启人工智能 信息可视化平台的设计与实现 基于python的中小学生运动会管理系统 基于Python的商品推荐系统的设计与实现 ...http://www.taolw.com/
1.springboot毕设电影推荐系统程序+论文本研究旨在设计并实现一个高效、准确的电影推荐系统程序,该程序能够综合考量用户的历史行为、电影的类型分类、用户评分以及电影的基本信息(如导演、演员、上映时间等),通过先进的推荐算法为用户提供个性化的电影推荐服务。同时,通过撰写详细的论文,深入分析系统的架构、算法原理、实现过程及性能评估,为同类系统的开发提供理...https://blog.csdn.net/wuzhou108/article/details/143608946
2.电影行业特效制作与影院管理方案66文库网(66wkw.com)正和优化,提高电影制作的整体效率。 (4)增强电影竞争力:在电影市场竞争激烈的环境下,特效制作技术成为 影片吸引观众、提高票房的重要手段。 1.3 影院管理的基本原则 影院管理是指对影院的运营、服务、技术、安全等方面进行综合协调和优化 以实现影院经营目标的过程。以下是影院管理的基本原则: (1)观众至上:影院管理应...https://m.66wkw.com/doc/133979.html
3.基于Spark的电影推荐系统设计与实现实时推荐模块使用Spark Streaming流处理的方式,保证电影推荐的实时性。又围绕推荐引擎做了详细设计,用数据预处理模块加速推荐计算,用日志模块更新推荐模型与推荐结果,用电影向量化模块扩充模型特征。然后,对电影推荐系统进行实现,主要对数据预处理模块、日志模块、电影向量化模块和四个推荐模块的实现进行了阐述。在实现过程中...https://mall.cnki.net/magazine/article/CMFD/1021127028.nh.htm
4.大数据技术之24电影推荐系统项目06项目以推荐系统建设领域知名的经过修改过的 MovieLens 数据集作为依托,以某科技公司电影网站真实业务数据架构为基础,构建了符合教学体系的一体化的电影推荐系统,包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方...https://cloud.tencent.com/developer/article/1430709
5.基于Python电影推荐系统爬虫Django框架协同过滤推荐算法数据...本系统web端的功能模块,主要实现影片显示、影片分类显示、热门影片排序显示、收藏影片排序显示、时间排序显示、评分排序显示、算法推荐、影片搜索、影片信息管理等功能,并进行数据库的详细设计,完成设计阶段的各项功能,并对此系统进行功能测试,最后,系统进行相关的实际应用操作,通过系统的使用,用户进入电影推荐系统,此系统可...https://www.jianshu.com/p/5188a9cc31d3
6.Spark平台下电影推荐系统的设计Spark Hadoop MLlib 协同过滤 电影推荐系统https://www.cnki.com.cn/Article/CJFDTotal-JYRJ202011006.htm