摘要:在互联网蓬勃发展的今天,网络已经成为人们获取新闻咨询的的主要途径,人民网——新闻媒体行业的领先者,势必要将互联网作为其主要的传播途径,但是传统的通过简单地新闻内容展示的模式已经完全行不通了,本文通过介绍个性化推荐算法,以及结合人们网自身情况,为人民网的发展提出一些建议。
关键字:个性化推荐;人民网;用户;算法
一.引言
产生于电子商务领域的个性化推荐技术是基于对用户的偏好进行分析对用户推荐商品的一种创新性的方法,这种方法会大大提高商品成交的机率,如今个性化推荐的算法已经越来越完善,而且效果越来越好,如果我们将其应用到新闻媒体行业之中,是否会为这个行业注入新鲜的活力呢?本文通过介绍个性化推荐和个性化推荐算法并结合人民网的自身情况,为其发展提出一些可行的技术和对策。
二.个性化推荐
1.个性化推荐的简介
2.个性化推荐的发展历程
1995年3月,卡耐基.梅隆大学的RobertArmstrong等人在美国人工智能协会上提出了个性化导航系统WebWatcher;斯坦福大学的MarkoBalabanovic等人在同一会议上推出了个性化推荐系统LIRA
1995年8月,麻省理工学院的HenryLieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Litizia;
1996年,Yahoo推出了个性化入口MyYahoo;
1997年,AT&T实验室提出了基于协同过滤的个性化推荐系统PHOAKS和ReferralWeb;
1999年,德国Dresden技术大学的TanjaJoerding实现了个性化电子商务原型系统TELLIM;
2000年,NEC研究院的Kurt等人为搜索引擎CiteSeer增加了个性化推荐功能;
2001年,纽约大学的GediminasAdoavicius和AlexanderTuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro;
2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站;
2009年7月,国内首个个性化推荐系统科研团队北京百分点信息科技有限公司成立,该团队专注于个性化推荐、推荐引擎技术与解决方案,在其个性化推荐引擎技术与数据平台上汇集了国内外百余家知名电子商务网站与资讯类网站,并通过这些B2C网站每天为数以千万计的消费者提供实时智能的商品推荐。
2011年9月,百度世界大会2011上,李彦宏将推荐引擎与云计算、搜索引擎并列为未来互联网重要战略规划以及发展方向。百度新首页将逐步实现个性化,智能地推荐出用户喜欢的网站和经常使用的APP
2.基本框架
·基于云计算的个性化推荐平台
消除数据孤岛,建立基于用户全网兴趣偏好轨迹的精准云计算分析模型,打通用户在多个网站的兴趣偏好,形成成用户行为偏好大数据中心。
·多种智能算法库
基于多维度的数据挖掘、统计分析,进行算法模型的建立和调优。综合利用基于内容、基于用户行为和基于社交关系网络的多种算法,为用户推荐其喜欢的商品、服务或内容。
电子商务推荐系统的主要算法有:
(1)基于关联规则的推荐算法(AssociationRule-basedRecommendation)
(2)基于内容的推荐算法(Content-basedRecommendation)
内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。
基于内容过滤的系统其优点是简单、有效。尤其对于推荐系统常见的冷启动(ColdStart)问题,Content-based方法能够比较好的进行解决。因为该算法不依赖于大量用户的点击日志,只需要使用待推荐对象(item)本身的属性、类目、关键词等特征,因此该方法在待推荐对象数量庞大、变化迅速、积累点击数稀少等应用场景下有较好的效果。但该方法的缺点是对推荐物的描述能力有限,过分细化,推荐结果往往局限与原对象相似的类别中,无法为客户发现新的感兴趣的资源,只能发现和客户已有兴趣相似的资源。这种方法通常被限制在容易分析内容的商品的推荐,而对于一些较难提取出内容的商品,如音乐CD、电影等就不能产生满意的推荐效果。
(3)协同过滤推荐算法(CollaborativeFilteringRecommendation)
协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
与传统文本过滤相比,协同过滤有下列优点:
1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;
2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;
3)推荐的新颖性。正因为如此,协同过滤在商业应用上也取得了不错的成绩。Amazon,CDNow,MovieFinder,都采用了协同过滤的技术来提高服务质量。
协同过滤推荐算法,可进一步细分为基于用户的协同过滤(user-basedcollaborativefiltering)和基于物品的协同过滤(item-basedcollaborativefiltering)。
基于用户的协同过滤的基本思想是:根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,在一般的应用中是采用计算“K-邻居”的算法;然后,基于这K个邻居的历史偏好信息,为当前用户进行物品的推荐。
基于物品的协同过滤的基本原理也类似,该方法根据用户和物品直接历史点击或购买记录,来计算物品和物品之间的相似度,然后根据用户的历史偏好的物品信息,将挖掘到的类似的物品推荐给用户
基于用户的协同过滤和基于物品的协同过滤各自有其适用场景。总的来看,协同过滤方法的缺点是:
1)稀疏性问题:如果用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确;
2)可扩展性问题:随着用户和商品的增多,系统的性能会越来越低;
3)冷启动问题:如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐。
4)长尾问题:对微小市场的推荐。
因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。
三.人民网简介
1.人民网概述
人民网设有《人民日报》、PDF版和报系20多份报刊的电子版,网民覆盖200多个国家和地区。其旗下拥有人民在线、人民视讯、环球网三家控股公司,并在国内各省市设立了地方分公司。与此同时,人民网还积极推进全球化布局,先后在日本、美国、美西、韩国,英国、俄罗斯和南非成立分社并设立演播室,大大提升了人民网的国际传播力和影响力。人民网中国共产党新闻、中国人大新闻、中国政府新闻、中国政协新闻、中国工会新闻、中国妇联新闻、中国科协新闻等栏目构成中央网群板块,已成为发布国家重要新闻、权威解读政策法规和沟通人民群众的重要桥梁。
2.人民网现状
四.算法
大家请看下面的图
用户在浏览信息的过程中,如果用户A浏览过某一对象,用户B同样浏览过这个对象,则说明这两个用户之间存在偏好的相同或相近,这样的话,如果我们知道莫以用户的偏好,我们就可以根据这个用户的偏好,给另一个用户提供推荐,当然这只是两个用户之间,我们可以多个用户之间,虽然这样的推荐会有一定的的误差,但是比起没有规则的推送,我觉得这样更有意义。
在用户浏览信息的过程中,如果用户点击并浏览了某一个对象,我们就将用户与对象之间建立联系,如何建立呢?就是将对象自身所带的标签填充到用户自己的数据库中,然后在下次推荐用户的时候我们就可以根据我们之前存在数据库中的内容就行推荐,这种算法就要求用户有一定的使用,这样我们才能够使用这种,要求每次使用我们都要监视用户的使用情况,然后我们要根我们监视得到的数据对用户的数据库进行更新,不断完善我们对用户偏好的完善,这样我们推荐就会越来越准确。
五.与人民网实际结合
1.准备工作
·标签
标签就是指根据对象的情况,对对象进行概括、精简描述,比如说有一个关于习大大出访美国的新闻,这样我们就可以将这篇新闻定义出标签:习大大、美国等,就类似这样的,将每个对象都定义一个或多个标签。
·数据库
·编写程序
根据上面的4个算法,编写程序,要综合利用这4个算法,同时使用,只有这样才能将用户的偏好分析的更加全面、更加快速。
·内容编写
与第二个结合,重点完成对象数据库的建立,人民网具有强大的原创能力,所以要不断的开发新的内容,是我们的对象成为我们的核心竞争力。
2.具体实施
六.总结
在移动互联的浪潮之中,真正的发现用户的需求,在这个信息大爆炸的时代,真正挖掘用户的偏好,提高用户的体验,已经成为了各大互联网公司的主要发力方向,人民网,作为中央重点发展的新闻媒体企业,应该迎头前进,充分发挥自身已有的优势,结合个性化推荐功能的实现,为用户带去顶级的体验,提高用户粘性,这不仅会给企业带来一笔不错的受益,更加会助力中央的各个文件精神的传播,守住人民网长久以来的领导和权威的地位!