关于信息茧房和算法推荐,这些误会该澄清了!

《“信息茧房”在西方:似是而非的概念与算法的“破茧”求解》

(陈昌凤)

推荐理由

如果要给新传领域最“出圈”的概念列一个清单,这些年大热的“信息茧房”绝对榜上有名。其实,学界近来的一个趋势是对这个概念进行一些必要的再解读和冷思考,比如,喻国明老师去年的论文《“信息茧房”的误读与算法推送的必要》,就厘清了人们对于“信息茧房”的诸多误解,让我们对算法推送进行了重新认识,具有很大的启发价值。

一、什么是信息茧房?

桑斯坦认为麻省理工学院的媒介与科技专家尼古拉斯·尼葛洛庞帝的“我的日报”(theDailyMe)就是“信息茧房”效应的预言:这是一份完全个人化的报纸,我们每个人都可以在其中挑选我们喜欢的主题和看法。互联网用户在海量信息中以个人喜好选择性地接触感兴趣的信息,排斥与筛出所有不喜欢的东西,选择最适合自己品位的内容,长此以往形成“信息茧房”。“我的日报”将有“我们的日报”之虞。信息制造者运用了许多信息,其中一些非常接近于我们自己,虽然没有人跟自己完全一样,但是协同过滤运作得非常良好,甚至形成了“茧房”。具有相似想法的人每一天都把自己归入自己设计的“回音室”,制造偏激的错误、过度的自信和没道理的极端主义。这里强调了前人研究中所认为的:人们通常吸收新信息以确认他们对世界的看法,这种现象被称为“证实偏见”。

桑斯坦常常交替使用“信息茧房”和“回音室”。他认为因为网络社区超越了物理和地理的限制,所以出现了与志同道合的人保持联系的新机会,同时网络社区还提供了避免一切不感兴趣的人和事的机会。如果人倾听的是与自己相像的观点,则可能会变得更加极端和自信,于是会发生群体极化、两极分化。随着算法技术的广泛运用,有学者认为,算法的功能会使得这种主观选择的过程更加突出,算法会根据过往的偏好让人们接触到相似内容。从这两个比喻的形态来说,“信息茧房”更偏向个体接受同质化信息带来的认知影响,“回音室”(还有“过滤信息泡”概念)则偏向于个体在观点方面的认同,指人们在网络辩论中有选择地避免对立的争论,只听到自己认同的观点。

“我的日报”、“信息茧房”、“回音室”……这些相似的概念中其实具有一定的演进关系,它们之间也存在着些许细微的差别。比如这里有提到“信息茧房”和“回音室”这两个易混淆概念的辨析问题,前者侧重于“信息”层面,强调人们信息获取的单一化,是个人选择性心理起作用的体现;后者则更多地在于“观念”层面,它往往因受到人际环境、群体压力、媒介环境等因素的影响而得以表现出来。

二、如何看待“信息茧房”?

“信息茧房”的存在具有一定的必然性

①信息技术背景。互联网时代用户可获得的信息海量、超载,为了在海量信息中选择自己需要的内容,“信息茧房”成为用户的应对策略。

②个体情感因素。研究发现愤怒、焦虑和恐惧是个体是否选定只与志同道合的人、观点一致的内容进行互动的重要决定因素。愤怒的人更有可能既与观点相似者又与观点对立者进行辩论,愤怒情绪强化了回音室和论战两方面。

“信息茧房”只是一个担忧

①人们主动选择要接触哪些内容并非新现象,早在拉扎斯菲尔德和他的同事关于选民选择的研究中就显示出了选择性接触。

②互联网确实使民众更容易回避与自己矛盾的观点,因此增加了其被限在回音室中的风险。但这样的担忧其实是夸大了事实。公众对政治的更大兴趣和媒体的多样性,都降低了他们困在回音室中的可能性。

②信息茧房体现为一种信息聚合。在信息聚合中起重要作用的是用户的需求,体现为流量和点击率。同时经过众人协同过滤之后的信息,也创造了更积极的价值。

“信息茧房”也许只是美国土壤中的产物。卡德纳尔选择西班牙来测试此观点,确定并没有发现党派回音室的证据,他们的研究样本反而显示了跨党派的媒体信息消费的特征。

桑斯坦提出的“信息茧房”,是基于对美国两党政治的语境下对于政治信息极化的一种担忧,如今却被扩大到所有方面。

长期以来,“信息茧房”都是个携带着强烈负面色彩而盘踞在我们的思维深处的词汇,然而,我们对这个概念的运用,不应脱离其诞生的社会背景而加以任意延展。

此外,我们也要看到“信息茧房”这一现象的合理性甚至是积极意义,一方面,个体有自身的信息选择偏好,这是符合我们个性和能力范围的;另一方面,群体也能通过意见汇集形成更具代表性的观点、实行更高正确概率的决策。相比于忧虑于“群体性迷失”,我们也可以对“群氓的智慧”抱有更高的期待。

三、算法技术真的会带来信息茧房吗?

“信息茧房”是一个比喻,主要是建立在技术,尤其是算法推荐技术,降低政治信息多元化的忧虑之中。目前,能够实证“信息茧房”存在的研究尚属罕见,因为新媒体属性并不是简单、线性的,人们总是在更多元的、复杂的信息环境中。以中国为例,在短视频用户中有大量用户至少同时使用两个短视频平台。根据调查,2019年第3季度,使用字节跳动的6.06亿、使用快手的4.14亿,据统计两者用户重合率达到36.4%。也就是说人们会使用更多的APP、更多的信息聚合平台、更多的社交媒体,这样用户就不大可能在一个能形成“信息茧房”的简单线性的信息环境中。而若作为长期效果来研究,证实“信息茧房”的存在就更困难。

“信息茧房”又一次回归到经典研究的话题:受众的特性。自主的受众是否存在?民众是否能够自主地作出选择、判断和抉择?当“信息茧房”概念简单化地把互联网时代的用户当作算法制作的一个“茧”时,似乎对于自主的受众充满了悲观。“信息茧房”效应是一个无理性、非自主公民的写照,也是对Web2.0技术制造的“参与文化”的否定。

社交媒体上的信息流算法,也成为受众研究的入口。有研究发现,大多数人在社交媒体上浏览新闻的方式是基于“普遍的怀疑主义”,用户经常无法准确理解他们收到的信息是如何被过滤的,但也不会不加批判地接受它。用户在社交媒体上的新闻消费呈现怀疑主义和日常实用主义结合的悖论。也就是说,用户并非“魔弹论”下应枪声倒地的被动受众,而是带有批判性、自主认知能力的受众。

著名融合文化研究者亨利·詹金斯提出了“积极受众”和“参与式文化”等理论,对新技术环境下的媒介和文化研究有着重要的影响。人们总是能够找到证据说明,即使在各种复杂的环境下,仍然存在着积极、主动的受众,他们仍在创造性地表达自己的意愿,希望能够以批判性的姿态与外部世界相连。他以音乐、戏剧、迷因等流行文化来说明人们的相互作用能够使人们建立信任、获得技能。他认为不是技术对人们做了什么,而是人们利用技术做了什么,是人类文化具有决定性力量,而不是技术在决定着世界。社会的发展,就取决于公众将哪些东西看作是自己所需要的东西。虽然人们在受到技术的限制的同时,也在一定程度上塑造了自己的行为,但是社会的发展最终决定于人民如何从自己所拥有的各种备选方案中选出自己认为最有意义的那一项。

四、如何规避算法推荐加剧信息茧房的风险?

信息推荐算法的种类繁多,较常见的有“基于内容的推荐”“基于协同过滤的推荐”“基于时序流行度的推荐”三类。

①“基于内容的推荐”

②“基于协同过滤的推荐”

“协同过滤推荐法则”是一种利用群体智慧的推荐方式,可分为基于用户的协同过滤算法和基于物品的协同过滤算法。

③“基于时序流行度的推荐”

为了规避算法可能减少用户信息环境多样性的风险,有学者从三个维度为推荐算法的信息多样性制定原则和测量标准:

①从个人自治维度考虑,推荐系统的多样化的信息应该能满足、拓展用户的个人选择,增强用户对于多种选择的认识;

②从促进理性公共辩论的角度,多样化信息应保证用户与对立政治观点接触的程度,促成跨意识形态之间的互动,以建立社会成员相互理解和妥协的认知基础;

③基于激进多元主义和对抗民主观念,算法应该主动促进批判性意见和弱势观点,将异议引入公共辩论。纠正公共讨论被精英和利益集团主导的趋势,为挑战用户现有理念的内容提供生存空间。

这部分内容是对当下算法推荐的类型和模式比较全面的科普,虽然和答题没有很直接的关系,但其实,只有我们真正理解了它的技术运作基础,才能形成对于算法推荐更为客观的认知。比如基于内容的推荐更容易窄化个人视野,基于协同过滤的推荐则可能会强化群体极化效应等等,找到了算法技术催生的种种负面现象的起因和源头,也能方便我们更好地对症下药,破解技术困境以及相应的伦理风险。

目前,对多样性的提升主要基于两种路径。

路径一:使个性化推荐系统的使用者“意识到未知”(knowtheunknown)

将被过滤掉的信息提示给用户,使用户意识到还有更丰富的新闻可供选择,以期鼓励用户对当下的兴趣盲点进行探索。研究证明,这种纳入用户的兴趣盲点进行可视化的做法不仅增加了用户眼中的推荐系统透明度、提升对算法的控制感,也可以使用户意识到“信息茧房”的存在、理解“信息茧房”的机制,进而实现对“信息茧房”的控制。

路径二:通过强化“个性化”来有效提升“多样性”

推荐算法实际上具有增加内容多样性和缩小内容范围的双向潜力,有效提升“新闻多样性”离不开通过技术手段增强对“用户多样性”的理解。由于受教育程度、媒介素养、人格特征等因素影响,不同用户对于多样性新闻有不同的接纳程度。这些特征可以为算法所用,辅助算法计算用户对多样性的需求,在不失去用户的情况下最大程度地提高对用户推荐内容的多样性。因此算法在对用户画像之后针对不同个性的用户进行个性化信息推荐,有助于增加信息多元化。

THE END
1.推荐算法——基于物品的协同过滤算法基于用户的协同过滤算法在用户增长的时候,相似度计算的计算会越来越困难。基于物品的算法给用户推荐他们之前喜欢的物品相似的物品。 算法步骤 计算物品之间的相似度 根据物品的相似度和用户的历史行为给用户生成推荐列表 相似度公式如下: wij=|N(i)∩N(j)||N(i)||N(j)|?...https://www.imooc.com/article/27099
2.基于用户的协同过滤和基于物品的协同过滤的区别"""原始呈现的矩阵是:用户m x 物品n 基于用户的协同过滤:用户相似度矩阵m x m 点乘 用户m x 物品n = 用户m x 物品n基于物品的协同过滤:用户m x 物...https://www.jianshu.com/p/d00095735550
1.协同过滤算法在电商推荐系统中的应用:原理与实践协同过滤算法在电商推荐系统中的应用:原理与实践1. 背景介绍1.1 问题由来随着电子商务的飞速发展,在线购物平台的推荐系统已经成为用户获取商品信息的重要手段。推荐系统能够根据用户的浏览历史、购买记录和兴趣偏好,向用户推荐其可能https://blog.csdn.net/2405_88636357/article/details/143904879
2.协同过滤算法腾讯云开发者社区协同过滤算法是一类常用于推荐系统的算法,它基于用户之间或物品之间的相似性进行推荐。主要分为两种类型:基于用户的协同过滤和基于物品的协同过滤。以下是对这两种协同过滤算法的详细讲解: 1. 基于用户的协同过滤 1.1 思想 基于用户的协同过滤是通过分析用户之间的相似性来进行推荐。该算法的基本思想是:如果用户A和用户...https://cloud.tencent.com/developer/article/2389581
3.推荐系统算法实战协同过滤CF算法(CollaborativeFiltering...协同过滤分为基于用户的协同过滤和基于标的物(物品)的协同过滤两类算法。下面我们对协同过滤的算法原理来做详细的介绍。 推荐算法种类很多,但是目前应用最广泛的就是协同过滤算法。 协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分...https://blog.51cto.com/u_15236724/5968286
4.PythonDjango网页界面协同过滤推荐算法实现商品管理与推荐python这种算法通常分为两类:基于用户的协同过滤和基于物品的协同过滤。 基于用户的协同过滤:这种方法首先找出与目标用户兴趣相似的其他用户,然后根据这些相似用户的喜好来推荐物品给目标用户。 基于物品的协同过滤:与之相反,这种方法先找出与目标物品相似的其他物品,然后把这些物品推荐给那些喜欢目标物品的用户。 现在,让我们...https://www.jb51.net/python/305546cjo.htm