智能传播中算法偏见的成因影响与对策

许向东,中国人民大学新闻学院教授、博导,中国人民大学新闻与社会发展研究中心研究员。

王怡溪,中国人民大学新闻学院博士生。

算法偏见:

社会偏见在人工智能时代的延伸

(一)智能传播中的算法及其作用

智能传播是“建立在新能源、人工智能、大数据、物联网、机器人技术等技术发展和突破的基础上,以物联网数据流替代人力、技术、传统生产要素,以智能技术决定内容生产、传播、营销和集成为决策方向的新的传播方式”(孟威,2018:46)。也有学者认为,智能传播是“由人工智能技术驱动的传播,即通过数字计算机在‘模拟、延伸和扩展人的智能’的过程中,实现‘感知环境、获取知识并使用知识’的信息生产活动”(孙江,何静,张梦可,2020)。总之,智能传播是将人工智能技术应用在信息的生产与传播中的一种新的传播形式、体系和生态。它与传统传播、互联网传播相比,无论是在信息丰富程度、传播模式,还是新闻传播的透明度、及时性、交互性等方面,有着明显的优势:在信息过载时代,智能传播实现了精准传播,提高了传播效率;可以对用户实施多点对一点的信息传播;高度的透明打破了信息传播的不对称;最大程度地实现了信息传播的交互性和及时性。

技术红利与技术缺陷是相伴相生的,人工智能应用于新闻传播领域在带来传媒变革的同时,也不可避免会产生一些问题。尤其是算法主导着当前传媒技术的范式,新闻信息的生产与发布无不受到算法的支配,如何规避和消除算法所带来的负面影响显得日渐重要。

(二)媒介偏见和算法偏见

算法的有效性建基于大量数据材料分析,而这些材料大多都源自社会现实,所以说,算法偏见是社会偏见的延伸,也是媒介偏见在人工智能时代的“升级版”,本质上是“在新闻选题、新闻报道中所体现出的价值判断的不客观、不公正”(杨保军,杜辉,2019),它“存在于算法设计和运行的每一个环节”(张超,2018)。“我们过于担心人类的偏见与自相矛盾,同时又过于相信计算机的客观公正性。”

我们的错误在于我们“信任算法,因为我们认为算法非常客观。但事实上,这些算法都是人编写出来的,人们可以把所有的偏见与观点植入其中”。换言之,计算机在运行算法时可能是不带有任何偏见的,但是,我们已经发现,这并不意味着算法在编写过程中没有受到人类偏见的影响(多梅尔,2015/2016:138)。

据美国皮尤研究中心2018年11月在对美国成年人的一项调查中发现,当算法工具在不同的现实情况下被使用时,公众担心这些算法会对那些做出决策的人产生影响。支持者认为,这些系统承诺提高准确性,减少人类在重要决策中的偏见。但是,58%的人认为计算机程序总会反映出某种程度上的人类偏见(Smith,2018)。也就是说,算法有时会打着中立的幌子,以一种较为隐蔽的方式强化着现有的偏见和差异。如果使用不当,算法也会变成一种杀伤性武器,对社会产生危害。

(三)算法偏见常见类型

国内法学专家刘友华按照损害的主体范围和利益范畴的不同,把算法偏见划分为损害公众基本权利的算法偏见、损害竞争性利益的算法偏见和损害特定个体权益的算法偏见(2019:56)。有学者立足算法自身的运行问题,将算法偏见划分为四种类型:

一是“互动偏见”,指在算法系统与用户互动过程中使算法产生的偏见,“当机器被设定为向周围环境学习时,它们不能决定要保留或者丢弃哪些数据,也无法判断哪些数据是对的或错的”;二是“潜意识偏见”,“指算法将错误的观念与种族和性别等因素连结起来”;三是“选择偏见”,“指受数据影响的算法,导致过于放大某一族群或群组,从而使该算法对其有利,而代价是牺牲其他群体”;四是“数据导向的偏见”,“指用来训练算法的原始数据已经存在偏见了”,“机器不会质疑所接收到的数据,只是单纯地寻找其中的模式。如果数据一开始就被扭曲,那么其输出的结果,也将会反映这一点”(Socal,2017)。

产生算法偏见的重要环节

算法在进入实际应用之前,要经过问题的定义、数据的输入、机器的学习和训练等环节。问题的定义就是明确工作任务,把需要解决的问题由抽象的概念转换为具体的变量,而变量的准确程度取决于设计者所具备的技术水平、占有的资源以及对问题的认识。数据的输入环节包含了数据的收集、清理、审查等步骤。收集到的数据要能够准确反映出需要定义的问题,并能代表最终应用的实际情况,算法设计者还要依据经验处理缺失值和错误值。算法所采用的数据集有自己的局限和缺陷。即使是包含了数十亿条信息的数据集,也难以完全捕捉到人们生活的丰富性和经验的多样性。机器的学习和训练环节包括了模型的选择、训练和优化。因为机器学习有不同的种类,模型选择就是由算法设计者来设定最基本的数据处理方式,而后由机器自行学习加以完善;模型的训练与优化就是凭借计算机的数据运算和处理能力,不断地分析数据、调试参数、完善模型的过程。从中我们不难看出,设计者自身的价值判断、数据所隐含的社会倾向性等因素贯穿了算法的整个过程。

(一)运算规则设计中的算法偏见

通过大数据分析来研究受众的阅读偏好或者搜寻热点新闻的传播情况时,就需要编写一定的算法,在这个过程中就要预设一定的“标准”来对信息类型或受众偏好进行归类。《洛杉矶时报》在一篇有关洛杉矶警方人为降低犯罪率的调查报道中,使用机器学习算法解析了《泰晤士报》先前调查中的犯罪数据,将经过训练的算法放到2005年至2012年之间发生的近2400起小规模犯罪的随机样本中,以找出哪些犯罪被错误分类了。在对该结果进行人工检查时发现该算法错误率高达24%(Nahser,2018)。由此可见,预设分类标签不是客观的度量,而是一种社会建构概念,一定程度上反映的是人的主观性。

(二)数据收集、处理及运用中所隐含的偏见

纽约大学教授丽莎·吉特曼(LisaGitelman)在《原始数据只是一种修辞》一书中指出:

数据从来都不可能是原始存在的,而是依照一个人的倾向和价值观念而被建构出来的。我们最初定下的采集数据的办法已经决定了数据将以何种面貌呈现出来。数据分析的结果貌似客观公正,但其实如同所有新闻报道一样,价值选择早已贯穿了从构建到解读的全过程。最终的结果看起来很无私,但实际上从构建到演绎的整个过程一直伴随着价值选择(徐端,2014:59)。

数据在收集的过程中,偏差就已经在积累了。“哈佛大学的计算机系教授拉谭雅·斯威尼(LatanyaSweeney)发现,在搜索引擎上搜典型的黑人名字,搜索引擎会有超过80%的概率在搜索建议里提供‘逮捕’‘犯罪’等词汇,而没有种族特征的却只有不到30%。”(李子李子短信,2018)因此,数据的统计方法、统计范围都包含着一定的价值判断和价值偏向,训练所用的数据的体量、多样性、真实性、准确性都将影响到算法模型的成熟度、对同类问题预测的精准度等。

(三)运算过程中的算法偏见

算法的运行是按照既定的程序输入数据,依据计算法则对数据进行解读,最后输出运算的结果。从表面上看,算法的运行过程不太可能产生偏见,但事实上并非如此。众所周知,高效、精准的信息推送靠的是算法推荐系统对用户需求和兴趣的认知来实现的,而这里的“认知”则是指推荐系统的智能处理和深度学习能力。深度学习就是通过“学习”大体量的用户行为数据,来把握数据特征以及数据特征之间的关系,进而建立数据模型,实现优质推荐。

训练大数据算法的数据,主要依赖于抽样,然而一旦抽样,随机性就很难保证,一些稀有的现象(即涉及少数族群的数据)很可能就选择不上,从而导致训练结果更“青睐”于在统计上占多数族群那一类。为了设计方便,大数据算法有时会“不自觉地”把一些特征不太明显的少数族群数据,直接归属于多数族群的错误(或噪音)数据之中,而非细细考究它是不是属于某个少数族群,……因为他们所占的比例很小,对整体的预测精度的影响也不大(张玉宏,秦志光,肖乐,2017)。

“机器学习就是程序通过实例提取模式,并使最初的算法或模型在实例中不断优化的过程。”(刘友华,魏远山,2019:69)这也意味着,机器学习技术不仅应用于算法模型的训练过程中,也同样适用于算法的应用阶段。人工智能的目标是实现机器学习的智能化,算法在深度学习,即与周围环境的交互过程中,不可避免地会受到外部因素的影响。在和用户互动时,算法不能决定用户会输入何种数据,无法决定保留或删除某些数据,只能被动地利用用户和外部环境所提供的各种数据进行深度学习。如果与算法互动的对象提供了富集偏见的新数据,就会导致原本公正的算法在深度学习之后异化为问题算法。2016年,微软曾经在Twitter上推出了一款聊天机器人Tay,它就是通过与人类对话进行学习的,因为受到美国4chan网站一个网络聊天社群的不良影响,变成了具有种族歧视、性别偏见的AI。

算法偏见对新闻信息传播的影响

(一)背离了公平公正的新闻职业规范

(二)挑战了用户知情权和信息选择权

(三)易于解构社会共识,引发舆论风险

新闻传播中算法偏见的应对策略

算法使物质生产发生了变化,指导和管理生产的各项规制也需要及时做出调整,以避免因滞后性导致“文化堕距”的出现。算法偏见的成因是多样性的,对其能够产生约束和规范效应的规制不仅只涉及技术问题,同时还包括法律法规、职业伦理等,需要从多个方面布局。

(一)从法律法规层面规约算法设计者和使用者

2019年4月,美国两位参议员科里·布克(CoryBooker)和罗恩·怀登(RonWyden)联合提出了《2019算法问责制法案》(AlgorithmicAccountabilityActof2019),试图对人工智能机器学习中的偏见和个人敏感信息的使用问题进行规制。他们认为算法越来越多地参与到人们生活的重要决策中,但是,这些算法往往依赖、而不是消除有偏见的假设或数据,这些假设或数据实际上将会对妇女和有色人种产生歧视。因此,法案提出制定关于算法的评估规则,必须评估算法是否存在歧视性偏见以及它们是否对消费者构成隐私或安全风险。算法偏见、算法歧视等问题的暴露使得明确责任的归属,以及由此衍生的人们对算法的信任,成为了影响算法技术发展的瓶颈,构建适用于算法的法律体系已经成为亟待解决的现实问题。

当下,在尊重算法运行逻辑的基础上,明确算法设计者和算法使用者的行为有助于避免算法偏见的产生。算法设计者对自己设计的算法负有直接责任,对因算法设计问题所造成的歧视、偏见等有损使用者的结果理应承担一定的责任与义务。

(二)以“技术之力”消除“技术风险”

技术的发展遵循着一种循环逻辑:为解决问题采用了新技术,新技术引发了新问题,然后采用更新的技术去解决问题。

算法的透明度不仅牵涉新闻生产流程的“客观性”“公平公正”,而且关联着公众对新闻媒体及其产品的信任。因此,随着算法在新闻生产、新闻推送的应用日渐增多,面对的作者的困惑和不愿披露的算法过程,“透明度”越来越多地被用作新闻合法化的规范基础,透明度不仅可以对算法进行有价值的检查,还可以提高算法对道德、文化和认识论等的影响力(Carlson,2018)。

总之,技术只有透明才能获益。每一种技术都能通过以下这三个准则得到改善:用户对技术的了解应当和技术的创造者一样多;技术信息应该随技术一起传播;其他技术也应该了解它的一切(凯利,2012/2012:327)。

(三)建立第三方审核机构,强化行业自律

(四)构建公平公正的算法价值观

随着技术的进步、算法平台的反思和运算规则的优化,人们开始对算法有了更深入的认识。算法本身没有价值观,但算法是由人来定义、设计和运行的,人在价值观上的某些缺陷也体现在算法上。就目前的技术水平而言,算法在新闻传播领域的追求是实现高效率的分发、信息流动效率的最大化,以及内容生产的个性化,但是,我们不能忽略的一个前提是算法也要有正确的价值观的引导。因为算法是在做信息的生产与传播,它在属性上就烙下了“媒体”的印痕,它就必须承担社会责任。算法的追求不仅仅是效率和流量,更在于为社会确立、维护正确的价值观。

算法系统除了需要技术人员和运营人员的参与,在实际运行中还有大量用户的参与,尤其是来自用户行为的数据更是进行机器学习的关键,但是,不能完全依靠用户的数据来实现算法的自我进化和修正。正如拉扎斯菲尔德和默顿所说的,“大众传媒是一种既可以为善服务,也可以为恶服务的强大工具。而总的来说,如果不加以适当控制,它为恶的可能性则更大”(Lazarsfeld&Merton,1948)。算法虽然不是大众传媒,但由于其深度参与了信息的生产和发布,自然也需要人类的适度控制与监督。从算法系统的决策、设计到运营,必须自始至终遵循一套正确的价值观体系。尽管信息社会、数字化、大数据等概念已经为人们所熟知,但是,智能算法作为技术快速发展的产物,在大家的头脑中依然是陌生的、神秘的。因此,对算法的设计者、运营者、使用者以及用户而言,可以考虑把“算法价值观”纳入专业技能培养和通识教育体系中,帮助大家认清算法运行的基本原理和局限性。

结语

本文系简写版,参考文献从略,原文刊载于《国际新闻界》2020年第10期。

THE END
1.心理学:积极心理学试题及答案(题库版)考试题库276、单项选择题 幸福感产生的生理机制不包括()。 A.脑机制 B.表达的机制 C.药物的影响 D.积极幻想 点击查看答案 277、填空题 人类对消极主题的欣赏和接受,是内心消极性的映射,弗洛伊德称之为的“()”,它人类一种与生俱来的、顽固的破坏欲望. 点击查看答案 278、填空题 预设型叙事的实施所遵循的是()的...http://www.91exam.org/exam/87-4518/4518774.html
2.首因效应学生处(学生工作部)首因效应:想象一下,在一个聚会上,你第一次见到一个人,他给你留下了非常积极的第一印象。即使后来发现他有些小缺点,这个初印象依然会让你倾向于用更宽容的视角看待他。这就是所谓的“首因效应”,也称为“初印象效应”。心理学研究表明,我们对一个人的第一印象往往会对我们后来的感知和评价产生长期影响。 https://jyx.zzlgxy.net/i/H202411144152000029942.shtml
3.引起知觉的偏见常见的原因有:()。引起知觉的偏见常见的原因有:()。 A.首因效应 B.近因效应 C.无意注意 D.晕轮效应 E.刻板印象 点击查看答案进入题库练习 查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧 无需下载 立即使用 你可能喜欢 单项选择题 电话调查的一个优点是()。 A.速度快,范围广,费用低 B.调查对象有充裕的...https://m.ppkao.com/mip/tiku/shiti/671072.html
4.银符考试题库在线练习13. 在知觉偏见产生的原因中,最近或最后印象的强烈影响被称为___ A.首因效应 B.近因效应 C.晕轮效应 D.定型作用 A B C D 14. 一般指热切地追求知识或从事某种活动的外现性意向是___ A.兴趣 B.气质 C.动机 D.需要 A B C D 15. 按照一种固定的倾向去认识事物、判断事物、思考问题,表现出心理...http://www.cquc.net:8089/YFB12/examTab_getExam.action?su_Id=16&ex_Id=6927
5.自考大专04265社会心理学复习资料(考点)复习资料六、产生偏见的原因 1、群体间的利害冲突:偏见产生的最根本原因在于群体间的厉害冲突。因为资源是有限的,为了得到更多的物资利益,群体之间就会产生竞争冲突,这就是造成偏见的基础。 2、社会化的影响:有些人的偏见是社会化的结果,及后天学来的。这种学习可分为三种方式:直接学习;模仿学习;环境气氛的感染。 http://mip.mdgs-edu.com/fxzl/1782.html
6.分享新华社整理总结:新闻报道的常见差错及处理二、产生差错的原因: 1、对电脑操作不熟悉。编辑在输入工作完成后没有认真检查稿件,导致出现多字、少字和别字。 2、编辑文字功力不够,知识面太窄。这方面最常见的情况就是编辑识字量不够。 (通稿,原本是一些新闻通讯社的“专利”。他们在采访到一些重要新闻以后,会以一种统一的稿件方式发给全国的需要稿件的媒体...https://ibi.cuc.edu.cn/2019/0319/c4118a120156/pagem.htm
7."名人广告”"名流公关”利用了知觉偏见中的A近因效应B首因效应C...常见的影响人际知觉偏见的因素有()。 A.首因效应 B.近因效应 C.晕轮效应 D.刻板效应 免费查看参考答案及解析 第一印象的强烈影响,知觉的偏见的产生原因中称作() A、定型效应 B、近因效应 C、晕轮效应 D、首因效应 免费查看参考答案及解析 引起知觉的偏见常见的原因有()。 A、首因效应 B、近因效应 C、...https://m.12tiku.com/newtiku/919884/41102201.html
8.心理咨询师二三级基础知识要点总结人的心理有主观性、能动性,是脑活动的结果,是客观世界在脑中的反映。心理反映的形式包括事物的形象、概念、体验、欲望和要求等。心理支配人的行为活动,又通过行为活动表现出来。因此,可以通过观察和分析人的行为活动来客观的研究人的心理。 动物心理发展经历了感觉、知觉、思维萌芽三个阶段。心理现象的产生以能对具有...https://www.360doc.cn/document/71137081_943225074.html
1.心理降试题及答案19.社会知觉包括个体对(BCD)的知觉 (A)环境 (B)自己 (C)群体 (D)他人 20.在有限经验的基础上形成的刻板印象往往具有消极的性质,会使人对某些群体的成员产生(BC) (A)态度 (B)偏见 (C)歧视 (D)距离 21.根据社会心理学家的研究,个体归因时遵循的主要原则包括(ABD) ...https://www.ruiwen.com/shitidaan/8245190.html
2.心理安全知识竞赛试题库(带答案)69、心理咨询的形式包括个别咨询和团体咨询。√ 70、我们总是倾向于把他人的成功行为归因于内在原因。× 71、人本主义疗法是一种指示性的心理疗法。× 72、“杯弓蛇影”是人产生错觉的典型例子。√ 73、酗酒也是一种心理障碍。√ 74、心理咨询时,不应该打断求助者的叙述,免得引起对方的反感,哪怕对方叙述的内容...https://mip.oh100.com/kaoshi/peixun/418803.html
3.心理降人际关系教案(全文)刻板印象的好处是能快速地了解一个陌生或不太熟悉的人或群体的特征,但它也带有其弊端:一是它夸大了群体内成员间的相似性,使我们对个体的知觉产生先入为主、以偏概全的偏差;二是夸大了群体间的差异性,容易产生偏见与歧视。 4.投射效应 人际关系中的投射效应,指与人交往时把自己具有的某些不讨人喜欢、不为人接...https://www.99xueshu.com/w/sg44d74xe5ms.html
4.常见的人际知觉偏见及解释常见的人际知觉偏见及解释 导语:人际关系中知觉偏见的纠正人际知觉是指我们对人与人之间关系的知觉,包括自己与他人关系以及他人与他人的关系。人际知觉是在人际交往中形 人际关系中知觉偏见的纠正 人际知觉是指我们对人与人之间关系的知觉,包括自己与他人关系以及他人与他人的关系。 https://www.unjs.com/w/101690.html
5.常见的社会知觉偏见主要有()等几种【判断题】观察者知觉的不准确性可以在“现实生活”中出现,但是这无法在心理学的实验中被重复。 A. 正确 B. 错误 查看完整题目与答案 【多选题】影响社会知觉的主观因素包括( )。 A. 情绪 B. 兴趣 C. 动机 D. 经验 查看完整题目与答案 【多选题】变质岩常见的定向构造有哪些?() A. 板状...https://www.shuashuati.com/ti/8ed4e8b8d3ac435a9bd46730824c5b47.html?fm=bdbds8d7383d8a9f30f798bade5a5613bcf61
6.四川自考(00182)公共关系学真题及答案22.组织内部公众包括() A.管理人员B.技术人员C.生产人员D.销售人员E.社区居民 23.公众的特点有() A.群体性B.共同性C.多样性D.变化性E.相关性 24.形成知觉偏见的常见原因有() A.首因效应B.近因效应C.晕轮效应D.刻板印象E.蝴蝶效应 25.传播的内容分析主要包括() ...https://m.sczikao.com.cn/beikao/a43698.html
7.速成课一、心理学简介***流派(一)精神分析:弗洛伊德自由联想→这个技术成为他职业生涯和心理学整个分支的基石。精神疾病可以用谈话疗法和自我探索来治愈。动机→我们的人格是由无意识的动机所形成的,我们每个人,都被我们自己意识不到的心理过程深远地影响着。我们的思想被我们自己都不知道的东西所驱动着。潜意识→治疗方法:...https://movie.douban.com/review/9577384/
8.认知的个体差异与管理重点复习资料(管理心理学)? 知觉是人脑对当前直接作用于感觉器官的客观事物的整体反映。知觉是在感觉的基础上,在知识经验的作用下,经过人脑的加工而产生的。 ? 感觉是事物的个别属性在人脑中的反映,它是最简单的心理现象,但它保证了机体与环境的信息平衡,是一切较高级、较复杂的心理现象的基础。 http://www.zikao35.com/34429.html
9.2021年10月自考00182公共关系学真题与答案自考22.组织内部公众包括 A.管理人员 B.技术人员 C.生产人员 D.销售人员 E.社区居民 23.公众的特点有 A.群体性 B.共同性 C.多样性 D.变化性 E.相关性 24.形成知觉偏见的常见原因有 A.首因效应 B.近因效应 C.晕轮效应 D.刻板印象 E.蝴蝶效应 https://zikao.cwjedu.com/lnzt/13727
10.毫厘之差,意义不同:50对易混淆的心理学术语辨析界面新闻·JMedia偏见是一种内在的态度,是个体根据对方所处团体(如非裔美国人,犹太人,肥胖者,共和党等)对对方预先做出的不成熟的、负面的判断;歧视是一种外在的行为,因对其个体及其所处团体有不满或其他原因,对个体进行不公平地对待,如侮辱对方,减少对方应得资源,或是故意不雇佣对方等。 https://jiemian.com/article/1704776.html
11.{公共关系}第三讲公共关系的对象3、知觉的偏见? 知觉的偏见:是人们在感知事物的时候,由于特殊的主观动机或外界刺激,对事物产生一种片面的或歪曲的印象。 ? 引起知觉偏见的常见原因 1)首因效应:即第一印象 2)近因效应:即最近或最后印象的强烈影响。 “屡败屡战”的故事 2)近因效应? 在公关传播工作中就需要注意这种近因效应, 要注意用...https://doc.mbalib.com/view/0599ed3056fc4c23e6fcdafbb1c04a16.html