生成式人工智能对新闻业的变革将超越功能层面,深入到新闻的理念和结构层面。
生成式人工智能(GAI)正在展示技术的颠覆性力量,被视为至少能与互联网、智能手机相提并论的前沿技术,其代表性应用是2022年底以来发布的ChatGPT、GPT-4等智能程序。它是向数据学习的神经网络系统,半年来已经被广泛运用于日常对话、生活服务、新闻传播、艺术创作(音乐、绘画、时尚、设计和文学等)、商业经营、科学研究、医疗保健、教育教学等各个领域,其爆炸性流行被视为公众采用人工智能技术的第一个真正转折点,也成为激发生产力和人类创造力的巨大引擎。
就新闻业而言,生成式人工智能相当于给每一位新闻工作者配备了一位高效率的助手,给每个新闻机构增添了额外的资源、创新的可能性,也带来了更复杂的专业问题。
本文将从当前生成式人工智能在新闻传播业的应用实践及其效应着手,探讨生成式人工智能对新闻传播的业务、机制的影响,以及它们对新闻专业、新闻理念和记者角色带来的挑战与重塑。
生成式智能赋能新闻业
生成式人工智能正在以一种魔法般的方式,简化了人们将想法、创意转变为现实的过程。新闻界以十分迅捷的反应,投身于这个正在引领新闻业巨大变革的新技术。事实上,早在它发布之前,媒体已经迫不及待地融入智能新技术的洪流之中。
(一)智能技术已经深入新闻业务
美联社只是使用人工智能的一家媒体,实际上,同时期使用人工智能的媒体还包括彭博社、路透社、福布斯、纽约时报、华盛顿邮报、英国广播公司等大型媒体。这些大型媒体的人工智能应用主要是将机器学习(从数据中学习)运用于采集、制作和分发新闻等各个流程。
(二)生成式智能技术运用于新闻业
2018年以来,大型语言模型和基础模型得到突破性进展,不仅破解了语言复杂性的密码,使机器能够学习上下文、推断意图和独立创造,而且还可以针对各种不同的任务快速进行微调,为生成式人工智能的进步提供了动力。生成式人工智能是一种机器学习系统,是基于算法、模型等创建文本、音频、图像、视频和代码的技术系统。ChatGPT、GPT-4便是其中的代表,它们先后于2022年11月、2023年3月问世。
ChatGPT是一种由人工智能技术驱动的自然语言处理工具,可让人们与聊天机器人进行类似人类的对话、可以回答问题并帮助完成许多任务,例如制作订制化的健康食谱、健身计划,撰写电子邮件、论文和代码等等。
生成式人工智能为新闻业的大变革提供了重要机遇。传统的新闻采访、写作、编辑、制作、分发、核查,都可以运用ChatGPT等模型作为得力的辅助工具。
主要工作包括:第一是数据分析。生成式人工智能运用了海量的数据,可以为新闻工作者提供有力的数据分析,从而提供见解或启发,帮助记者寻找更独特的角度、更有洞察力的思考方向。
第三是算法个性化。智能算法可以根据用户的偏好生成个性化内容,这样有助于契合用户需求、做到精准生产与分发。第四是事实核查。尽管生成式人工智能在内容的准确性、真实性方面受到质疑,但它可以通过数据训练后自动对信息进行事实核查,帮助新闻工作者核实信息的准确性。
(三)新闻业布局生成式智能
ChatGPT横空出世,对新闻业的震撼非同小可。美国非常活跃的《内幕》(Insider)全球总编辑卡尔森(NicholasCarlson)称之为“海啸”:海啸即将来临,我们要么驾驭它,要么被它消灭。他认为人工智能会让新闻业变得更快更好。《内幕》新闻编辑部于4月中旬成立了一个工作组,以测试将人工智能负责任地纳入其工作流程的方法,然后再向新闻编辑部推出一套更广泛的人工智能规则和最佳实践。
卡尔森4月14日向员工发送了一份备忘录,表示“不得不”学习如何使用和小心使用智能技术,记者才能变得更好。卡尔森一直在广泛使用聊天机器人,视其为“双人文字处理器”(“atwo-playerwordprocessor”),可以帮助克服写作中的常规障碍。他鼓励记者开始谨慎试用ChatGPT等编写的文本、报道大纲,用ChatGPT等纠正拼写错误、为搜索引擎优化标题、准备采访问题,但不鼓励将敏感信息(尤其是细节)放入ChatGPT。
该报科技专栏作家、被Bing测试聊天机器人“爱上”的罗斯(KevinRoose)3月撰文说,他已让ChatGPT帮自己提出采访的问题:他将被采访嘉宾的简历粘贴到ChatGPT中、要求它向这位嘉宾提出10个深思熟虑、敏锐的采访问题。ChatGPT生成的问题大多数都很好,被罗斯在节目中采用了。
在写这个喷气飞行器的比喻时,曼珠很难选择一个合适的动词来表达,他写了“screams”(尖叫、呼啸)又觉得不妥。他说要在过去他可能会使用同义词库或者绞尽脑汁地找一个合适的词,而现在,他将自己写的整个段落插入ChatGPT、要求它提供替代动词,ChatGPT为他推荐的替代动词中,“soar”是排在第一的。
曼珠还总结出ChatGPT的其他一些用途:协助编辑工作,比如写过渡语;提炼和总结,比如在重大而复杂的新闻事件爆发时,需要迅速从长篇文件(法院裁决、收益报告、政客的财务表)里提炼出概要。特朗普被起诉时,《内幕》总编辑卡尔森将购得的长篇文件放到ChatGPT中,让它给了一个300字的摘要,从而辅助《内幕》决策如何迅速报道这件事。ChatGPT很擅长从长篇大论中提取摘要和主题。
专业性困境与负责地使用生成式智能
ChatGPT等生成式人工智能为新闻业的效率与革新带来了种种机会,但同时也带来了诸多挑战,尤其是人工智能生成内容在机制上就存在与新闻专业性相悖的方面。生成式人工智能在赋能新闻业的同时,却不一定能够优化新闻业。
(一)模型本身的局限性
生成式人工智能的大语言模型逻辑,是机器可以从数据和模式中学习,从而创建模仿人类行为和创造力的新内容。由于数据和模式的种种缺陷,生成式人工智能存在系统性偏见、价值观对抗、“观点霸权”、刻板印象、虚假信息等问题。而模型本身也有其局限性。
这类局限的最大困境是:生成式人工智能不理解其生成的文本的含义。当它面对细微差别、歧义或讽刺之类的内容时,它难以理解其中的真实意义;它可以生成似是而非但不正确甚至荒谬的文本;它无法验证其输出的真实性;它的输出可能是公式化的,可能会单调乏味、缺乏想象力;它可以生成带有偏见、歧视性或有毒的文本。
当然,对于这类大模型带来的更深的担忧,还不只在这些应用层面,更多的在于未来可能失控的深层困境方面。包括深度参与人工智能开发的教父级的人物辛顿(GeoffreyHinton)、在过去的四十年里开发了驱动GPT-4等系统技术的本吉奥(YoshuaBengio),都担心大模型可以学习不想要的和意想不到的行为,它们不仅可能生成不真实的、有偏见的和其他有毒的信息,而且对坏人不设防——很难找到办法防止坏人利用它们来做坏事。
(二)审慎使用生成式人工智能
CNET的错误不在于其使用了新技术,而在于其使用得不谨慎、不恰当。目前生成式人工智能在新闻业中的应用,存在专业性(如准确性)、伦理(如公正性)和责任难题,并且可能缺乏批判性思维和创造力。但是,在权衡利弊得失之后,人们还是将这项新技术作为新闻业的一次机会,并以坚持专业性、合乎伦理的方式使用ChatGPT,人作为主导者,通过人工编辑和审核确保准确性,保持人类记者的独特立场。
新闻业如何合理地、负责任地使用生成式人工智能?有一些准则值得重视:一定要检查和编辑生成文本的准确性和质量;将生成式人工智能视为半成品而非成品;将生成式人工智能用于一些重复性或耗时的任务,这些任务不那么具有创造力或独创性;不要使用任何敏感或私人信息作为输入数据;将生成式人工智能与其他工具和技术结合使用,并融入自己的创造力、情商和战略思维。
讨论:变革不只在功能层面
上文抓取了生成式人工智能在新闻业中的最前沿性应用的数据和案例,展示了目前在生成式人工智能背景下新闻业适应新技术的现状、语境和遇到的难题。牛津大学牛津互联网研究所研究员西蒙(FelixSimon)认为,如果使用得当,生成式人工智能技术是新闻的一次机会。人们追求的仍将是与以前相同的目标和相同的需求,人工智能改变的只是追求方式。
但是我们不能局限于应用这种功能层面。从长远来说,这种有别于传统技术的人工智能技术,带来的影响会超越功能性层面,而渐进为一种新闻的理念和结构性的作用。这里从两个方面做些探讨。
(一)数据驱动的故事新范式将会挑战新闻观念
生成式人工智能技术提供了创新报道范式的可能性。记者可以利用人工智能生成的见解、可视化数据和多媒体工具,从原始数据中自动创建摘要和引人入胜的新式叙事,从快速生成交互式叙事、数据驱动的报道到推出沉浸式故事,等等。而这些影响将会从生产流程变革深入到机制层面,更进一步渗透到新闻观念层面。
生成式人工智能将进一步驱动新闻的多模态转换,推动新闻视觉化的浪潮。它可被用以多模态转换,在文本、声音、视觉符号之间自动转变。2016年出现的软件Wibbitz可以将文本自动转换为视频,很快就被众多媒体使用,比如BBC使用Wibbitz为其在线新闻和时事节目制作视频。如今,GPT-4、文心一言等生成式人工智能软件,更是集多模态转换为一体。
人工智能工具可以通过分析图像、视频等协助视觉叙事,它们可以自动标记和给视觉元素分类、生成说明文字,可以根据基础数据创建可视化效果或信息图表,让用户有机会探索数据驱动的视觉叙事和复杂信息,以冲击性的视觉模式唤起情绪反应。人工智能技术还降低了沉浸式新闻的生产门槛,让记者轻松构建交互式页面、虚拟现实或增强现实叠加层。生成式人工智能也可以根据文本描述或数据自动生成3D模型、动画等视觉效果,帮助记者创建增强现实的内容。记者还可以创建专为支持语音的设备设计的音频新闻故事。
生成式人工智能对新闻流程和机制的改变,挑战了传统的新闻观念。比如,智能算法推动的个性化的新闻,是一种以受众为中心的思维驱动的,它挑战了传统的传者中心、传者引领的传播观念,强化的是与一般商业等同的消费者至上的观念,进一步祛魅媒体作为公共利益代言人的角色。生成式人工智能也挑战了新闻业传统的生产者主体身份观,人类生产的内容和智能生成的内容之间的界限变得模糊,这种情形还会进一步引发对新闻业的透明度和问责制的疑虑。
多模态自动转换也带来对新闻理念的挑战。首先,生成式人工智能将提升交互式叙事的运用,将新闻引入非线性叙事,新闻故事可以根据用户交互分为多个路径或结果。这种情形改变了传统新闻的线性叙事结构,使得新闻也朝着多样化和动态的叙事结构演化。
再次,多模态化的一个趋向,是智能技术带来的视听新闻的潮流化,文本信息将更多地被自动转换为图像、图形、图表或其他视觉元素。转换通常是被简化的总结,由于视觉效果的空间和注意力范围有限,自动化过程可能会压缩文本,减少文本的复杂性或微妙内涵;自动转化还难免忽略某些上下文元素;将文本转换为视觉效果的过程还涉及解释和主观性,自然会影响原文本的叙述和解释;未来的视听化会带来新闻的短浅化;文本叙事驱动读者构建的心理形象和想象力,逐渐让位给视听新闻叙事的感性消费、即时反应;视觉叙事通常依靠象征性、图像和视觉隐喻来传达意义,而由于象征性、文化语境和视觉素养的差异,视觉效果的解释可能会很不同。
第四,多模态转换还会带来意义损害和歪曲的问题。比如,来自斯坦福大学和哥伦比亚大学学者的研究指出,将文本转换成图像,大规模地放大了人口刻板印象。他们研究了将文本转换为图片智能模型如Dall-E和StableDiffusion,发现这些系统放大了“大规模的人口刻板印象”。比如,当提示创建“清洁人员”图像时,生成的所有图像都是女性。有人在国内一款语言模型应用中也遇到同类情形,当提示画一幅“老板在开会”的图时,图中显示的老板全是男性。
(二)生成式人工智能工具挑战新闻专业的实践观念
但是,这样的新型辅助工具,在悄然改变新闻工作者的角色和定位。新闻本源于社会实践,如今它由数据驱动,这是否挑战了新闻专业的基础?智能技术替代采写实践,是否挑战了新闻工作者的职责和实践观?
中央电视台的记者1979年在王府井百货大楼停车场看到了一些单位的公车,于是才有了《新闻联播》的第一条批评报道《王府井百货大楼前的停车场见闻》,美国记者在一个偏僻的休假地见到了一辆首都车号,才揭开了一位政治要员的丑闻。作为社会实践的新闻和新闻业,与由“数据驱动”的新闻之间,存在着矛盾。新闻作为一种社会实践,强调记者深入一线、深入生活实践去观察,在与一线的互动中了解、理解社会问题,发现一手的、鲜活的新闻线索,并根据价值观和人类经验进行报道。而依赖数据,虽然同样可以做出独家的报道,但是缺乏一手的、鲜活的现场体验和现实反映。
记者方面,数据驱动的报道正在重新定位记者的角色。记者从积极的新闻信息采集者、解释者,转变成了数据的管理者和分析者。这种转变,对以传统的采写为己业,以探寻背景、揭示真相、通过采访呈现观点的传统新闻价值,是很大的挑战。实地采访能够让记者捕捉到新闻发生的情境、洞察其中的复杂性和细微差别,其中会融入记者的主体性,比如个人经历、情感和社会体验。
当然,新闻工作者限于其知识、经验、实践范围和判断能力等的影响,也存在种种不足。如今通过数据驱动,获得更广阔的信息,通过智能工具获得洞察力,来弥补自身的不足。但是当智能工具被广泛使用后,可能会使他们过于依赖数据驱动的方法,从而让他们忽视了新闻的更广阔的社会背景和社会问题的复杂性。
新闻业本质上是一种以人为本的事业,依赖人类的直觉、调查挖掘能力和判断力,才会彰显人性化、明辨性思维和价值观。记者必须在数据驱动的洞察力和他们的专业性、新闻理想和目标之间建立一种平衡关系,从而更准确、更有深度地报道有价值的新闻,紧守“实践出真知”的专业底线。
如芒福德(LewisMumford)所言,人类拥有比其他一切组合都更为重要的生物学装备——大脑及其支配的身躯。新型智能技术带来的挑战,将会从新闻实践延伸到新闻机制、规范乃至伦理观念,我们需要见微知著,深入研究。
(作者:陈昌凤,清华大学新闻与传播学院教授、安徽大学大师讲席教授;)
“与时代同行”陕西广电融媒体集团(台)举行记者节主题活动
省委第三巡视组巡视陕西广电融媒体集团有限公司党委工作动员会召开