做好“数字金融”,大模型大有可为

当前,全球的人工智能技术不断取得新突破,我国人工智能也在蓬勃发展,赋能千行百业。生成式AI大模型必将为金融业变革带来新的发展机遇。

基本信息

书名:《生成式AI大模型:赋能金融业变革》

作者:姚前,杨涛主编

开本:16开

页数:228

字数:202千

定价:46元

书号:978-7-5115-8160-0

作者简介

姚前

杨涛

国家金融与发展实验室副主任,中国社会科学院产业金融研究基地主任,研究员,兼任全国金融标准化技术委员会委员等。主要研究领域包括宏观金融与政策、数字经济与数字金融、支付清算等。已主编出版图书《中国产业链韧性:金融的力量》《金融创新:助力实现共同富裕》《绿色金融:助力碳达峰、碳中和》等。

内容简介

随着金融科技的蓬勃发展,金融行业正经历着一场革命性的变革。金融垂直领域模型构建与金融数据的结合成为推动金融科技创新和发展的重要动力。同时,金融垂直领域的大模型应用仍面临挑战。《生成式AI大模型:赋能金融业变革》邀请中国工商银行、清华大学、中国工程院、中国证监会等产、学、研领域的十余位权威专家,对金融领域大模型的技术、应用、合规、监管等方面进行深入阐释,力图共同构建更强大、安全、可靠的金融垂直领域基础模型,切实为经济高质量发展提供助力。

专家推荐

李扬

中国社会科学院学部委员、国家金融与发展实验室理事长

郑纬民

中国工程院院士、清华大学计算机系教授

大语言模型为人工智能系统赋予强大的语言理解和生成能力,具有明显的优势特征。在金融行业,大语言模型可以用于金融分析、风险分析、客户分析等众多业务场景,本书对此也有多方论证与详细阐述。当前,众多金融机构主动融入数字中国建设大局,加快建立开放性的产业生态,把选择权交给用户,驱动行业百花齐放,也将能真正促进大模型产业在金融领域的健康发展。

柴洪峰

中国工程院院士、复旦大学金融科技研究院院长

金融垂直领域的大模型应用仍面临挑战。金融数据和知识的私密性限制了共享和构建大规模数据集的能力,金融数据的多模态特性也增加了模型处理和建模的复杂性,还有“幻觉”、伦理治理等问题。为了克服这些难题,加强产学研用的合作势在必行。本书综合展现大模型的有关理论与具体应用实践,为新形势下更好地促进大模型落地金融场景提供很好的借鉴和启示。

高峰

中国银行业协会首席信息官

大模型应用将给银行业带来深远影响。不同规模的银行,走出了不同路径。大型银行坚定地加入了人工智能大模型技术发展浪潮之中;中小银行也从战略层面开始重视大模型应用并与多方合作。针对大模型落地过程中遇到的各种难点,各家银行已在积极寻求解决方案。本书包含多方面的探索与实践,将为银行业金融机构提供应用范例,助力其持续提升数字化转型质效。

编辑推荐

作者专业:作者均为来自学界、监管层、业界的专业人士,能够充分瞄准问题痛点,把握发展方向。

专家认可:中国社会科学院学部委员李扬、中国工程院院士郑纬民、中国工程院院士柴洪峰联袂推荐。

内容丰富:既有对大模型落地金融业的详细介绍,又包含具体的应用实例,同时针对当前金融业数字化改革面临的一系列问题进行深刻探讨。

目录

向上滑动阅览

序一大模型赋能金融科技:思考与展望柴洪峰Ⅰ

序二生成式AI让金融服务更有温度高峰Ⅴ

前言杨涛001

上篇大模型考验治理智慧

01大模型生态建设与合规发展007

02生成式AI大模型的金融应用仍需“闯关”022

03走向负责任和可问责的金融大模型伦理治理034

段伟文

04人工智能在金融领域应用的风险暴露与监管挑战051

尹振涛王美懿

05大模型赋能金融业的责任之路066

温昱晖段力畑

中篇大模型如何改变金融业

06AI大模型在银行业的落地探索实践089

吕仲涛

07银行如何拥抱AI奇点时刻——以ChatGPT为例100

沈志勇

08生成未来:人工智能预训练大语言模型在金融风险管理的应用及展望114

俞勇

09大语言模型在银行财富管理领域的应用130

吴永飞宁冰叶广楠刘森

王彦博陈志豪陈生杨璇

10大模型在基金投顾领域的潜在应用和风险143

刘玮范仲悦马彦楠

下篇人工智能还将走多远

11以数据资产图谱技术构建金融大模型的数据供给生态157

林常乐

12人工智能大模型在金融行业的应用展望与建议169

李振华刘沛然徐润卢传斌徐枞

13大语言模型在金融知识服务中的挑战与应对181

庞斌孔夏

14大模型在银行客户体验管理和客户经营领域的应用实战193

孙中东陈涛

序言一

大模型赋能金融科技:思考与展望

柴洪峰中国工程院院士

随着金融科技的蓬勃发展,金融行业正经历着一场革命性的变革。金融垂直领域模型构建与金融数据的结合成为推动金融科技创新和发展的重要动力。通过整合跨学科研究和系统方法,能够探索金融系统的整体性和复杂性,超越单点技术突破,从而推动金融科技的突破性进展。近日,国家金融与发展实验室副主任杨涛教授邀请我为本书作序,我将从大模型赋能金融科技方面谈谈自己的思考和对未来的展望。

大数据、人工智能和机器学习等技术的发展,使人们能更快速、高效地获取、分析、存储、共享和整合各种异构数据。然而,金融垂直领域的大模型应用仍面临一些挑战。金融数据和知识的私密性限制了共享和构建大规模数据集的能力。此外,金融数据的多模态特性增加了模型处理和建模的复杂性。为了克服这些难题,加强产学研的合作势在必行,共同构建更强大的金融垂直领域基础模型,提升大模型对多模态数据的表达能力至关重要。

一、构建金融垂直领域模型:金融数据与通用大模型的结合

金融科技的崛起正在改变金融行业的面貌,实现金融科技突破对于推动金融领域的创新和发展至关重要。而整体思维和系统认知是实现金融科技突破的首要前提,金融系统是一个开放复杂巨系统,已经很难依靠“点”上的技术突破实现整体提升。所以需要将跨学科的研究和系统方法作为解决重大关键问题的首选项。

系统认知就是要从系统要素构成、互作机理和耦合作用来探索问题的解决途径。金融与实体经济是一个生命共同体,金融领域的科学突破必须突破单要素思维,从资源利用、运作效力、系统弹性和可持续性的整体维度进行思考。

数据科学和信息技术是金融领域的战略性关键技术,数据科学和分析科技的进步为金融领域的研究和知识应用提供了重要的突破机遇。大数据、人工智能、机器学习等技术的发展提供了更快速的收集、分析、存储、共享和集成异构数据的能力和高级分析方法。数据科学和信息技术能够极大提高对复杂问题的解决能力,在动态变化条件下,自动整合数据并进行实时建模,促进形成数据驱动的智慧管控。

人机混合智能技术将成为推动金融领域进步的创新驱动技术。人机混合智能技术包括自然语言处理、机器学习、计算机视觉、语音识别和智能推荐等多个领域。这些技术的发展使得人和机器间的交互变得更加智能化,人机混合智能在金融领域的应用也越来越多,最新的大模型技术,如ChatGPT、MOSS、ChatGLM等,是和目前的金融垂直领域结合的热点。

金融数据底座的构建可以包括各类金融实时数据,各类需解析的文档数据、各类非结构化数据以及信息高度浓缩文本。通过庞大的金融垂直类数据为金融大模型提供数据支撑。

对于金融垂直领域大模型的构造需要解决的关键问题有如下三点。

一是多源、异构金融数据金融数字底座构建、金融数据安全共享使用。

二是金融数据底座与大模型的融合技术,解决通用大模型在垂直领域知识匮乏、知识关联问题,同时实现模型根据数据实时更新、不断迭代。

三是基于金融科技底座的大模型对于金融科技多领域的应用赋能,展现金融垂直领域涌现能力。

然而目前大模型在金融垂直领域仍未挖掘出涌现效应,一方面是由于金融数据及知识的私密性导致难以共享,无法构建一个庞大的数据集,对此可以增强产学研的联动性,共同构建更强的金融垂直领域基座模型。另一方面由于金融数据模态更多,难以进行统一的处理建模,而如今的大模型对此种多模态的表达能力仍有待加强。

二、关于知识图谱与大模型的融合:知识驱动与数据驱动的交互

在过去的研究中,我们构建金融知识图谱系统,其过程多为从研报、财报等各类非结构化文本信息中抽取多源异构知识,通过实体对齐、实体消歧等知识融合方法完善庞大复杂的金融知识图谱,并通过分布式图数据库存储图数据,便于后续分布式图算法的开发与应用,这些已构建的金融知识图谱在大模型时代仍有其不可替代的应用。

知识图谱是过去对显示知识的一种符号化表达,大模型是对隐性知识的新兴表达。在大模型时代,也不能完全摒弃已构建的海量知识图谱,知识图谱能够指导大模型对行业进行正确精准的认知,提高其理解、推理决策的能力。知识图谱及专家知识库解决问题的范式需要与基于与统计学习的大模型范式相融合,才能更好推动领域内涌现能力的出现。我们需要把以知识图谱为代表的知识驱动方法,基于利用静态以及动态的知识图谱,与以大模型为代表的数据驱动方法进行持续交互,运用多种模式,以达到知识图谱与大模型的完美结合。以人机结合方式解决现实中的复杂问题,在认知的过程中,通过人机协同挖掘一些很难由人类或计算机单独发现的新知识。

三、关于金融大模型的监管:从安全角度解决大模型的部署问题

二是对于金融大模型的部署与使用,需要协同共治,提升透明度,保证数据质量和可解释性的机制。这可以帮助用户与监管机构理解模型的决策依据,并确保其不带有偏见或歧视性。

三是监管机构还应加强对于金融大模型的审查和风险评估,对于关键人物和系统,应建立审查和测试的机制以确保其安全性。

首先是数据安全问题。大模型的复杂性和规模增加了攻击者进行攻击的可能性。同时,大模型的训练过程涉及更多的数据和计算资源,这也给无恶意攻击者提供了更多的机会来入侵和篡改数据模型。目前大模型极易因通过对抗攻击、后门攻击、模型窃取等手段而遭受威胁,需要寻找有效的方法规避风险。大模型在辅助金融场景知识问答的过程中,由于无法对用户身份进行识别,容易产生高等级或机密信息泄露等风险,需要对大模型训练过程中的数据安全等级做严格的界定。

序言二

生成式AI让金融服务更有温度

高峰中国银行业协会首席信息官

大模型将给银行业带来深远影响。一些银行业金融机构坚定地加入了这场浪潮之中,农业银行推出ChatABC,工商银行发布了基于昇腾AI的金融行业通用模型,中国银行、交通银行、邮储银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行、江苏银行等多家银行都在探索大模型应用。一些银行业金融机构已从战略层面开始重视大模型,但受制于算力资源紧缺、算力成本高昂等因素,很多金融机构开始从单纯希望自己建算力、建模型,转变为探索应用层面多方合作。银行业金融机构更关心业界用大模型做了什么,实现了怎样的效果。具体到不同规模的银行,也走出了不同路径。大型银行具有海量金融数据和应用场景,可引入业界领先的基础大模型,自建企业大模型,形成专业领域的任务大模型,快速赋能业务。值得一提的是,针对大模型落地过程中遇到的各种难点,各家银行都在努力探索解决方案。

对大模型应用在银行业落地应持审慎态度。大模型应用需要具备“三个条件”,即技术成熟度、政策支持、应用场景。2022年元宇宙技术也曾众星捧月,但最终并没有在金融业“落地生根”,归根结底还是因为技术与业务没能深度融合,没能实际改善金融业的服务效率。对金融机构来说,合规是第一要务。国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行,目的就是促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。没有应用场景,新技术就是“无根之木”。当前,大模型技术并不成熟,而金融行业是一个强监管、高安全的行业。目前金融大模型已经应用在内部职能运营方面,如金融资讯、产品介绍等内容的文本自动生成,提升了内容运营效率;以助手形式、人机协同来提升业务人员工作质效,构建虚拟客服在线交互等,给用户提供更人性化的服务。而像投研、投顾等场景,价值很大,但很难快速产生效果,对数据的要求也高。总体而言,内部员工训练模型目前使用比较广泛,而对外、对客的使用还不是很多。

银行业大模型存在数据安全问题和隐私泄露风险。大模型的训练和应用涉及大量身份信息、金融资产、交易记录、信用历史等个人敏感数据,导致存在合规风险。随着大模型应用场景增多,需要打通的银行各业务部门数据范围越来越广。然而当前各业务部门的数据采集使用标准不统一,数据治理与规范整理过程将成为新挑战。行业亟须制定数据治理操作标准与数据规范整理操作指引,建立数据治理与评估体系,实现全域化数据治理。

此外,生成式AI大模型赋能金融业还存在其他一些问题。大模型对算力要求提升,硬件设施未来亟须完善。大模型的高成本、高能耗与绿色AI发展理念不符,如何平衡大模型训练需求与碳排量至关重要。国产芯片设计和制造方面虽取得了显著进步,但与国际顶级厂商相比,仍存在一定的技术差距。我国大模型涌现,但均从Transformer等基础模型衍生,在底层网络及框架方面的研究布局较少,大模型底层技术、基础架构由国外头部企业掌握,存在“卡脖子”隐患。大模型应用于银行业需克服幻觉问题、基准测试对标难问题等。

大模型和人工智能对元宇宙的兴起提供了很好的机会。元宇宙在2022年就已经比较火爆,2023年大模型又对元宇宙起到了“空中加油”的作用。国内外金融元宇宙的应用重点在虚拟营业厅、数字员工。目前,已有工商银行、建设银行、交通银行等11家客服中心与远程银行实现了虚拟数字人应用落地。在应用场景方面,虚拟数字人广泛应用于对客服务、风险控制、新媒体运营、内部赋能等四大领域,并全面提升远程银行智能化水平与客户体验。大模型将赋能虚拟数字人“智能进化”。AIGC大模型在语义理解和内容生成方面有着卓越表现,虚拟数字人或成为AIGC在远程银行的最佳着陆点。在AIGC大模型的加持下,虚拟数字人将被广泛应用于前台员工辅助、中台运营赋能、后台管理支持等各环节,推动金融场景内容生产加速发展。虚拟数字人助推远程银行转型升级,其作为人机交互新入口,未来将助推远程银行沉浸式交互体验更加拟人、降本增效更加显著、数字化转型质效持续提升。

总而言之,AIGC对金融业的影响主要在于减少人力成本、丰富并优化有温度的金融服务。具体来说,在远程银行、投研、运营、营销、风控、数字员工等方面,AIGC都有一些很好的应用案例。但同时也面临一些挑战,主要包括芯片设计制造、成本控制、数据安全以及法律法规制定等等。应对这些挑战,我从四个方面提出发展建议与举措。第一,监管方面,应形成一套完备的人工智能监管体系,制定针对不同业态的法规,对生成式人工智能进行监管。第二,法律法规方面,应加强数据隐私保护,提高透明度和可解释性;加强伦理和道德约束,制定伦理准则和行业标准。第三,人才方面,应加强产学研结合,通过与企业合作开展实践项目,加强国际合作和人才引进。第四,生态方面,应针对性开放数据并共享数据,支持开放研究合作。

THE END
1.ai大模型和小模型的区别ai大模型和小模型的区别 人工智能领域中的模型分为两种,一种是大模型,另一种是小模型,两者在训练和应用中有着明显的区别。 本文将从定义、特点、应用等方面详细介绍这两种模型的区别。 一、概念定义 ,大模型通常指参数数量较多、结构比较复杂、精度较高、计算量较大的模型。它们能够处理更复杂的问题,能够提高模型...https://m.elecfans.com/article/2207224.html
2.AI大模型应用入门实战与进阶:Part16AI大模型未来趋势1.背景介绍 随着人工智能技术的发展,AI大模型已经成为了许多领域的核心技术,例如自然语言处理、计算机视觉、推荐系统等。这些大模型通常具有高度的参数量和复杂性,需要大量的计算资源和数据来训练和优化。在这篇文章中,我们将探讨AI大模型的未来趋势,以及如何应对其所面临的挑战。 https://www.jianshu.com/p/f3b441e1fbe4
3....哪家公司研发的kimichat语言模型性能详细介绍kimi人工智能作为一款备受关注的产品,其出色的性能和广泛的应用领域引发了人们对其研发公司的浓厚兴趣。那么,究竟是哪家公司研发了这款引领潮流的人工智能产品呢?小编这里整理了些相关资料,快来和我一起看看吧! kimichat语言模型性能详细介绍 1、Kimi智能助手是由国内AI公司月之暗面开发的,创始人是杨植麟。 https://www.crsky.com/zixun/592457.html
1.一文让你搞懂什么是AI大模型(非常详细),零基础入门到精通,看这一篇就够...大模型的复杂性使得其内部机制难以解释,如何提高模型的透明度和可解释性是一个重要研究方向。 尽管如此,AI大模型的未来依然充满希望。随着计算能力的提升和算法的不断优化,大模型将在更多领域展现出其强大的能力和应用前景。 结语 通过本文的介绍,相信你已经对AI大模型有了全面的了解。无论是自然语言处理、图像识别,...https://blog.csdn.net/weixin_49892805/article/details/142652947
2.探索AI大模型的分类方法与技术在人工智能领域,AI大模型是指参数量庞大的深度学习模型,拥有强大的学习能力和推理能力,能够解决更加复杂的问题和任务。在技术层面,AI大模型的分类方法与技术主要包括模型结构、训练策略和推理加速等方面的技术突破。以下将详细介绍这些技术方面的发展和应用。 https://yaotai.163.com/cs/metaverse/ZsKcwY4BLmgvlgK6_Shl.html
3.AI大模型应用入门实战与进阶:大模型在知识图谱构建中的应用...1.背景介绍 知识图谱(Knowledge Graph, KG)是一种以实体(Entity)和关系(Relation)为核心的数据结构,用于表示实际世界的知识。知识图谱的应用范围广泛,包括信息检索、问答系统、推荐系统、语义搜索等。随着大规模机器学习(Deep Learning)和自然语言处理(Natural Language Processing, NLP)的发展,大模型(Large Model)在知...http://www.zhangshiyu.com/post/68325.html
4.人工智能大模型原理与应用实战:大模型的基本概念51CTO博客1.背景介绍 人工智能(Artificial Intelligence, AI)是计算机科学的一个分支,研究如何使计算机具备人类智能的能力。随着计算能力的提升和数据量的增加,人工智能技术在过去的几年里取得了巨大的进展。在这一进程中,大模型(Large Models)发挥了关键作用。大模型是指具有大量参数(通常超过百万或千万)的机器学习模型,它们可以...https://blog.51cto.com/universsky/8997109
5.关于举办AIGC技术与大模型应用实战师资培训的通知同时为助力战略性新兴产业融合集群发展和现代化产业体系建设,以实现高水平科技自立自强、建成教育强国、科技强国、人才强国的远大目标,深圳信息职业技术学院(通信类国家级职业教育“双师型”培训基地)结合当前新兴产业技术发展趋势与人才培育需求,拟定于2024年4月11日-17日举办“AIGC技术与大模型应用实战师资培训”活动,...https://www.sziit.edu.cn/info/1038/16020.htm
6.万字长文详解:大模型时代AI价值对齐的问题对策和展望在弱人工智能时代,人们可能难以设想一个具有通用任务执行能力的AI存在如此具体紧迫的危险,但在大语言模型(LLM)爆发式发展的今天,我们需要更好地理解并能够具象化感知这一危险发生的可能性。因此,本文将从这一带有科幻色彩的故事走入,将AI价值对齐拆解为几项比较具体的研究方向,从学术的角度进行详细阐释。https://36kr.com/p/2469833834666113
7.“积极拥抱AI大模型”!腾讯云胡利明发声问:能否简单介绍AI大模型对于金融机构有何价值? 胡利明:本轮AI大模型热潮给包括金融行业在内的各行各业都带来了深远的影响。AI大模型通过大规模的参数和预训练技术,使得AI具备了比过去更强大的理解能力和表达能力,因此应用场景非常广泛。 对于金融机构而言,善用AI大模型,就相当于配备了一群不限数量的优秀“大学毕业...https://finance.eastmoney.com/a/202309102842760628.html
8.大模型综述:万字长文详解AI大模型的原理应用与未来趋势(非常...在自然语言处理(NLP)和人工智能(AI)的浩瀚星空中,大语言模型(Large Language Models, LLMs)如同一颗璀璨的新星,正在改变我们与语言、与机器交互的方式。本章将带您踏上一段探索之旅,揭示大语言模型的发展历程、独特魅力及其在现实世界中的多彩应用。 1.1 语言模型的进化史 ...https://www.jindouyun.cn/document/industry/details/236141
9.公司介绍蜜度Midu公司介绍 蜜度科技股份有限公司 坚持以实用的AI产品,为客户创造更大价值使命 科技赋能千行百业愿景 蜜度成立于2009年,是一家以人工智能技术为核心的语言智能和垂直大模型企业,专注于多模态、多语言智能科技,以数据与AI算法双轮驱动,赋能千行百业实现数智化转型升级。 蜜度基于自主研发的蜜巢、文修两个垂直大模型,利用...https://www.midu.com/about
10.AI摄影仅需要了解这几款AI绘画大模型!一秒生成胶片风拍立得...介绍 随着AI技术的快速发展,AI绘画技术也在不断进步。 通过训练大模型,AI能够学习并复现现实世界中的各种人和事物,使生成的照片具有更高的真实性和艺术性。加上最新新的AI绘画模型不断涌现,为用户提供更多选择,使得生成的照片更加多样化和精致。 我向你推荐三个时下最火热的真实人大模型,并与你分享利用各种embe...https://www.yizz.cn/3127.html
11.全球十大最强大模型AI大模型实力排名全球知名大模型盘点→...人工智能技术是全球科技竞争的重要领域,全球数家科技公司已加快布局和发展人工智能产业。本文中Maigoo小编将带大家看看全球十大最强的AI大模型,如ChatGPT、Claude、Gemini,以及LLaMA、MPT、StableLM、Falcon、通义千问、文言一心等都较具代表性。下面一起来详细了解下这https://www.maigoo.com/top/440978.html
12.使用Jmeter对AI模型服务进行压力测试腾讯云开发者社区在上文我们介绍了如何使用腾讯云的GPU部署大模型,我们使用了FastChat框架部署了ChatGLM3-6B的模型。 但是通常我们在对模型选型时,还需要对大模型进行评测。 在评估AI模型时,我们除了要关注模型本身的性能指标外,还需考虑提供的模型服务性能、吞吐量以及并发性等方面。本文将介绍如何利用JMeter进行压力测试,并获取关键的...https://cloud.tencent.com/developer/article/2356687
13.一周AIGC丨Pika完成5500万美元融资,国内首套AIGC汉服亮相韩媒:三星 Galaxy Book 4 系列笔记本 12 月 15 日发布,将支持本地运行高斯 AI 大模型 据IT之家援引韩联社报道,有业内人士透露称,三星电子将于本月 15 日推出搭载英特尔下一代处理器酷睿 Ultra 的 Galaxy Book 4 系列笔记本电脑,号称是全球首款 AI 笔记本。 https://www.thepaper.cn/newsDetail_forward_25540020