专题:第二十届中国国际金融论坛
2023年12月14-15日,第二十届中国国际金融论坛在上海成功举行。蚂蚁集团副总裁、蚂蚁金融技术委员会主席、蚂蚁金融的大模型负责人王晓航应邀出席并发表了题为《大模型升级金融产业全链路》的主旨演讲。在演讲中,王晓航表示,大模型作为新一轮AI浪潮的焦点,正在金融领域催生一个全新的AI应用范式,推动行业用户体验和生产效率的提升。然而,金融作为专业严谨、安全性和合规性要求高的行业,在大模型落地的“最后一公里”面临着多重挑战。他认为,大模型无法开箱即用,在金融产业中的落地是一个复杂的系统工程。为确保可靠性,大模型的应用需要进行专业增强、知识增强、检索增强和安全增强等方面的工作,并需要全周期的强化,包括数据治理、价值对齐、风险识别、知识增强以及攻防对抗等领域的工作。
以下为演讲实录:
王晓航:各位领导,行业的同仁,大家好!很荣幸参加第二十届中国国际金融论坛。
在近期的中央金融工作会议中,提到了包括数字金融在内的五大篇章,前面听到各位领导和行业同仁对数字金融发展的机遇和风险的讨论,对此我收获颇多。现在我代表蚂蚁,从金融科技实践者的角度,向大家介绍我们在数字金融领域的AI应用实践,特别是围绕金融大模型的产业动态。
深耕金融智能,迎接产业产业智能化新拐点
金融行业对大模型技术寄予了厚望,并将其定位为一次产业技术革命。然而,要实现技术变革并产生规模化的价值,并非一蹴而就,通常需要经历阶梯式发展过程。在大模型的应用落地之前,我想与大家回顾金融行业人工智能应用的发展历程。
作为普惠金融的实践者,蚂蚁一直处于人工智能和金融结合的最前沿。早在2013年,蚂蚁就推出了余额宝和小微金融等一系列国民产品,这是金融领域首次拥抱规模化互联网,为人工智能的能力展现创造了巨大空间。在那个时候,蚂蚁创造了小微金融310模式,通过AI解决了小微长尾客户的风险防控问题,初步展示出金融人工智能的普惠价值。
到了2017年左右,数字金融领域开始采用开放平台模式。以蚂蚁财富、蚂蚁保、网商银行为代表的数字金融平台以更开放的姿态连接行业机构,为平台上的大量用户引入丰富且优质的服务和产品。在这一阶段,数字金融全面智能化,人工智能开始广泛应用于各种业务场景,成为营销、服务、投研、风险管理和资产管理等业务降本增效的关键手段。在此期间,蚂蚁积累了超过300个金融人工智能应用,线上运行着超过2000个专业AI模型,为下一阶段的产业智能化奠定了坚实的基础。
2023年,在AI技术和算力长期积累的基础上,我们迅速自研了大模型技术,并转向大模型带来的新应用范式。大模型落地金融领域过程中,它展现出了深度和速度两个显著优势。在深度方面,大模型具备出色的语言、认知、推理和交互能力,在各种多元金融场景任务中不断刷新前沿技术水平(SOTA),逐渐接近或达到人类专家水平。例如,在研报解读和市场分析方面,已经达到了媲美初级或中级分析师的水平。在速度方面,大模型将算法架构大一统,极大降低了人工智能的开发门槛和成本,促使更多的智能化创新在各个领域和场景中广泛涌现,并形成了爆炸式的技术浪潮。
在大模型时代,我们认为金融智能的前景更加广阔,趋势也更加明确。
金融服务链条上的关键环节,都值得用大模型重做一次
以金融大模型在蚂蚁的应用全景为例,我们全栈自研,推出蚂蚁金融大模型,并搭建了一个较为成熟的产业化应用基座 —— 以大模型为认知和交互的中枢,连接用户金融意图与业务场景,精准地调用金融专业知识和服务能力。通过这个“大模型 + 知识增强 + 服务增强” 的框架,为广泛的金融应用场景提供语言力、知识力、专业力、以及AI可靠性的支撑。
一、金融大模型与客户洞察结合。面向金融消费者,我们引领服务智能,打造人人都有的智能金融助理;面向理财顾问和保险顾问,我们引领销售智能,为理财顾问和保险代理人量身定制生产力应用,提高专业水平和销售服务半径;面向数字化运营,我们引领营销智能,带来更精准的供需理解,更多元化的表达,突破创意和效率空间。
金融大模型与金融专业相结合。面向金融产业中的大量中后台从业者,如投研分析师、风险策略专家、精算师等等,他们日常工作中大量时间会花费在信息提取、定性分析和量化编码等基础工作上,大模型能够很好地承担这部分初中级的自动化工作,让他们更加聚焦在创造性和专业深度的工作。
金融大模型与隐私计算相结合。面向金融机构泛生态,通过联合理赔、联合风控、联合营销等一系列的技术,让中小金融机构也能够享受到数据互联互通的技术红利,实现可持续运营和发展。
蚂蚁金融大模型,解决产业真命题
蚂蚁金融大模型从诞生的第一天开始,我们的定位就是要立足于产业,解决产业中的真实命题。
今年9月,在上海外滩大会,我们发布了蚂蚁金融大模型及ToC和ToB的两个应用产品,我们称之为1+2。 蚂蚁金融大模型具备更好的金融通识,在五大类28维度的金融任务评估中,相较通用大模型,有非常突出的性能和效果提升。在发布的早期,就已经通过了等同于证券从业、保险从业、精算,以及保险医疗领域的执业医师、药师从业等一系列准入资格考试。近期,蚂蚁金融大模型团队沉淀了一系列的金融智能体,它拥有链接和规划的能力,不仅能够与真实的产业环境进行连接,还能遵循定制的业务规则和策略,自主进行规划和执行。
请允许我展开介绍一下我们的ToC应用,支小宝2.0。支小宝在大模型问世前就上线了,曾经是小模型时代理财服务行业的翘楚,是为年轻一代的金融消费者提供的互动式智能理财助理。目前,在蚂蚁金融大模型的加持下,支小宝2.0大幅提升了语言力、知识力、以及学习使用专业顾问工具的能力。
在金融资讯和金融知识通识方面,支小宝2.0可以做到有问必答,保障95%以上端到端的准确率的同时,事实率接近100%。对比主流的通用大模型,双盲对比胜率达到80%以上,显著得到了大模型技术带来的技术红利。同时,用户可以通过简明的自然语言,无感流畅操控支小宝2.0背后的300多款数字化专业工具,并获得定制化、个性化的服务方案,如基金选品、资产配置、保障配置等等。支小宝2.0已经在蚂蚁的理财和保险业务上已经进行了半年多的深度测试,我们期待支小宝2.0尽快与大众用户见面,给各位带来更好的交互式体验。
支小助,是我们面向金融从业者打造的智能业务助手,这是一个系列产品。下面,我以投研支小助为例展开介绍。
投研分析师的工作模式,在过去的20年时间里并没有发生特别大的变化。从2000年初开始,以彭博为代表的金融信息服务商,为金融分析师开发了一整套工具生态。但是直到2023年的今天,投研分析师的分析工作,还是以手工为主。金融大模型强大的推理能力,结合大规模的世界级的金融知识工程,使我们首次具备了在这个行业里实现质变的技术前提,我们第一次看到“通过AI驱动的智能化分析”媲美初级分析师的可能性,并立即着手展开实践和落地,并推出了代表性作品——投研支小助。投研支小助的硬核科技有两大秘籍,一是自动量化编码(NL2Quant),通过自然语言形式自动生成代码和图表。在基础的信息提取、数据处理、业绩回撤等量化分析工作上,预计一年内可减少投研分析师70%左右的工作量,让他们可以聚焦在更有创造性和高价值的工作事项。二是智能体协同技术,面向定性分析,它可以遵循专家所定义的各种细分品类的研判框架,把信息收集、推理、分析、写作以及评估审核全部包办。在投研支小助强大能力的武装下,蚂蚁各部门的普通工作人员,从前台的理财顾问、资讯编辑,到后台的工程师、分析师等角色,能够在定制化的财报解读、研报解读、行业政策解读等十多个专业品类的分析框架帮助下,达到初级或中级分析师水平。
大模型落地金融产业,是复杂的系统工程
在上述的介绍中,主要是金融大模型带来的具有代表性的一系列行业案例,以及落地实践状况。其实我们都认识到,在金融这样专业且严谨的产业,通用大模型无法实现 “开箱即用”,我们认为,大模型落地金融行业,需要克服领域知识短板、复杂决策短板、可靠性短板等三个方面的挑战。
首先是金融领域的知识短板。通用大模型有效地压缩了万亿量级token的世界知识,通识强大,但在金融领域的通识是相对薄弱的。所谓领域通识,是对某一个专业领域基本原理的理解,而不仅仅是名词解释。比如在金融领域,一个初级通识的案例:对于一项金融资产,它的流动性、收益和风险构成“不可得三角”。但是,如果我们向通用大模型提问,“给我推荐一只包赚不赔、收益很高的理财产品”,它无法可靠理解金融通识,更谈不上正确引导投资风险和流动性等等专业性意见。此外,通用大模型还存在很多短板,比如无法实时更新金融信息,无法实时把握市场动态等。
其次是金融决策的复杂性短板。打个比方,通用大模型是个优秀的“文科生”,理解能力、语言能力、推理能力超群,可惜在复杂决策和数学方面差强人意。然而,在关乎金融本质的决策链路上,我们更需要严谨的“理科生”。我们无法把一个家庭资产配置方案或保障配置方案,简单托付给通用大模型,也不建议通用大模型现阶段贸然涉足严肃的金融业务。在大模型能力成熟、责任边界清晰前,金融科技需要安全审慎前行。
第三个短板是可靠性,即大模型的幻觉与金融的严谨性之间存在冲突,金融领域的大模型发展之路遍布可靠性缺失的荆棘与陷阱。比如“一个用户是否可以购买某一个金融产品”这样一个看似简单的命题,背后蕴藏了一个“合格投资者认证”的判别问题。金融行业领域的可靠性不仅限于合规,还包含内容安全性、事实性、实时性、科技伦理和金融价值观等方面。
为了有效补齐上述短板,让大模型技术安全可靠地落地金融场景,除了对通用大模型注入金融通识和私域知识,还需要一套系统工程解决方案,通过有效的技术组合,跨越鸿沟。
首先是专业增强,大模型要能与专业领域的小模型协同。大模型在感知、认知和交互领域具有显著优势,而各个专业小模型专注于特定问题或任务,在特定领域(运筹、量化、图算法)表现更为优异。在实际应用中,我们可以将大模型作为认知和交互的中枢,而小模型则负责专业判断和决策,通过大模型调度小模型共同完成复杂的推理和决策工作。
第二是知识的增强,实现大模型隐性知识与图谱显性知识互补。大模型通识覆盖广,但不够严谨可靠,容易出现幻觉和答非所问的现象。相比之下,图谱显性知识专业性和可靠性强,但生产维护成本较高。鉴于金融领域的头部问题是收敛的,应用中可用图谱覆盖严谨性和价值双高场景(比如主流保险产品的条款,核保核赔知识),大模型覆盖低频和长尾场景,以实现服务质量与服务成本的平衡。
第三是检索的增强,当面临一个需要严谨回答的问题,可以转化为“检索增强”问题:先从专业可靠的内容中进行检索,再基于检索结果做金融级推理和解答,以提升答案的可靠性。该过程,就像是让大模型先找到一本金融教科书,再在书籍中去寻找、理解,并生成简明扼要的答案。
最后是安全增强,确保大模型安全性、可靠性、合规性。大模型落地金融产业,最大挑战就在于可靠性,这是行业共识的。 刚才各位领导的发言也提到,科技发展带来机遇的同时,也需要有效防范风险,可靠性至关重要。虽然上述三个技术组合可以有效弥补大模型的不足,但在消费级金融应用方面仍有待提高。蚂蚁在为数千万消费者提供服务的过程中,积累了丰富的安全和合规技术,构建了一套全生命周期的、立体化的、可靠性加固技术,以确保大模型的训练和推理过程的可靠性:
(1)在训练阶段,源头的数据治理是关键。在金融领域,我们需要“高大正”(高质量、大规模、价值观正确)的数据。中文世界约有2000亿token的金融语料,然而通过模型和人工的层层清洗和筛选,我们认为最终能够达到高质量高标准的语料,只有10%左右。在金融领域,质量比数量更重要,我们需要在源头上保障大模型的学习质量和价值取向。此外,我们在训练阶段需要通过“精调和对齐”技术,确保大模型的价值取向正确。
(2)在线上推理阶段,蚂蚁为金融大模型设立了专用安全围栏:在请求和生成两端都进行严密的风险判别和拦截。这个系统称为“蚁鉴”,由数百个识别模型和数十万判别规则组成。同时,我们通过模型和人工结合方式,建立了数百万的负向样本,在模型上线前后,持续自动化攻击金融大模型可能存在的可靠性薄弱点,检测安全能力。
通过一系列安全与合规技术的加固,蚂蚁金融大模型在金融可靠性评估的各个维度达到99%以上,已能媲美人类专家,具备了对消费者开放的可靠性条件。
最后简单总结,大模型落地金融产业最后一公里,几个关键点:
(1)不存在“开箱即用”,大模型落地金融产业需要经历专业增强、知识增强、检索增强和安全增强一系统复杂工程;
(2)大模型满足可靠性, 需要全周期强化,从数据治理、价值对齐、风险识别、知识增强、到攻防对抗;
(3)金融Agent,遵循专业策略框架,调用专业知识和工具,独立且协同,解决复杂产业问题。
谢谢大家。