• 官方微信

    官方微信
  • 官方APP

    官方APP
  • 官方视频号

    官方视频号
  • 电子报

洞察金融市场

传播中国价值

Global Perspective, China Value

机构热议!大模型这样赋能资管高质量发展

来源:中国基金报 2023-09-24 15:41

中国基金报记者 郭玟君

当前,大语言模型在海内外正百家争鸣。随着AI和大语言模型进一步发展,如何使之高效、安全地赋能资产管理和财富管理数字化和高质量发展,成为行业关注的焦点。

9月22日,在通联数据与深圳市投资基金同业公会共同举办的“大语言模型赋能资产管理高质量发展”峰会上,行业领导、专家学者及来自金融机构、科技公司的代表多角度探讨行业发展现状与趋势,分析业务发展痛点与需求。

国内外机构持续探索

大模型多场景赋能

通联数据智能投研业务中心总经理许丹青表示:“我们正身处信息爆炸的市场中,信息内容庞杂,AI投研助理需要对信息去作更精准定位、深度萃取,并提供独到见解。目前,通联数据主要是借助大语言模型能力,在找信息、看研报、找数据、写点评、做复盘等多个场景提供AI投研助理服务。”

许丹青认为,大语言模型的机遇在于,它具备语言理解能力、语言生成能力、零样本学习能力,有知识、能推理,且具备任务的理解与规划能力。

在财富管理方面,麦肯锡全球董事合伙人、大中华区资产管理和财富管理负责人马奔指出,生成式AI对于财富管理公司而言有三大价值:升级客户交互体验,赋能员工效率和专业能力提升,以及加速产品创新。

马奔举例说,目前理财经理和投资顾问60%以上的时间浪费在流程性、事务性工作中,同时不同理财经理和投资顾问的专业性也参差不齐。在此背景下,全球领先银行正在持续探索和推动通过生成式AI赋能前线财富管理团队效率和专业度提升。全球领先银行正加速推动将生成式AI技术嵌入多个财富管理场景,包括理财师智能助手、客户虚拟财务助理、人生目标导向的智能投顾助手,客户智能投顾配对平台等。

此外,马奔表示,生成式AI还可以扮演虚拟投顾专家的角色。例如,某国际大行已将生成式AI嵌入其内部投研投顾知识整合平台,在客户向一线投顾提问时,平台可基于公司平台核心投研团队的研究成果实时自动生成为客户量身定制的答案,投资顾问只需略作修改便可发给客户。这就相当于让所有客户都能迅速获取公司首席投资策略师、首席经济学家和各行业首席分析师最新的投资洞见,大大提升了客户体验。

国内大型金融机构也在积极拥抱AI。据招商证券金融科技中心AI开发团队负责人石国忠介绍,从AlphaGo 到 ChatGPT ,招商证券 AI 紧跟前沿技术发展节奏,致力于以AI科技为力量,以数字化为方向,为业务创新赋能,为员工提质增效。

他同时表示,大模型技术是金融行业实现降本增效的新工具。证券行业是智力密集型行业,在通用大模型出现前,AI赋能比较有限,通用人工智能与投行、投顾、投资、投研等业务领域结合可能会带来生产力飞跃。未来将大幅改善服务客户的界面,服务载体和入口形式会有重大的变化,是数字化和弯道超车的宝贵机会。

石国忠表示,根据平台厂商的行业调研,证券研究员对类ChatGPT应用有较高期望,迫切需要类似工具辅助研报撰写。此外,证券行业的IT及数字化、客户运营及合规监管也对大模型有需求。建议选择证券行业核心能力场景(投资研究服务)、中低难度场景开始探索。高价值场景包括:利用大模型的NLP能力为成熟系统二次赋能;利用大模型能力发挥企业内部数据价值;分析师与AI助手以自然语言的方式交互,通过大模型进行语义解析、意图识别,进而路由调用系统功能接口返回结果;创造属于员工自己的AI助手;最终从量变到质变,从模仿人类思考到具备心智的智能体,具备端到端解决复杂问题的能力。

中国大模型综合能力

全面追赶国际先进水平

许丹青指出,大模型应用的制胜关键在场景与数据。场景方面,距离客户需求越近,对客户痛点洞察越清晰,越有可能做出客户认可的场景应用,建立场景飞轮效应。同时,大模型应用也对高质量数据提出了更高的要求,通联数据在基础数据、专业数据、海量文本数据方面均有非常深厚的积累,也为本次大模型应用奠定了非常好的基础。


她认为,OpenAI的GPT4仍代表全球最高水平。Mata的Llama2作为开源领域最好的模型,大大降低了大模型的研发门槛和成本。8月31日,经过大模型备案,国内的百度、字节、商汤、中科院旗下的紫东太初、百川智能、智谱华章等8家企业/机构的大模型产品已经可以正式上线对公众提供服务。

至于场景,许丹青表示,目前国外以微软为代表的企业,已经在多个领域的产品化、商业化上形成了较好的闭环。国内则在会议软件和办公助手方面形成了较稳定的生态体系,金融、社交、医疗、法律、旅游等领域目前处于探索阶段,都有机会胜出。

数据方面,许丹青指出,中国的水平并不差。ChatGPT3.0的参数量在3000亿左右,ChatGPT4.0据推测是万亿级别。国内的Baichuan2使用了2.6万亿的token,百度为4000亿,通联数据大概是3000亿左右。

鹏城实验室研究员(正高级)孙东宁博士认为,大模型的应用有两个方面,一个是工具,一个是数据。金融科技公司有非常好的技术力量开发这些大模型的工具,而数据很多来自于金融公司业务的数据,所以这两方面很重要的一个事情是建立一种数据共享、技术共研机制。孙东宁谈到,鹏城实验室刚刚发布了“鹏城·脑海”大模型, 在智慧金融等多方面应用提供了一个大模型基础底座。

据记者了解,鹏城实验室主任、中国工程院院士高文9月21日在2023华为全联接大会上正式发布了“鹏城·脑海”(PengCheng Mind)通用AI大模型,以国产化基座大模型为新一代AI大模型发展构筑新基点。“鹏城·脑海大模型”是国内首个自主可控、安全可控、开源开放,应用驱动的自然语言预训练大模型,底座参数量级达到2000亿,性能对标ChatGPT-3.5,通过基于增强学习的大模型微调技术,脑海大模型能够持续演进、快速迭代更新,并且输出内容符合中文核心价值观。鹏城实验室希望建立合作伙伴关系,共享领域知识,共建大模型,对提供数据和核心应用的合作者,建立合作伙伴关系应用智能工具,实时更新增强模型,实现大模型在智慧医疗、智慧金融等多个垂直领域的应用。鹏城实验室同时推出了参数量级为700亿的微缩版大模型,在其社区完全开源。

此外,无论技术创新还是业务创新,合规是底线。据石国忠介绍,目前国内相关管理办法逐步出台,合规展业已有迹可循。当前,与大语言模型密切相关法律法规包括:《互联网信息服务深度合成管理规定》和《生成式人工智能管理暂行办法》等。还在筹备中的有:《信息安全技术生成式人工智能服务安全总体要求》《信息安全技术生成式人工智能预训练和优化训练数据安全规范》和《信息安全技术生成式人工智能人工标注安全规范》等。

大模型发展热潮下的

行业冷思考

在大语言模型发展热潮中,深圳市投资基金同业公会副秘书长邱伟胜提出,行业需要进行冷思考。

石国忠指出,尽管大语言模型发展的愿景很美好,但目前,路径尚不明朗。随着大模型应用落地进入深水区,硬核技术问题将无法回避。包括:底层模型选择通用大模型还是专用模型、生成内容的安全大模型的幻觉问题应该怎么解决、大模型能否端到端解决任意问题、性能瓶颈与算力瓶颈应当如何解决等。

他认为,国内外通用大模型能力存在代差,但国内的大模型的迭代演进速度很快,这个差距会越来越小。金融行业数据安全性要求比较高,要等国内大模型更加成熟,才能应用通用人工智能。

石国忠同时指出,中国金融企业要建设自主可控的私有化大模型。海外通用大模型不可能在国内公司大规模商用,因金融行业数据安全性要求较高,国内通用大模型也不可能覆盖所有应用场景,公司要建设自主可控的私有化模式。根据不同业务场景数据敏感程度,匹配不同的大模型选型。

许丹青也列举了一系列大语言模型存在的缺陷。一是“幻觉”问题,有时候它可能一本正经地胡说八道,需要进行信息溯源。二是投研知识不足,生成的内容通俗化、科普化,专业性不足,对于投研领域的专业术语理解不准确。三是无法直接应用到场景中,需要与场景、数据进行结合,与多个小模型、定制模型进行配合。四是时效性差,大模型中没有最新的数据和知识,不能检索互联网,无法实时获取和更新最新的信息。五是不能做严谨的形式推理,不能用于严谨的数学推理和证明。六是成本高,最好的模型GPT-4门与成本仍然很高,大模型的私有化成本非常高,依赖大规模的算力和维护成本,大模型私有化的性价比也较低。因此,通联数据推出3.0版AI投研助理,逐个落地投研场景,解决痛点问题。

针对算力问题制约大模型大规模使用,石国忠认为,国产化芯片是突破方向。他同时呼吁,建设行业专属大模型基础设施,共同打造金融大脑。

南方科技大学南方科技金融研究院副秘书长李凯博士认为,大语言模型在不到一年的时间里快速发展和演进,各方应对其保持开放的态度,积极尝试,以更聪明的方式形成人工智能赋能产业高质量发展新格局。同时要尽量避免急中出错,盲目进入堆砌算力的军备竞赛。行业需要搭建互相沟通的平台,汇聚生产要素形成合力,控制风险,产生价值,形成闭环,降本增效。

景顺长城基金副总经理陈文宇说:“用大语言模型确实仍存在诸多局限性,但它确实是功力非常深厚的工具,我们要用好它。我们应和它建立类似古代‘县官’与‘师爷’的关系。首先,通过训练和‘师爷’建立良好的理解和信任,通过准确的问题和清晰的指令,让大语言模型提供较好的解决方案。但最终还是要由我们‘县官’根据自身的专业判断作出决策。”

编辑:舰长
审核:木鱼
APP