• 官方微信

    官方微信
  • 官方APP

    官方APP
  • 官方视频号

    官方视频号
  • 电子报

洞察金融市场

传播中国价值

Global Perspective, China Value

粤港澳大湾区数字经济研究院执行院长郭健: 量化投资站上AI新风口

来源:电子报 2023-11-06 07:30

中国基金报记者 姚波

11月1日,由中国基金报主办,信达澳亚基金、泓德基金、橙新闻特别支持的“人工智能驱动金融行业高质量发展——2023中国基金报金融科技论坛”在中国香港举行。在论坛上,粤港澳大湾区数字经济研究院(IDEA)执行院长、人工智能(AI)金融与深度学习首席科学家郭健解析了新一代AI技术驱动的量化投资新范式,展望行业发展的新机遇和新挑战。

他指出,中国财富管理市场巨大,2021年市场规模已接近135万亿元,预计2025年将达到170万亿元。目前,A股市场上程序化交易成交量占比40%,而美国市场的程序化交易量占比约80%,可见中国市场程序化交易量有巨大增长空间。尽管程序化交易不一定是通过量化来实现,主观交易也可以采用这种技术,但这一数据侧面反映出通过机器来做交易的比例。量化投资在中国发展了十余年,近几年,越来越多的投资机构宣告采用AI技术。经历了三代的快速迭代和发展,量化投资正处在AI技术应用的新风口上。

三代量化投资范式快速迭代

郭健认为,严格来讲,量化投资的诞生要从第一篇数学论文应用到金融领域的研究算起,距今有差不多100年的历史。量化投资真正成型大概是从20世纪50年代哈里·马科维茨发表资本资产定价模型(CAPM)理论之后,套利性交易、超额收益等各种新型的投资策略涌现。整个过程中,有超过12位诺贝尔经济学奖获得者做出卓越贡献,包括最近几年越来越火的深度学习、因果推理,也有多位图灵奖获得者为该领域注入了活力。

随着技术的进步,量化投资产业快速发展,整个产业的形态也在不断进化。郭健将最早期的量化投资定义为Quant1.0,它可能是哈佛、麻省理工的教授带着几个学生就做起来了,是一种精英小作坊式生产。精英公司有一个天然的问题——稳定性比较差,因为它过分依赖个人天赋。

为了解决这个问题,10余年前,美国出现了一家公司——World Quant,标志着Quant2.0时代的到来。这家公司被称作“对冲基金行业的富士康”,借鉴工厂流水线式的生产方式,在全球雇佣了成千上万人来做量化策略,然后,由总部的大约100个基金经理把这些策略融合在一起。它的好处就是告别了精英小作坊模式,可以快速更替,据说它在过去10年积累了超过1000万个金融信号,对其金融系统的稳定性带来帮助。但是,新的问题很快出现了,就是边际效用递减,因为并不是人越多投资就做得越好,经营上会有一个平衡点,随着雇佣人数增多,加上行业薪资水涨船高,总有一天成本会撑不住。

近年,深度学习等新技术应用到了量化投资领域,特别是日线T+1交易、日内T+0或中高频的交易,这些比较适合深度学习的任务,因为此时已经积累了足够多的样本。机器学习可以从大量重复的样本中找到很多历史规律,并将历史规律应用于预测未来。Quant3.0时代由此开启。

最近三年这一应用效果不错,但是,Quant3.0很快也遇到新的问题。问题有三:一是成本依然非常高,它相当于以算力换人力,但算力成本也非常高;二是调大模型的人力成本比挖掘因子的人力更贵,而且深度学习是“黑盒子”,很难说清楚为什么赚钱或赔钱;三是这种模式只适合中频到中高频的交易,而这类交易的市场容量很有限。

因此,价值投资、全球宏观等大规模的资产配置产品如何更好应用AI技术,是下一代量化投资应该重点考虑的问题。基于此,郭健提出了Quant4.0概念,并做了很多系统性研究工作。

下一代人工智能投资工具

郭健分析,为了解决前述三个问题,Quant4.0分别对应三个要素:第一是自动化AI,让AI建模本身自动化,取代人工建模,从而降低成本;第二是可解释AI,让看不见、摸不着的系统变得对投资人或者背后的LP(有限合伙)来讲是透明、可靠、可信的;第三就是将价值投资、长期投资的逻辑融合到AI技术中,而不是简单的机器学习,例如,能不能通过学习大量世界顶级分析师的方法论使其具备智能?

具体而言,第一是自动化AI,其本质是解决一个问题,即算法生成算法、模型创造模型。传统的量化投资,简而言之,就是数据预处理,然后进行投资组合的优化,再进行交易,实盘拆单、交易执行、产品优化,最后是风险暴露、风险分析。现在要把整个流程自动化,其中有两个关键环节,一是要足够快,必须比现有量化系统快两到三个数量级,才能形成具有实用价值的全流程的自动化;二是挖掘的空间、数据的容量得非常大,以因子挖掘为例,现在除了传统的量价、高频数量外,越来越多的另类数据也被包括进来,像基本面分析,就包括新闻舆情、公告文本、公司上下游产业链等。如何进行快速预处理、如何从数据中挖掘出好的金融信号,是Quant4.0首先要解决的问题。

这一过程也是在模拟人思考或做量化投资分析的过程。“研究”的英文叫research,拆开就是repeat+search,意为“反复搜索”。郭健表示其采用的技术也是用系统、算力模拟人思考,在一个空间里反复搜索,以提升整个量化投研的效率。

一旦有了好的金融信号,通过深度学习或其他机器学习模型,合并成可用来交易的策略。郭健表示,这个过程也进行了大量的自动化优化,大量的调参、数据测试由系统在底层自动化地高效地完成。人的作用就是启发这个系统,让它朝着最有价值的方向去搜索,然后去发现。

第二是可解释AI,金融行业尤其需要可解释。可解释AI,即打开这些难以解释的技术。如深度学习模型,参数量可能就有上亿甚至几十亿个。郭健表示,其构建的系统搭建了很多可解释的底层技术,并且把它融入到系统,从宏观到微观进行多层面的可解释。例如,对追踪龙头股等可理解的行为特征进行解释,能对黑盒子模型产生的结果有更好的理解,从而降低投资的风险。

第三,面对更大容量的量化投资,特别是更长周期的价值投资怎么做?价值投资属于低频投资,持仓周期可能是一年、两年甚至更长时间,投资追求的是基本面的增长,这就造成没有足够多的样本,最终导致无法实现深度学习、机器学习。

郭健的解决方案是“数据不够、知识来凑”。传统上,机器学习追求数据的深度,即同样一个交易行为反复出现,根据统计学的大数定律,找出其中的规律,把规律用于预测,胜率就比较可靠。但是,如果没有足够多的历史数据,就要通过横向扩张来拓展数据宽度,这个宽度就来自非传统的应用数据,包括各种另类数据、大型金融行为的知识图谱。

知识图谱就是一张巨大的网络,节点是各种实体,可以是上市公司、提供贷款的银行、上下游产业链企业,或公司的股东、公司的法人、与公司打官司的其他公司、公司的竞争对手等。郭健表示,现在已经形成一个由1.6亿个节点组成的巨大网络。

所谓深度思考,就是需要很长的推理链,完成对市场的理解。传统大模型难以做深度思考,但融合了知识图谱技术之后就可以做到。通过把大模型技术与知识图谱技术相融合,在一定程度上具备初级的金融分析师的思考逻辑,如进行行业穿透式的分析。知识图谱通过这种大模型,在巨大的网络上进行推理,一步一步形成对未来市场的分析和看法。郭健指出,目前从技术上还难以保证推理的准确性,但推理过程在逻辑上是自洽的,从而可以形成多条推理链,为金融分析师提供参考,分析师再通过自己对市场的理解,结合与大模型的互动,优化大模型推理的结果。

郭健表示,Quant4.0还面临诸多挑战,尤其是系统层面的复杂性,整个系统从底层的算力系统,到数据体系、知识图谱、推理引擎及最后应用的层面都比较复杂,这也导致开发成本比较高。不过,相对未来体量巨大的价值投资市场,量化交易的投入产出比还是比较划算的。

APP