财经新闻网消息:
量化投资在中国发展至少十年了。 尤其是近年来,越来越多的投资机构宣布采用人工智能(AI)技术。 经过三代的快速迭代和发展,量化投资在AI技术的支持下,目前走在人工智能技术应用的最前沿。
粤港澳大湾区数字经济研究院(IDEA)执行院长、人工智能金融与深度学习首席科学家郭健博士在会上剖析了新一代人工智能技术驱动的量化投资新范式forum.0并提出了当前量化投资面临的技术问题,并通过介绍IDEA研究院在这一新的交叉领域的研发成果,展望了行业发展的新机遇和挑战。
第三代量化投资范式快速迭代
严格来说,量化投资的诞生可以追溯到第一篇应用于金融研究的数学论文,距今已有近100年的历史。 量化投资大概是在20世纪50年代哈里·马科维茨发表资本资产定价模型(CAPM)理论之后形成的,并出现了套利交易、超额收益等各种新的投资策略。 整个过程中,超过12位诺贝尔经济学奖获得者做出了杰出贡献,其中包括近年来日益流行的深度学习和因果推理,也不乏图灵奖获得者。 为这一领域注入了巨大的活力。
随着技术的发展,量化投资行业正在快速发展,整个行业的形态也在快速演变。 郭健将最早的量化投资定义为Quant 1.0。 它可能是由哈佛大学或麻省理工学院的教授和一些学生以小型研讨会的形式发起的。 这是一个精英小作坊式的生产。 精英公司的一个自然问题是它们不太稳定,因为它们过于依赖个人才能。
为了解决这个问题,10多年前美国出现了一家名为World Quant的公司,标志着Quant 2.0时代的到来。 该公司被称为对冲基金行业的富士康,实行工厂流水线生产。 这家公司在全球雇佣了数千人做所谓的量化策略,然后总部有大约100名基金经理来整合这些策略。 它的优点是告别了精英小作坊模式,可以快速更换。 据称,近10年来其积累了超过1000万条金融信号,这对其金融体系的稳定带来了一定的帮助。 但很快新的问题又出现了,那就是边际效用递减,因为并不意味着人越多投资就越好。 运营上会有一个平衡点。 随着行业员工数量的增加和工资的上涨,将会出现成本无法支撑的时期。
为了解决这个问题,近年来,越来越多的深度学习等新技术被应用到量化投资领域,特别是每日T+1交易、日内T+0或者中高频交易,更适合深度学习。 因为此时已经积累了足够的样本。 量化3.0时代开始。 机器学习可以从大量重复样本中找到许多历史模式,并将历史模式应用于未来的预测。
这个应用程序在过去三年中运行良好,但 Quant 3.0 很快就遇到了新问题。 存在三个问题:第一,它的成本还是很高,相当于用算力换劳动力,但是算力的成本也很高。 其次,扩大模型的劳动力成本比挖掘要素的劳动力更昂贵,因此成本被相当程度地转嫁。 ,并且没有特别显着的成本降低。 而且深度学习是一个黑匣子,你分不清它为什么赚钱,为什么赔钱。 第三是这种模式只适合中频到中高频的交易,但这类交易的市场容量非常有限。
因此,如何更好地将AI技术应用到价值投资、全球宏观等大规模资产配置产品中,是下一代量化投资应该重点关注的问题。 因此,郭健提出了量化4.0的新概念,并做出了相应的决策。 做了大量系统的研究工作。
Quant 4.0:下一代人工智能投资工具
为了解决前面三个问题,Quant 4.0对应了三个要素:第一个是自动化AI,将AI建模本身自动化,替代人工建模,从而降低成本。 第二个称为可解释的人工智能,它可以使无形和无形的系统对投资者或背后的LP(有限合伙企业)变得透明、可靠和可信。 第三是面向未来,如何将价值投资的逻辑或者VC、PE等长期投资机构的分析融入到AI技术中,而不是简单的机器学习。 比如说,是不是可以说AI技术从世界顶级分析师那里学到了大量的分析方法论,变得智能化了?
Quant 4.0的第一个要素是自动化AI。 自动化AI本质上解决一个问题,即算法生成算法,模型创建模型。 传统的量化投资,简而言之,就是数据预处理、因子挖掘、建模,然后是投资组合优化、交易、实单拆分、交易执行、产品优化,最后是风险暴露和风险分析。 现在我们需要自动化整个过程。 有两个关键环节。 一是速度足够快。 该系统必须比现有的定量系统至少快两到三个数量级,才能实现整个过程自动化的实用价值。 。 第二个就是你开采的空间和数据容量必须非常大。 以因子挖掘为例,除了传统的量、价、高频量之外,还包含了越来越多的另类数据,比如基本的综合分析,比如新闻舆情、公告文本、公司上游情况等。如何进行快速预处理,系统如何自动从数据中挖掘出良好的金融信号,是Quant 4.0面临的问题。
这个过程本质上模拟了人们思考或者做量化投资分析的过程。 因为研究的英文名字叫 ,郭健表示,他用的技术都是一样的,利用系统和计算能力来模拟人的思维,在一个空间里反复搜索,从而提高整个量化投资研究的水平。效率。
一旦获得良好的金融信号,就可以将它们组合成可用于通过深度学习或其他机器学习模型进行交易的策略。 郭健表示,在这个过程中,还进行了大量的自动化优化。 当人们进行手动建模时,他们会调整大量参数并测试大量数据。 分析师和投资研究人员不应该浪费这些任务。 这些都应该交给系统,系统可以在底层自动高效地完成。
人的作用是什么? 人类的作用就是启发系统,让它往最有价值的方向寻找,然后做出发现。 于是郭建就说他也做了一个。 这里的Alpha指的是投资信号的α(超额收益)。 通过人与大模型、人与AI的交互交流,经过反复的思考,可以快速构建出所需的金融信号和金融模型。
Quant 4.0的另外两个主要特点
Quant 4.0 的第二个要素是可解释的人工智能。 金融业尤其需要可解释性。 否则,赚钱很容易,但你不知道如何弥补损失。
可解释的人工智能意味着打开这个黑匣子。 打开它的本质是什么? 郭健表示,需要开放的就是这些难以解释的技术。 例如,深度学习模型可能仅具有数亿甚至数十亿个参数。 这么多参数是无法解释的。 所谓可解释性,并不是说有了线性模型就叫可解释。 可解释性是指在模型性能和预测能力较强的前提下,可解释的部分能够被解释。
郭健表示,他构建的系统构建了很多可解释的底层技术,并将其集成到系统中,提供从宏观到微观的多层次可解释性。 例如,解释可理解的行为特征(例如跟踪领先股票)可以更好地理解黑盒模型产生的结果并降低投资风险。
三是如何应对更大容量的量化投资,尤其是更长期限的价值投资? 这里一个明显的问题是,价值投资是低频投资。 低频投资是什么意思? 您的职位可能会担任一年、两年甚至更长时间。 投资追求基本面本身的增长,会导致样本不足。 因为价值投资可能两年才产生一个投资样本,这就导致学习深度学习和机器学习是不可能的。
郭健在这里提出的理念是,数据不足,必须收集知识。 传统上,机器学习高频度地追求数据的深度。 所谓深度,是指相同的交易行为重复出现。 根据统计学中的大数定律,你找到规则并将规则应用于它们。 预测,这个胜率会比较靠谱。 但是,当你没有足够的历史数据时,就需要通过水平扩展来扩大数据的宽度。 这个宽度来自于各类非传统应用数据,包括各种另类数据,包括它们构建的大规模金融行为。 知识图。
知识图谱实际上是一个巨大的网络。 这些节点是各种金融主体,可以是上市公司、与公司相关的贷款银行、有业务往来的上下游产业链公司,也可以是公司背后的股东、公司法人、与公司有诉讼关系的其他公司。公司、公司的竞争对手等等,都可以融入到这个巨大的地图中。 郭健表示,目前已经建成了由1.6亿个节点组成的庞大网络。
事实上,通过大模型技术与知识图谱技术的结合,一定程度上可以实现初级金融分析师的思维逻辑,比如进行行业穿透分析。 传统的大型模型很难做深度思考。 所谓深度思考需要很长的推理链条才能完成对市场的理解,但融合知识图谱技术后就可以实现。
知识图谱就是利用这个大模型在庞大的网络上进行推理,将结果一步步推出,形成对未来市场的分析和看法。 郭健指出,从技术上来说,目前还很难保证这一过程的准确性。 至少可以保证的是,其推理过程在逻辑上是自洽的,从而可以形成多条推理链,为金融分析师提供参考。 然后,分析师可以利用他们对市场的真实理解以及与大型模型的交互来优化大型模型推理的结果。
然而,量化4.0仍面临诸多挑战。 挑战之一是系统级别的复杂性。 整个系统从底层计算系统到数据系统、知识图谱、推理引擎和最终应用都比较复杂。 郭健表示,如果我们想要整合海量的知识,并对这些海量的知识进行快速推理,这将对系统背后的低延迟、高并发、系统吞吐量以及智能算法提出非常高的要求。 这也导致了相对较高的开发成本。
但面对未来巨大的价值投资市场,量化交易的投入产出比还是比较划算的。 其他一系列问题包括基础设施问题、数据、算法和建模挑战等。未来最大的挑战之一是算力本身的问题,需要通过算力的不断积累和优化来解决。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com