品牌活动
国金基金量化投资总监林健武
量化投资进化论
来源:
作者:
2017-07-17

国金基金量化投资总监 林健武

    3月25日,由中国人民大学国家发展与战略研究院、中国证券投资基金年鉴、中国量化投资学会主办、北京中金量化科技投资有限公司协办的金麟2017第四届量化投资与对冲基金年会在中国人民大学召开。国金基金量化投资总监林建武发表了以“量化投资进化论”为主题,发表了演讲。

    以下为演讲实录:

    非常感谢丁总,感谢李教授邀请我来参加这个会,我是清华大学毕业的,回到人大的校园也很亲切,因为我曾经还有一个身份,是北京市小作家协会的主席,我们的总部在人大附中。

    我在华尔街做了十几年,后来回到国内教书,然后又回到业界来做,其实遇到很多的朋友、学生都问,说林教授,中国的量化投资到底发展到什么程度了?我们学生学了以后,将来有没有就业的机会,是不是可以赚到钱?很多人都在问这个问题,所以我这次来到校园跟大家简单分享一下我自己做这么多年的经历,和我对于整个中国量化投资发展的一个想法,跟大家分享一下。

    说到量化投资,我们肯定要看一下量化投资的趋势,我讲三个方向。第一,量化投资的全球化的方向;第二,量化投资的智能化的方向;第三,量化投资的机构化方向。

    先讲一下量化投资的全球化,大家看一下这幅图,讲的是全球量化投资对冲基金发展的历程。大家知道最早的对冲基金是1949年建立的,当时起家的时候只有10万美金,以200亿美金管理资产作为一个分界线的话,美国大概花了四五十年的时间达到这样一个规模;欧洲是2002年左右达到200亿美金,用了三四十年。

    亚洲,不包括中国,达到200亿美金是2006年,用的时间是二十年左右。首先我说中国,我觉得中国发展的进程肯定会比欧美快,像我们这样的从国外回来的非常多的人,会带来国外原来发展的技术跟大家分享,很多人也到国外去学习这方面的技术,它的发展进程是越来越快的。

    这个发展的进程对于每一个国家,它有什么样的影响呢?当然有很多好的一些影响,流动性的影响、各种各样的影响。但是我要跟大家分享的一点,其实很多做量化对冲的人可能都会意识到,也就是量化对冲对于整个市场的影响。

    美国有一个著名的指数公司,就是摩根斯坦利的MICI,现在分化出去了,它做的是全球各个不同国家的指数和全球的MICI指数之间的相关性,大家可以看到2007年之前这个相关性各有千秋,有的高、有的低,是一个非常广泛的分布曲线。但是到了2007年以后,经过次贷危机之后,也是量化投资不断发展之后,大家发现很多国家的股票指数和全球股票指数呈现了大规模的相关性。大家可以看到,整个的相关性在不断地变高。

    那么我们做量化对冲的都知道,量化对冲最核心的多空策略,选好的股票、做空差的股票,如果所有的股票同涨同跌我们怎么办?利润会下降。所以相关性来自于量化对冲,同时它使量化对冲的利润在发展。所以全球量化对冲的发展也带来一个非常重要的影响,使得我们市场上很多资产的相关性在变得越来越相关。

    我们看一下全球整个的发展,在欧美国家,美国、欧洲整个市场的相关性已经达到了50%、60%,甚至有的时候达到70%,这每个尖都代表着一次灾难,比如说希腊的国债危机、雷曼兄弟倒闭,当市场有大规模的市场性的信息的时候,就会造成市场上有更多的股票同涨同跌。比如说日本突然发生地震的时候,大家不再关心公司在日本到底在做什么,而是整个市场的相关。

    亚洲的相关性还是比较低的,整体的相关性在百分之三四十,所以在近些年有越来越多的对冲基金进军到亚洲,为什么?这是一个量化投资的天堂,它的相关性是比较低的。

    我们看一下,我这里做了一个很简单的图,画的是从2010年到2016年整个中国市场的一个市场相关性的发展,其实就是把两两的股票做一个相关性,做一个均值。大家可以看到,中国的市场整个的相关性也在不断升高,从大概10%到20%,一直升到50%、60%。上面画的一条是市场上所有的可以得到公开数据的α策略的均值,整个α策略总体的收益在相关性比较低的时候还是比较值的,当相关性升到一定程度的时候,越来越多的回撤发生了。所以各种各样的回撤从数学的角度来说,正是相关性影响的一个非常重要的原因。

    所以它告诉我们一件什么事情,其实我们在中国做量化投资,我们需要更多的多样性,其实多样性正在悄悄地在我们整个资产的配置中越来越重要,因为我们需要更多的另类资产来进行投资,不然的话你就会陷入一个相关性的误区。

    我们需要越来越多的策略,我们就必须要有更多的研究员去进行数据的分析和挖掘,对于数据分析这一块提出了更高的要求;它也使我们进入到整个应用人工智能和其他的一些领域,来促进我们量化投资,不仅是投资的自动化,而是投资策略的自动化和智能化。

    我这里把量化投资分成几个部分,量化投资可以把它抽象成三个部分的环节,第一个部分是我们有很多的金融的时间序列,也就是我们的金融数据。第二个部分我们叫做自适应的交易算法;第三个部分是很多程度我们还要依靠人,就是我们人的策略师,大家要不断地从这些策略里挑出好的策略。

    我们看一下人工智能会对于这三个方面情况做什么样的促进呢?第一块,我们知道其实我们还有很多的信息是非结构化式数据,不管是文本的、图像的、声音的还有其他的数据,是没有办法变成现在数据模型可以直接处理的数据的这种结构化数据,所以我们要利用人工智能的方法把它处理成结构化数据来进行交易。

    第二块是我们人工智能的算法,其实人工智能的算法大家说了很多,我总结一句,从我们数学的角度上来说,很多的人工智能算法就是非线性建模,它其实就是告诉我们,我们在我们遇到的数据里头,它的非线性成分越来越多,线性的东西被交易之后,逐渐地出现一些非线性的现象,我们需要很多的人工智能算法进行学习和总结。

    第三个部分,其实也是现在人工智能正在逐渐发展的一个难的领域,很多人都在尝试,我们叫做元知识学习,就是说我们原来去选一个策略去投资不同的资产,元知识学习是让我们怎么样来用机器选择不同的投资策略。其实大家可以看到,元知识学习逐渐开始使我们的人工智能有了产生知识的可能性,原来只是运用知识自动化地处理数据,而元知识学习是人工智能的一个高的层次。

    下面我们就这三个方面分别跟大家简单介绍一下,现在人工智能在量化投资的一个发展方向。第一个方向是非结构化数据,我们讲一个简单的例子,2013年的4月23日,当时美联社发了一个推特的文章,说两颗炸弹在白宫爆炸,奥巴马总统被炸伤了。我们可以看一下,当时在一分钟之内标准普尔发生了什么事情,在一分钟之内暴跌了1%,按照美国当时的标准普尔的市值,其实在一分钟之内瞬间蒸发了1360亿美金,当然很快证明是一个假的推闻,又回来了。说明什么?这是人工交易员交易的吗?不大可能,美国有大量的对冲基金使用推特上的数据进行自动化的交易。所以大家可以看到,新闻的非结构化自动交易在美国很多的高频交易公司已经广泛地使用。

    第二幅图是我美国加州的一个朋友给了一幅图,很有意思,跟大家分享一下。这幅图是美国一家公司,叫做RS Metrics,是一家军用的卫星公司,后来转了民用,这幅图是卫星航拍的俯视图,这是一家沃尔玛,这是一个停车场。大家可以想象停车场停车的数量跟人流量有关,人流量跟超市的销售量有关,销售量跟超市的利润有关。如果你可以把沃尔玛所有的停车场的数目和以前的停车场的数目进行对比,你可以算出沃尔玛这个季度的销售量是增量还是减量。算的以后,沃尔玛公司是一个上市公司,我们可以用这个方法在沃尔玛发季报之前,猜出来它发出来的季报是超预期还是低于预期,我们可以赚钱。

    所以大家可以看到,新闻可以做,图像也可以做量化投资。所以人工智能这种图像识别、文字识别,甚至语音识别,正在悄悄地走入量化投资,帮助我们扩展量化投资非常重要的食粮,也就是它的数据源。

    我们再讲第二块,人工智能的算法。我们先看一下整个金融学的发展规律,以前很长的时间里头我们根本就没有金融学,金融学一直到了17世纪、18世纪,才和经济学逐渐并存;到了19世纪、20世纪,才出现了大量的各种各样的金融学理论,所以我们正在从市场的定性分析变成定量分析。

    但是难道我们人是变得越来越聪明了吗?并不是这样。其实大家可以看到,有一件事情正在悄悄地影响我们整个的市场,也就是随着整个人类社会的不断发展,我们在积累不断的数据,只有有了大量的数据,我们从逐渐从定性分析发展到定量分析。

    同样,我们看一下整个人类投资的金字塔,人类投资最早的时候使用的是Buy-To-Hold,就是买了一支股票不动,持股20年。然后是Fundamental,其实正是市场上的数据越来越多,造成了我们进行越来越多的数据分析,我们有了交易所、行情,进行日的数据、分钟级的数据、毫秒级的数据,其实随着数据越来越多,来的频率越来越快,所以才产生了更多的量化投资,从量化投资统计套利、高频到做市,整个量化投资模型的发展,整个处理方式的发展,其实和整个这个社会金融数据的膨胀发展,不管是从数量还是频率,都是息息相关的。

    跟大家做一个简单的演示,演示一下我们数据建模的一种方法。假设我们看到这幅图,大家觉得这是什么东西?唯一的方法我们怎么做?做个线性建模,颜色深的分成一块,颜色浅的分成一块,我们好像看见了三个东西,慢慢可以把它圈出来,然后开始非线性建模,现在就看出来了,是企鹅。正是随着我们得到的数据越来越多,我们的模型从线性逐渐变成非线性,从简单的模型到复杂的模型。

    其实量化投资也是同样的情况,量化投资借助着我们前面越来越多的人工智能处理更多的数据,也正在从完全的线性的人工建模进入到非线性的建模。最早的时候量化投资很多人去读各种各样的技术分析,其实它都是非常简单的建模,而是都是靠交易员长期观察市场来得到的,它的这些指标里头、评价的一些标准,最后整个数据的结构,全部都是人来进行建立。

    随着我们有了更多的指标,很多人在用遗传算法,把好的留下来,差的去掉。所以慢慢慢慢指标这一块可以开始通过计算机来选择,但是后面的数据结构还需要人来定。

    最后我们现在发展的比较多的叫……,我们将来有一天如果这个机器真能把神经元网络也自己猜出来,我估计咱们人类历史就有可能结束了。但是这个东西到底能不能来到这一天我也不知道,但是通过这个东西大家可以看到,我们整个的量化投资正在越来越地使用机器替代原来人做的这个东西。

    我们可以看一下,最后我们讲一下元知识学习。元知识学习我不讲太多,我们刚才讲了量化投资其实是一个非线性建模,同时人工智能用一句话说就是一个优化算法,就是一个非线性优化算法,你想要实现人工智能,最主要的是一个计算能力。

    给大家举一个简单的例子,我们假设我们有100个策略,每个策略有1000个测试题,每个策略同时又四个参数,每个参数都是从1取到10,那么要有10000个参数,每次仿真需要100秒的时间,这样一个简单的选取就是要花1的11次方秒,相当于3000年。这个太傻了,我们需要并行计算,如果我们需要100个CPU进行并行计算,还是需要30年;如果我们用遗传算法可以提高10倍,还需要3年;用GPU进行优化,提高10倍,还需要三个月。所以元知识学习对于计算能力要求是非常高的,这里面有越来越多的各种各样的元知识学习算法提出来,我们可以通过一些算法,可以比一般的算法提高10倍到100倍的速度,提高快速的知识的收敛和选择。

    最后我们简单讲一下,我们中国的量化投资到底发展到什么程度。我们做一件事情,我们市场上其实量化投资就是聪明人和噪声交易者,我们叫做一般的投资人之间的一个博弈的关系。我们可以看到,随着这个市场上聪明的人越来越多,量化投资会怎么样?它的胜率会越来越高。但是由于更多的人参与这个交易会怎么样?波动性也会随着量化投资逐渐变小,会出现一个峰值的分布。

    中国的量化投资现在市场上策略的夏普比大概是在2.5%到3%左右,整个市场的情况其实和我们对于散户和机构之间的相互关系是非常吻合的,散户和机构的相对比例是二八的分布,所以这个从一定程度告诉我们,其实中国还有很长的一段路走,但是我们将面临的是收益率下降,波动性下降,大家需要放杠杆。但是长期以来,会逐渐地搜索到整个收益率下降、夏普也下降的一个过程,但是我们远远还没有到,还有一段路要走,通过这个模型可以看到我们将来的一个发展方向,其实美国已经发展到这个方向。

    第二个,因为利润下降,不再好意思跟客户收业绩提成了,怎么办?在美国有一个非常大的发展方向,叫做对冲基金零售化,也就是原来都是对冲基金,逐渐的公募基金在发很多的产品。

    第三,不仅是投资要降低成本,顾问也要降低成本。整个的智能投顾的发展,其实和量化投资利润的发展,降低人工服务的成本息息相关。我的报告就到这里,谢谢大家!


阅读:1272