品牌活动
高建军 上海财经大学交叉科学研究院金融科技实验室主任
来源:基金年鉴
作者:
2019-04-12


上海财经大学交叉科学研究院金融科技实验室主任 高建军


  高建军:很荣幸参加量化投资与对冲基金的年会,这是我第一次参加业界的会议,很有意思。我们也是会议的主要的协办单位之一,很荣幸。我觉得学术界跟业界要多交流,不然学术界做的很多东西不能落地。我叫高建军,我是毕业于香港中文大学,我的专业是金融工程跟运筹优化。博士毕业以后在香港IMC,一个期权交易的做市商,然后回到学校做了博士后,然后在上海交大做了一段时间的老师,2016年初到的上海财经大学,进入交叉研究院,主要研究方向是组合优化和算法,这是比较具体的课题。

  今天分享的主题是量化投资的一些新的方法或者是一些新的技术。我讲一下大规模组合投资和优化,我用一个案例来讲。我们交叉研究院这个团队前一段时间跟私募基金把我们以前做的算法做了落地,就是一个均方差的选股模型,跟普通的有什么不同?我们加入了一些01变量,通过01变量来做一些选股,但是加入了以后,如果学过优化就知道,规模增大的时候很难计算,现在的业界有一些专门解这个问题,叫做混合指数优化的求解引擎,现在有一些引擎可以解这个问题,但是解的非常慢。这几家私募他们买了这个引擎,直接调这个模型来解。发现如果资产的规模达到300到500支的时候,算8到10多个小时,这严重影响他们做决策的过程。

  所以我们帮他们重新设置了算法,现在效率提高100多倍,原来做很多小时,现在可能几分钟就搞定。这是大规模组合投资优化,应用非常好的案例。很快的求解引擎很重要,现在市面上大致就是三四家公司,这几家求解是通用,可以求解大部分的,他们都可以解。但是在投资组合的场景里面,如果直接用不是那么有效,所以一定要有深度的定制,定制以后这个东西才能真正的用。如果股票池有一千或者三千支,这就不是效率问题,是能不能做的问题。一千支直接调的话,是做不动的。这是第一个成功经验,把大规模投资组合优化的算法,应用到真正的场景里,这还是非常有价值的。

  第二个案例,因为前一段时间我们知道人工智能很热,所以很多券商他们自己的自营机构或者资管部门找我们,希望评估一下现在这些热的机器学习,AI算法到底用在股市上面做一些预测,到底有没有效果?来做这个事情。我们做了一年多,我们建了很多机器学习的模型,我们做了以后发现简单的机器学习的算法,对股市的预测能力,比线性模型没有提高太多,它有改进但是改进的幅度并没有那么大。我们试了一些深度网络服务,比如四层网络五层网络,我们做了一些预测,这个模型的效果大家猜一下怎样?其实这个效果还是,我们知道神经网络层数越深,学习的能力越强,但是股市的数据上面反而是一层两层的神经网络模型,深层的效果会好一些。原因我们做了分析,主要是数据问题,下棋或者自动驾驶它的数据信噪比很高,相对来说数据比较平稳偏差没有那么大,这样来学习效果比较好,你拿数据训练,里面的位置或者连接可以很快的固定下来。但是金融的数据信噪比很低,大部分都是噪声信号,所以深度网络的权重不停的在变化,你拿一点数据进去会变成0.5和0.3,但是换一组数据也会变化,它不停的振荡。但是如果比较浅的话,反而效果会好一些,这是我们帮助国内比较大的券商,他们的自营部门他们做了比较大的工作,AI算法到底对量化投资有多大作用?

  这个事情有所耳闻,说AI把大家的饭碗炒了,其实目前来看太早了。大家看一下纽交所的AI基金,纽交所用IBM的沃森直接做的AI的ETF,我过几天就会看一下,这个号称是全部无人,从收集数据到投资全部都是AI来完成的,这个基金大家可以自己看一下,这个基金2017年10月份上线的,我一般比哪个?跟谁比?我一般比巴菲特旗下的一个被动投资的基金,我一般比这两个,那是一个极端,目前来看这个会好一些,但是不能那样说,因为AI基金运行时间比较短,只有一年的时间。但是这个基金有一个好处,如果没有记错是去年跑输了,但是几个特殊的月份AI基金是跑赢了,所以AI选的这些股票和人去选或者用传统金融的方法来选的股票,还是有一定的差异,但是你得看一下成分股,他们是完全不同的。很有意思的事情。我总结一下有用,但是不是能够翻倍的,它的提升是有限的。

  主流的金融学里面,对机器学习大家比较关注,因为在目前来看主流的四大金融学杂志里面,还没有关于机器学习方面的文章发表,但是有一些论文,他们做出来的表现用机器学习算法做出来的一些定价模型和预测模型,是比传统的OLS线性回归模型都要好一些,跟刚才得到的结论是一致的,有用,但是不会让你上天,但是有用,因为这是一个非线性的预测模型。我现在做的研究跟刚才说的有关,这是投资组合的泛化模型,就是在已知的数据集上训练的模型,然后在新样本上用,你可以看一下它的性能如何?我们传统的统计里面叫样本外表线,跟这个差不多。我现在做的很多决策模型,这些模型很多情况下都是在数据集上表现,但是你拿到未来去用马上会出问题,它的性能会变差。

  这个问题在主流的研究金融里面很早就有人关注,最近有影响力的文章是伦敦政经大学的教授写的,他造了一个策略,无论拿什么性能过来都平均分配,不做任何优化,给你一个均方差模型,这是用一些学习方法,然后让这两个模型来比,最后的结论是什么?所有的投资组合优化模型最后竟然没有那个策略好太多,比它好太多,甚至有些没有它好。所以它颠覆了大家的认知,很多对冲基金都是基于这个做的。这个原因是两点,一个是模型本身,模型对参数估计太敏感,这是模型本身的问题,这是第一个问题。第二个对模型参数估计不准,因为我们知道大规模的投资组合里面的参数估计是非常难的,比如一百个股票估计多少个数据?大概是五万个数据,这五万个数据基本上直接用样本是没法估计,哪儿来五万个数据?五万得多久的数据,这个根本不可能。所以一般得用因子模型,即使用因子和降维来估计,还是不能估计的很准,这是用机器学习的算法,帮助我们估计的更准一些。这是机器学习跟金融,我们的量化方法结合的一个真正的作用。你拿机器学习预测股票涨跌,然后超过5%就压涨跌,这不是一条正路。按照提升估计的准确性,这是一个正路,这是我们现在做的比较好的结果。现在很多投资组合的这些模型或者决策模型,这些模型真正用的话,真正要做的话要做很多研究。谢谢。


阅读:1585