品牌活动
章赟:大数据时代使量化投资开阔眼界
来源:
作者:
2017-12-15

工银瑞信基金管理公司指数投资部总监 章赟

      谢谢大家,非常荣幸有机会跟大家交流,在大数据驱动下的量化时代。我们经历过股灾的风雨和彩虹之后,我们对量化投资的观点和实践。

  限于时间,我讲三个问题,都是比较热点的。一个是大数据时代的量化统计应该注意什么。我看还有蚂蚁金服的专家。第二个是股灾当中的即时分析,特别是大量的统计模型都失效了,传统的技术分析为什么会出现这样的现象。第三个是我个人的看法以及一些解决方案。

  首先简单介绍一下自己,我在剑桥学的是管理学,主要是金融数学方面。回国之后现在在工银瑞信基金公司,我负责量化投资这些部门。这轮牛市当中可能和分级相关,行业分级我是国内第一个做的,大家也许买过房地产A和B,买过医药A和B,买过有色A和B,我是他们第一任的基金经理,大量的应该是我的持有人。

  但是今天我主要说的跟指数没有什么关系,主要是业务的另外一个方向,就是量化这方面的几个问题。

  首先就是大数据时代可以说给了我们做量化非常开阔的眼界,原来大家就是基本面分析、基本面因子、技术面因子。但是有了大数据之后,我们的时间序列的采样空间得到了质上的飞跃,大家可以采用海量的数据,用海量的数据做相关性的分析。这当中其实还是有很大的问题,相关性检验,如果大家只是相关性检验,你们的α其实有时候会出严重的问题。

  我给我部门的员工举一个例子,可以统计出来,在中国的城市人群当中,保持日常锻炼的,而且锻炼越大的人群死亡率越高,这是一个很荒谬的结果。他能够推出锻炼对身体有还吗?显然是不行的,为什么会发生这样的结论呢?因为中国城市人群当中,白领或者是有常住人口的人群当中,他真正按时大量参加锻炼的是退休的人群,其实是广场舞大妈,他们的死亡率当然比普通人群高,因为他们的年龄大,因为他们的年龄造成了他们的死亡率高,而跟他们的锻炼习惯无关。但是我们如果通过相关性分析,很容易走进这样的误区,这种α是致命的α,这是会害人的。

  刚刚也说到蚂蚁金服和百度,我还跟其他大数据供应商合作过,就是同花顺(300033,股吧)。我举一个简单实战的例子,这也是我们团队研究员做出来的,我让他做一下用户点击率,同花顺软件的用户点击率和随后这个股票股价的关系,这个点击率就是绝对的点击数。大家比较难想象,也挺有意思的,用户点击数越高的股票,接下来一个月或者是三个月的时间下跌的可能性越大,这个非常有意思。是不是我们可以做这样一个α策略,我卖多点击率多的股票,按照我刚才说的思路,我们必须把其他的相关性带来的贡献性剔掉。

  我们可以从规模角度来看这个问题,大家可以想像,对于一个股票来说,像工商银行(601398,股吧)这么大规模的股票,它的点击率肯定要大于小股票。我只有把它去掉之后,我才能说这个跟其他的量化因子无关,至少我把再次因子的贡献性去掉了,否则我只是重复了小股票的效应而已。

  我还可以从时间纬度来看这个问题,大家知道在中国的股票当中,次新股是非常强势的股票板块。从股灾以来,甚至在股灾之前,次新股相对收益都是非常高的。我们马上要发行中国策略指数基金,次新股指数,希望大家关注。

  但是大家可以看到,这个次新股效应会不会影响用户的点击数。大家如果对物理当中熵的概念可以知道,一滴墨水滴到杯子里面,它很难收回这个墨水的状态,为什么?因为熵是在增大的,新股、次新股到老股票的阶段,它天然就应该是扩散的过程,它的用户数越来越多,这对应着点击率的增加,在次新股阶段它确实是点击率小的阶段,这个阶段就是α,这个α并不是点击率造成的,所以如果这个量化出来的话,一定要把这个效应抹掉。

  我们从传统的量化方法都找不到的,也就是它的行为角度,我们从原来的分析财务指标、技术指标得不到这个结果。如果说我把原来的贡献性现象去掉之后,我们可以找它的投资者习惯。大家可以想像这样一个图景,如果一个投资者拿了这个股票不太想买的时候,他是一个非常安静的状态,每天点一下或者点一下看五分钟很得意。但是他想卖的时候,人性的扭曲、恐惧、贪婪都会出现,他会不断的看这个股票,涨了更冲动,跌了更后悔,涨了不想卖,这是一个人精神上的纠结,都会在这个过程当中体现出来,他会不断的点这个股票,他内心的焦虑会反应在点击的行为上。所以这才是他真正的精准,我举这个例子只是说明,虽然在大数据阶段,我们得到了一个可以说是超过二十年来整个量化投资界最广阔的沃土。但是要真正从里面淘出金子来,一定要剔掉上面的泥。

  第二个问题说一下股灾,这轮股灾给大家的教训是非常深刻的。而且在股灾当中我也看了这么多,因为跟各家券商和金融团队非常大。结果大家基本上都没有说对,我想从理论上探讨一下这个结果的原因。

  首先就是股价的平衡问题,这个我不多说了,大家很容易理解。股票价格和买卖力量,在我的观点当中他是局域稳定的动态平衡系统,股价是天知道,损有余,而力不足,这是一个在股市当中对我们做量化的来说,最典型的就是各种各样的套利,无论什么套利都是一样的,你套利的根本就是你的东西在两个市场上的差价。每一笔套利行为的本身一定削弱差价,这是套利的根本所在。所以套利也是非常典型的负反馈行为,这是跟整个股市的特征密切相关。

  但是当我们面对一个去杠杆的时候,当我们面对垄断性人性恐慌的时候,拼命想卖的时候,这种恶性循环原来的负反馈系统其实是被打破的,它其实是正反馈的过程,这个很明显。

  大家可能也都非常熟悉,典型的共振,它是自我毁灭的过程。也就是说,在宇宙当中像这种现象,正反馈现象和负反馈现象是相反的,结合股灾是一样的,只有把它自己的体系消灭了之后,这就是我们股灾所面临的特色。

  来看一下典型的原有传统的技术分析,它对应的是什么体系呢?就是典型的负反馈体系,右边这个是五年前国泰君安金融团队研究的,他给我看这个图,心里也没有什么底。当时我跟他说,他这个图定性一定是对的,因为我知道左边的图,我对自然地理学非常熟悉,如果海路平衡的话,不管是金星、火星、地球一定会形成这样一个气压带的分布,左边和右边是完全一致的。

  如果大家把当前的股价位置对应赤道,这两个模型是完全一致的。也就是说,其实对于一个达到负反馈平衡体系的对应状态来说,技术分析,我不知道它的准确性在哪里,但是它确实是存在的。因为我们有对也的压力位和主力位。行星分析在地球上被验证的次数已经被验证两千年了,它们对应的是同样的一套负反馈平衡体系。

  刚刚说了它确实是,我们说目标位、压力位、支撑位,在一个平衡的体系当中,一定有它的动力学内涵和价值。但是刚才也说到,它的价值是建筑在平衡,至少在稍微偏离平衡体系上。但是我们在股灾的时候面对地球上另外一种分析系统,湍流和季风,它是不受行星分析模型的影响,它是一个独立的模型。因为技术分析存在的前提,在这样一个环境当中已经失效了,你再怎么做肯定不能得到正确的结果。

  第三点说一下可以从哪个方面解决这个问题,可以把它认为的K线的数据本质和Hurst指数,国内所有的金融工程团队都把它移植到国内,但是效果有的好,有的不好。克服失效性问题的可能路径,数学工具的改进。刚才说了描述平衡态统计的现行数学工具无法处理远离平衡态时的股价时间序列。要描述此类问题,我们没有办法,要描述一个非线性系统,是不能达到它的准确性,必须要引入非线性的数学工具。

  如果大家对K线比较了解,希望交易的同学都有这个感觉,对于在各个纬度上,在月线、周线、日线、小时线、分钟线,甚至在任何一个时点上都会有这样的结果,股价有明显的次相似阶段。它会不断的重复自己,在精细结构当中呈现的细节特性是连续但不光滑的。发散而不收敛,这根线永远是画不完的,而且这个线是发散的,是无穷大的。

  大家可以想像,我在一个纸上面,如果我画出了无穷强的曲线,这是一个什么东西。不管你怎么画,它绝对是有限长度的。大家知道K线在任何一个点上都不可能自相交,它不可能有宽度。它可能是一个一纬到两纬之间的线段,解释这个线段,这是解决我一纬到两纬线段的工具。

  股市是一种非现行的自组织分形结构,资产的价格变化并不是简单随机游走。大家可能在网上查到Hurst,D等于2减H,D就是股价时间函数曲线的纬度,讲一下它的使用意义,它的H值位于0到1之间,以0.5为间隔,在这根线之下,股票处于一个什么状态呢?不断的反转状态,我们可以定义为这个时候指数处在不断的振荡状态,因为我确实找不到这个趋势,如果这个时候它代表着持续维持的过程。如果这个时候股价是牛市的状态,这代表着牛市将要继续,如果这个时候是熊市,代表着股市将继续跌。我们期望股市处于平衡态和远离平衡态都是同时有用的,可以看一下实战效果。

  2014年以来我研究的Hurst发出了7次信号,可以看一下效果怎么样。这轮牛市我们的看多时点是2014年10月8号,看空的时点是2015年5月25号,区间指数上涨了105.76%,这轮看多结束了,接下来我们看振荡,这一轮我们赚了9.17%, 我们不断每一次判断是准确的,而且几乎覆盖整个时间轴。

  基本上中国市场的牛熊转化,关键点我们都抓到了。大家可以关注一下这个微信好,我们会在这里面每周更新我们的观点。因为我们是工银瑞信,大家享受VIP次行待遇。

  最后,我做一下结语,平时我给券商和机构做路演。但是给学术界做路演机会不是特别多,说一下我对整个体系的看法。

  其实这段时间非常热,我十几年前我解过一个旋转的黑洞。我不说结果怎么样?但是我主要说在解的过程当中,我深刻的理解到,爱因斯坦如果没有这样的工具,他怎么可能在左边一个动力学的东西,爱因斯坦划出等号的瞬间,他已经达到了上帝的地位。为什么?因为只有他知道上帝设计宇宙的蓝图,我们通过微分几何的数学方法,我们终于知道了恒星的排列,知道时空的序列,我们可以探听树木深水的美丽,这个可以达到了人类的顶峰,这个其实是借助爱因斯坦,完全借助新的数学工具。

  同样,在上一个世纪,同样的数学天才像图灵这样的人建立了新的数学,其实没有人知道这个数学应该用在哪里。目前最周期的应用应该在信息学和生物科学上。但是我觉得特别是经过了这一轮股灾的考验之后,自从有了资产价格,而且上市以后困扰了人类一百多年的游走过程,也许我们找到了最好的数学工具,真正能够解开K线之谜,大家看这个看似辉煌务必,其实不堪一击。因为现在还有这么多黑天鹅事件,这就说明资产价格的根本假设可能是不对的。型号我们有新的数学根据可以用来替代,我相信替代的方案非常种。但是据我的了解,微分几何学也是我们解决这个问题最好的方法之一,谢谢大家。


阅读:1324