资管专区
大数据下的交易数据分析及应用思考
来源:中国货币网
作者:何真
2019-06-04

  当前我国银行间本币市场处在蓬勃发展的阶段,市场规模和交易量逐年创新高。2018年上半年本币市场主要交易品种(含回购、现券、拆借、衍生品等)的成交总量为458万亿元,意味着每天产生数万亿元的交易流。

  交易数据的充分运用,能够在资产管理、市场预测、风险预警等方面发挥重要的作用。笔者从基金公司交易监控及风险预警的角度,简述交易数据的处理过程,选取实际应用的几个场景,探索交易数据所蕴含的有效信息。

  一、交易数据处理及交易数据特性

  交易数据处理步骤包含采集、导入、统计分析、提炼挖掘等几个步骤。

  债券市场提供了多样性的交易数据源,含各市场的实时交易数据、各种分类统计数据、数据提供商如经纪商成交数据等。由于债券市场按不同托管机构登记结算,各类数据存在一定分割性,统计口径也略有差异。因此,采集数据要注意口径一致,并兼顾全面性。目前多个交易场所能支持数据导出功能,以CFETS为例,通过API接口服务将数据信息链接导入机构的内部系统,提供交易分析的便利性。

  在进行统计分析前,从数据角度,还需要了解市场交易数据的波动性,并鉴别数据的有效性、真实性。

  1.交易数据的波动性。交易数据受市场因素和非市场因素影响。经济基本面、政策面、资金面、供需关系、市场情绪、机构偏好因素会影响资产交易价格、成交量、收益率曲线形态、利差。资产的波动性意味着机会,同时也是一项必要的风险管理,尤其要关注交易数据的异常表现,并了解背后的原因。

  2.交易数据的有效性。传统的询价模式决定了银行间交易数据存在非连续性和非实时的特点(询价到真实成交存在时滞)。在信用债市场,尤其是低评级债券,由于成交量少提供不了足够的交易分析样本。由图1可知,不同信用等级的债券成交频率和量差异很大,低评级债券成交稀少。

  图1现券二级市场日成交量(单位:亿元)


数据来源:WIND,易方达基金固收交易部

  3.交易数据的真实性。交易数据反映供需双方博弈的结果,也能体现品种及个券的流动性。但异常数据或市场习惯也会形成一定“噪音”,造成对数据信息的干扰。比如OTC市场交易以授信及对手风险管理为前提,一些基于机构和产品授信要求的“过桥”交易和一级市场的分销上市交易也包含于市场成交数据中。研究分析数据最好能剔除掉“噪音”影响,真实反映市场及机构行为。

  二、交易数据运用场景及案例

  (一)交易内部监测及绩效评估

  业务需求:加强投资交易监测;建立业务比较基准,比较交易成本及评估绩效。

  目前银行间回购利率可参考:“全市场加权平均利率(R)”和“存款类机构加权平均利率(DR)”。上述利率在一定程度可以反映全市场机构和存款类机构的融资利率。此外我们还可以通过CFETS提供的“基金公司及产品”的各期限融资利率,计算出基金公司及产品的市场加权平均利率。

  如图2所示,基金公司及产品的质押式回购交易量大概占全市场总量的15%左右,其利率与全市场加权平均利率存在一定差异。可以看出,相比R和DR,基金公司及产品的市场加权平均利率更适合用于同类型机构比较。此外,通过与己方加权平均利率对比,也能反映机构自身的交易能力,用于评估交易绩效。

  图2 2018年基金公司及产品与全市场融资情况对比



数据来源:CFETS,易方达固收交易部

  (二)机构动态跟踪及交易行为预测

  业务需求:了解市场不同机构行为特征;通过历史成交数据进行分位数测算以及预测后市。

  通过交易数据分析可以了解债券净买入主力机构及机构分布变化,了解机构的期限偏好,并可将数据进行环比、同比比较,通过历史成交数据还能进行分位数测算,预测机构行为。以表1为例,2018年9月基金公司主要净买入,股份制银行、城农商行和券商主要净卖出,热点期限主要为3年以内和7-10年。

  表1 2018年9月机构净买入分布(亿元)


数据来源:CFETS,易方达固收交易部

  结合到己方的交易策略及偏好,从横向看,可以与对标机构及全市场比较,判断自身操作是否在同期的市场变化中占得先机;从纵向看,可以与历史数据比较,把握不同类型机构的投资策略变化规律。

  (三)品种活跃度及机构活跃性指标应用

  业务需求:对比及研究债券品种成交活跃度差异;测量交易品种占市场和占类属机构的比重,以测评机构活跃度。

  通过银行间债券品种的每日成交数据也可以观测其品种活跃度趋势,比较不同品种之间活跃度及相关度。同时还能通过测算本方机构交易量占市场及同业机构的权重,衡量交易规模及效率。以图3为例,2018年7-8月之间,信用债市场活跃度回升,短融成交量先回升,中票成交量随后回升,表明在此期间市场交投热点发生了变化。

  另一方面,通过计算己方占市场及同业类属机构的比重,可以把握和调整交易节奏和策略。还可以通过历史数据来回测检验己方交易行为是否激进或保守。如交易量占市场权重较大的情况,可调整交易节奏,分散风险。

  图3 2018年信用债成交量走势图(亿元)


数据来源:CFETS,易方达固收交易部

  (四)个券和组合流动性评分探究

  业务需求:资管产品的特性决定了基金类机构要尤其关注个券和组合的流动性。资产流动性对投资交易决策有着重要的影响。

  日常交易中,衡量和判断个券流动性需要投资交易人员的敏锐性和经验,同时更需要基于对客观数据的量化分析及研究。

  具体方法论上,可基于主成分分析法构建评估债券流动性的量化模型。可采用的数据有成交价、成交量、成交笔数、换手率、报价价差、报价频率等,再结合债券发行量、信用评级、债券类属及特殊条款等债项因素,运用主成分分析法进行降维重组,构建数量模型,将个券流动性进行量化评分,并测算资产变现速率和折溢价率。数据量化分析的优点是客观、易复制、覆盖面广。最后再结合投资交易人员的专业和经验,对评分结果进行验证与校正。

  模型优化后,还可以用支持向量机等方法对个券流动性进行预测,进而预测组合的流动性,并结合账户风险收益特性进行投资决策建议。

  (五)债券交易价格异常预警

  业务需求:关注市场债券交易价格异常偏离,进行信用风险及流动性风险预警,挖掘投资机会。

  交易数据还可以用于债券异常交易监控。通过回溯每日成交情况,对成交收益率与估值偏离较大,尤其是成交收益率显著高于估值的债券进行筛查,判断这些债券是否有潜在的信用风险、流动性风险等。对于确实存在风险的债券,尤其是己方有类似持仓的进行重点关注;而如果判断风险较低,则可作为潜在的投资机会。

  表2为2018年9月底市场异常交易数据的筛查结果。通过对样本数据筛查出成交存在较大偏离的信用债券。结合流动性评分及信用资质筛查,剔除数据噪音的干扰,预警和管理好个券的潜在风险,并推荐有潜在投资机会的债券,进一步发掘交易价值。

  表2 2018年9月部分异常交易数据



  三、推动交易数据资源应用的建议

  目前债券量化交易及策略已经在国内一些机构得以尝试和推广。机器学习和AI是交易数据资源应用的未来。应加强对交易数据各种场景的分析,运用网络爬虫技术做好舆情与预警监控,通过对历史交易数据进行分析、画像,客观评估产品的风险及收益特征;同时,实现可视化分析、做好数据管理和质量监控也是需要进行的工作。

  另一方面,在制度和机制建设上,加强交易数据资源商业化,让数据提供商和服务商提供规范、准确、快速的服务;提高专业化处理数据的能力;同时加强市场机构主体数据信息权益及安全隐私保护。交易数据资源运用的未来无可限量。

  作者:何真,易方达基金管理有限公司


阅读:1051