MetaTech|乾象CTO在北大关于量化的十问十答
前言
乾象投资(Metabit Trading)CTO鲜染近日在北京大学进行了主题为「AI in trading下的量化投资之路」的技术讲座。除了科普量化相关的内容,作为2011级信科学院的学长,鲜染还倾囊给出了自己对于大学生活的见解以及职业规划的建议。
活动现场吸引了来自经管、计算机、数学、物理等多个专业的同学。随着国内量化行业的发展,在顶尖学府的相关专业中,量化已成为学生们关注的就业方向。于是,在讲座内容结束后的Q&A环节,众多同学提出了许多高质量、且具有代表性的问题,让我们来一睹为快吧!

正文
Q1:量化交易中,模型和因子哪个更重要?有种说法是量化研究员的日常就是挖因子,您怎么看?
A1:这和数据的体量有关,当数据量不大的时候,模型发挥空间有限,注重单因子配合简单线性模型的效果是优于复杂模型的;但随着预测周期的缩短,比如预测一只股票30s的return,样本数就更多了。这个时候相比手工做因子,模型的优势就发挥出来了,因为有更多的信息可以供机器学习模型挖掘。
在未来我认为模型会重要于因子。但其实由模型带给策略的增长也会趋于饱和,最终的模式大概率是,模型和因子的重要性会做一个螺旋式上升的切换。
Q2:各家量化公司是如何寻求策略增长点的?这和所使用的因子类型有关联吗(量价/非量价)?
A2:前面提到了模型和因子对于策略的重要性。有的私募做复杂的因子+简单的模型组合,有的私募做简单的因子+复杂的模型,都可以实现一样的效果。目前在中国市场,量价数据仍然具有很大作用,乾象目前使用的90%的因子依然归属于纯量价因子。它们本身就能直接套用一些Time series model,比如LSTM去预测下一个周期的return,这点和自然语言处理这种sequence model是很相似的。
Q3:对于所学专业为计算数学的学生,您认为加入量化能从事哪些岗位的工作?
A3:计算数学专业可以考虑researcher,它兼顾了对于数学和工程的双重需求,说白了就是我们需要很会写程序的计算数学家。主要的工作内容就是通过构建复杂的模型和实验,去验证策略的有效性;如果是偏高频,会需要学习更底层的计算机课程。
量化当中有一个步骤叫组合优化(Portfolio Optimization),初入量化者也有可实践的领域,这块更适合擅长统计和运筹学的。举个例子,当我看中了市场上的一只中小股,而我买入的体量相当大,这势必会给市场造成显著的冲击。那么在市场供应有限的情况下,如何去分散持仓,如果这类问题能得到优化,那将会给策略成效带来系统的提升。
第三就是一直提及的挖因子,对于初入量化的同学来说比较容易上手,也有Impact,比如能够直接上线。
Q4:乾象是如何看待策略的可解释性的,会有一些指标来衡量解释程度吗?以及可解释性的高低在高频、中频和低频会有不同的体现吗?
A4:这个问题quant回答可能更好,站在CTO的角度我的见解是,金融数据有个弱点是噪音大、很容易被模型overfit,体现在越短期的金融趋势越容易把握,而对于越长周期越需要不断地使用先验知识来对模型进行regularization ,而regularization里的先验和可解释性其实是一回事。
我们prefer有完整的理论解释(但不是必须有),因为很多东西比较玄学,难以被充分解释。高频数据量一般很大,就可以相对地放松对于数据可解释性的要求;低频数据量小,相应地就需要一定的可解释性了。
Q5:一直有耳闻量化私募的自营和资管,能请您科普一下二者的区别吗?
A5:自营是指公司用其自有的资产去参与交易,它的盈亏都由公司兜底。资管是代客理财,然后为投资人谋取收益,同时也是投资人承担损失,然后从中赚取佣金的一种方式。相比之下,资管对于投后策略的可解释性要求会更高,也涉及社会层面比如合规监管等方面问题的应对。
Q6:量化公司策略岗位一般是核心岗位,那开发是不是有点偏向边缘的岗位了呢?
A6:在一些数据量较小的公司是这样的,因为不需要计算机、在一个单机上就能完成实验。而乾象数据量大、数据复杂、上线难度大,这时候工程能力就从一个优化的层面转变成了不可或缺的一项能力了,所以我们非常注重技术上的投资,我们研究员和工程师的比例大概是1:2。
我们相信在未来的竞争当中,迭代能力是不容忽视的制胜关键,而不是仅仅依靠一两个super smart的genius idea。因此在乾象,开发和策略会被认为是同等重要的。
Q7:我目前在读大二,想找量化方面的实习机会,是不是难度较大?
A7:我们不会直接卡这一点,但从统计学上来说是的。因为大三学生更接近毕业、参加实习留用的可能性更大,他们学的东西更多,上手更快;当然了,也有很多大二的很优秀的同学,在大二实习后的大三继续参加我们的实习项目。
Q8:想加入量化行业需要对金融知识了解到哪种程度?
A8:量化处理的主要是numerical的ML、统计相关的问题,没有那么依赖金融背景,但是有金融背景在宏观层面可以更好地解读某些事件或者政策。比如某个黑天鹅事件爆发在微观层面的确解释不了,尤其在市场动荡的时候,经济学能起到很好的解释作用。入门quant还是偏向数学层面的能力。
Q9:您掌握的底层的技术知识,对于量化领域的工作带来了哪些实际的提升呢?
A9:我学了很多底层的东西,比如CPU、模拟器这些都学过。量化是很容易能写出性能爆炸的代码的,而我们要做的是达到毫秒级别的优化。
性能优化在很大程度上,是培养了你一些不需要经过深思熟虑就能获得的常识和思维结构。体现在工作中就是让你不会掉入显然的性能陷阱;如果从更宏观的角度来说,这种思维结构能让你更容易地理解生活中的种种问题。
Q10: 您认为作为金融背景出身的要如何跟技术背景出身的人竞争呢?
A10:对于需要灵巧处理大规模数据的量化公司来说,的确对于编程能力是有要求的;但如果是偏低频数据的公司,你如果能看懂财报或者一些社会文章,然后将这些数字或文字转化为对策略有意义的信息,再投喂到已有的模型中去,还是会生成有效的信号的。
我们目前不会直接卡专业,主要看候选人有哪些具体的项目经验。

结语
看完乾象CTO鲜染和北大学子关于量化的十问十答,你对于量化是不是又多了些感悟呢?让我们继续期待下回的校园讲座吧~

We are researchers & engineers.