MetaTech | 量化书单分享(上)

新闻中心

2022.12.27

前言

量化研究是一个和数理、统计学高度相关的领域。由于金融数据的信噪比极低,在这种状况下,最核心的任务就是需要对于stochastic randomness/overfitting有一个方法论上基本的概念。

基于上述原则,我们为大家带来了优先级从高至低的读物。根据难易程度,我们对每本书做了区分,分别为「入门级」、「进阶级」和「选读」,大家可根据个人情况进行选读。本期推文我们将着重介绍一些和基础statistics/time series analysis/optimization相关的书籍

本文特别邀请到乾象投资的一号quant来进行推荐。话不多说,直接上干货~

基础Statistics相关


1. Probability and Statistics



作者:Morris H. Degroot & Mark J. Schervish

推荐等级:入门级

推荐理由:这本书是一本经典且基础的概率统计类教材,是很多大学本科统计类入门级课程。概率论与基础的统计知识非常全面且扎实,教材从概率出发,对于条件概率、随机变量&分布、期望、特殊分布、大随机样本、估计、样本估计量的分布、假设检验等均有详细的描述与讲解,配合详实的例题,读完之后一定会受益匪浅。

2. An Introduction to Statistical Learning



作者:Trevor Hastie, Robert Tibshirani, Gareth James and Daniela Witten

推荐等级:入门级

推荐理由:这本书俗称ISL,是Stanford University的三个统计学大佬之二的Trevor Hastie以及Robert Tibshirani合著的一本关于statistical learning的入门级读物。

从简单易于理解的linear regression开始,再讲到常见的linear classification方法,再上升到非线性的polynomial regression/tree-based method/SVM,最后也简单介绍了一些unsupervised learning的方法。

在系统性介绍了各种statistical learning后,本书还非常详细地描述了statistical learning的函数拟合本质,以及如何应对learning最大的问题之一:bias-variance tradeoff,深入浅出地介绍了大部分常见的learning method,可以在量化策略中大量应用。

3. The Elements of Statistical Learning



作者:Trevor Hastie, Robert Tibshirani and Jerome Friedman

推荐等级:进阶级

推荐理由:这本书俗称ESL,是Stanford University的三个统计学大佬三人一起合著的“终身心血”。

与上述的ISL相比,整体难度比较高,全书更偏向于statistical learning theory,相比ISL书中包含更多严谨的数学证明,需要读者有相对深入的数学知识(比如证明中会涉及到Hilbert space等)。

相对ISL,ESL在书中也会额外增加一些内容,比如说generalized additive model/boosting/neural network/graphical models等。

Time series相关


4. Analysis of Financial Time Series



作者:Ruey S. Tsay

推荐等级:进阶级

推荐理由:虽然都是讲时间序列,但是本书相较于下面两本,把做数据分析的目的做了更清晰的阐释,即,通过对过去金融危机期间的数据分析,来避免未来可能发生的金融危机,因为这些危机事件之间并不是完全独立的,所以具备分析价值。

本书先简明扼要地讲述了时间序列分析的理论基础,再援引了大量金融世界中的概念与实例,深入浅出地将金融实践与数学理论结合在一起,是严谨又实用的分析、能解决一系列的现实问题。

下面两本基本上都属于time series analysis/stochastic process的经典教材,内容上和 Analysis of Financial Time Series有一些重合,因此作为选读。

5. Time Series Analysis and Its Applications



作者:Robert H. Shumway & David S. Stoffer

推荐等级:选读

推荐理由:本书全面且精细地讲解了在时间序列处理中,time domain和frequency domain两方面常见的分析方法。作者从时间序列本身的特征讲起,介绍了autocorrelation/stationary等基础概念,并从此讲解了ARIMA以及spectral analysis的基础应用;随后书中也提到了GARCH/threshold theory等,继而介绍了在物理、材料等领域有诸多应用的state space model。

本书比较适合有一定统计基础的同学作为时间序列建模的入门读物,书中有一定的范例,同时书中把理论证明和正文分开展示,在阅读时也不用过于纠结繁琐的理论证明。

6. Markov Chains



作者:Pierre Bremaud

推荐等级:选读

推荐理由:如果是为了准备quant trading公司的技术面试,那么必不可少的一项技能就是在统计方面对于马尔科夫链(Markov chain)的理解了。

本书从经典的离散马尔科夫链开始,介绍了transition matrix/first-step analysis等基础概念,并由此延展到马尔科夫链的convergence以及Martingale的介绍;后续在书中也介绍了经典的蒙特卡洛(Monte Carlo)方法,从Gibbs sampling讲到了马尔科夫链和蒙特卡洛结合的经典方法MCMC。

本书中有不少证明,所需的数理统计知识较多,比较合适统计背景的同学阅读。

Optimization相关


7. Convex Optimization



作者:Stephen Boyd

推荐等级:选读

推荐理由:这本书围绕最优问题的基本方法之一凸优化(Convex optimization),先指出了其在数学领域的应用需求是与日俱增,尤其是对于攻读EE/CS方向的毕业生,关于凸优化的掌握会给他们带来不小好处。其次,本书通过几种主流的算法,阐述了凸优化在研究问题的具象化表达和在建模上的应用。

量化策略的很多环节都会或多或少应用到一些特定约束下的优化问题,本书便是一本非常不错的convex optimization教材,从理论/应用/优化算法三个大方面详细描述了convex optimization有关内容。

在理论方面,本书从convex set/function开始,到定义何为一个convex optimization问题,再到何为Lagrangian duality以及KKT condition,铺垫了优化问题中的理论基础;

在简单介绍convex optimization在概率统计/数据拟合等领域的应用之后,本书教学了常见的解决convex optimization问题的数值方法,包括可以简单得到理论最优解的quadratic optimization,以及如何应用Newton’s method以及interior-point method去解决更复杂、有更多类型约束的优化问题。

总的来说,是一本非常不错的optimization algorithm教材。本书的受众并不指一般的研究员、科学家和工程师(比如:在数学优化,或者更广泛地说,计算数学方面的研究者);相反地,主要受众是在计算机科学、经济学、金融学、统计学、数据挖掘等多方面进行科学研究的用户。

结语

想要成为一名quant researcher,前提是必须拥有强大的数学背景(通常具备数学,物理学或工程学学位)。

We are researchers & engineers.

We are researchers & engineers.