INCERTO 血统
正态分布和幂律分布
从人性角度看,我们都接受一个正态分布的世界。我们小时候学的统计学也强调了世界的正态分布。比如身高,大多数人都在平均身高附近,在均值的两个标准差之内。身高相同的人很少,此时没有极端身高的人(比如50厘米的侏儒和5米的巨人)。塔勒布也将正态分布称为“中等斯坦”。
但是世界并不完全由正态分布组成,幂律分布出现在很多事物中,让人觉得黑天鹅远比想象的多,比如在正态分布时间里,如果市场两天下跌30%,那么每天应该下跌15%左右。但是在幂律分布中,可能某一天下跌29%,另一天下跌1%。
关于这一点,我们对股票的投资收益感触很深,股票的长期收益率远高于银行理财,但为什么还有那么多人不敢买股票基金,不敢把钱存在银行呢?因为股票资产的收益率不是正态分布的,而是幂律分布的!
也就是说,如果一款银行理财产品的年化收益率是5%,那么你持有一个月,就可以获得0.4%的稳定收益率,持有半年,就可以获得相应的2.5%的收益率。收益率每天都在上升,给持有者带来了非常好的体验。为什么余额宝出来的时候大家都把钱转到余额宝上呢?因为余额宝每天都会告诉你赚了多少钱,还有利息,非常简单直接。
但投资股票基金不是这样的,股市的收益来自于很少的几天、很少的公司,相信很多人都见过类似的数据:美股过去20年的年化收益率是7.2%,但如果错过了20年股市最好的10天,年化收益率就会急剧下降到3.5%,如果一个人特别倒霉,错过了20年最好的30天,那么即使长期来看,在美股的牛市中,这个人过去20年的年化收益率也只有-0.91%。
我们再看另一个数据:从1926年到2016年,美国股市共有25332家公司上市,排名前90位的公司创造了几乎一半的股市财富。
从美股的情况我们可以看出,投资收益都是少数人、少数公司创造的,股票投资是典型的幂律分布,这也是股票投资需要极高专业性的地方,最终的投资收益也是幂律分布,也就是说极少数人赚了市场上大部分的钱。
所以,如果我们说一个基金经理有20%的年化收益,那绝对不代表他每年都能赚15%,这是两个完全不同的概念,他肯定有几年赚得更多,有几年可能赚得更多。要获得这个15%的收益,只有长期持有(比如5年以上),才能最终把幂律分布的收益变成确定性的收益。
致命灾难原则
塔勒布有一个经典的感恩节火鸡理论,一只火鸡每天都被主人喂食,火鸡会认为被喂食是正常的。但在感恩节这天,火鸡没有被喂食,而是被主人用刀子杀了,作为感恩节晚餐。其实主人养火鸡就是为了在感恩节吃它(美国人感恩节必须吃火鸡),但火鸡却以为自己遇到了黑天鹅。
在塔勒布的宇宙里,有些事情发生的后果要么是0,要么是1,这也是为什么风险管理如此重要。某些风险一旦发生,哪怕概率很小,结果也是你出局,所以这个风险必须防。相反,大多数人用正态分布的思维来做风险管理,认为风险的发生是小概率事件。最典型的案例就是长期资本管理公司的倒闭,他们认为这种风险的发生是离公司几个标准差远的事情。但金融市场是幂律分布而非正态分布,每隔几年、十年就会出现标准差之外的事件。这意味着长期资本管理公司的风险管理模式注定会失败,只是时间问题。
在传统金融中,我们的统计方法全部基于正态分布,例如夏普比率、Beta 等。长期以来,我们都用夏普比率来判断一个基金经理或者一个金融产品好不好。但问题是,由于金融市场本身是极端斯坦,不是平均斯坦,所以夏普比率的意义并不大,我相信在 Long-Term Capital 倒闭之前,它的夏普比率是极高的,很多对冲基金也亏损了 10 个标准差以上。包括 2020 年爆发的新冠疫情,把全球所有的“风险平价”模型对冲基金都干掉了,除了桥水。
衡量风险的指标,还是要回归本质,如果一个人真的在冒险,那么最后的结果可能就是“爆仓”,除非你运气极其好……
更关注赔率而不是概率
因此,塔勒布更看重几率而非概率,比如塔勒布担任外部顾问的Universa Hedge Fund,今年第一季度就取得了4144%的极高收益,这家对冲基金的创始人马克·斯皮茨纳格尔(Mark Spitznagel)就是专门研究黑天鹅事件的,他认为市场把黑天鹅事件定价过低,几率特别好,所以他会一直做下去,直到它必然发生的那一天。
相对于高概率,由于世界本身就存在高度不确定性,很多高概率都是被“夸大”了,所以投资还是以高概率为主。《大空头》里也提到过,我在书上也看过。只要抓住千载难逢的交易,一旦出现超高概率的交易,就够了。
我们的志愿者戴国臣对此深有体会:
当面对随机事件时,人们可能面临以下风险:(1)不知道分布的类型和性质;(2)知道分布的类型和性质,但错误估计参数;(3)黑天鹅。
对于(1),如果误解了分布类型,结果可能是灾难性的。例如,如果估计分布是正态分布(细尾),极端情况下的波动可能是3个标准差的事件,但幂律分布(肥尾)下同样的概率可以发生10个标准差的事件。如果尾部进一步加厚,对数帕累托分布下同样的概率可以发生100个“标准差”的事件。不同的分布对大数定律和中心极限定理的收敛性质有着不同的影响,因此系统的第一层级就是了解不同的分布,明确它们各自的统计性质。
对于(2),如果可以确定分布类型,比如幂律分布(厚尾),但由于样本量有限,很可能真正的尾部不会出现,导致分布参数估计出现错误,后果同样灾难性。如果要用小样本做决策,现有的统计性质需要针对“看不见的尾巴”进行修正,这就是系统的第二层。
本书的价值就在于建立这样一个体系,通过技术手段解决(1)和(2),让我们可以用数学框架去理解随机事件,合理衡量其尾部效应。它从均值的视角,定量描述小样本下大数定律还未生效时不同分布的统计特征。
当然(3)是无法量化的,不是因为技术,而是因为逻辑。一只火鸡也许能预测自己每天早上会吃多少食物,但它无法预测感恩节的到来。所有的数学分布和统计估计都还是经验框架的产物。
知道真相是极其困难的,经验之外的未知部分总是让人感到不安,我们该如何应对呢?塔勒布的哲学拨开云雾,带来光明:反脆弱,不需要成为预测大师,只需要改变补偿关系,当黑天鹅来临时,具有反脆弱特性的事物不仅不会受到损害,还会收获巨大的回报。
既然有哲学方法可以根本化解风险,为什么在应对(1)和(2)时,我们还要绞尽脑汁提升量化技术呢?因为反脆弱性的原理和数学框架的技术并不是割裂的,如果要实践反脆弱性,哲学要改变补偿关系,首先要明确改变补偿的成本,而要追溯根源,需要对厚尾分布有量化的认识。因此,在本书的前半部分,让我们以数学为中心,深入理解厚尾效应。
不确定性就是最大的确定性
时间是不确定的,不确定性是常态,人们总是希望通过各种手段减少不确定性,获得确定性。在塔勒布的宇宙里,最确定的就是不确定性!那么我们继续之前说的,这世上所有事情发生的概率和几率,都是由概率和几率决定的。下面这段话来自志愿者戴国晨的解读:
不确定条件下的决策关键是确定概率与收益之间的关系,其中收益往往比概率预测本身更重要。在实际的决策过程中,人们往往过于关注预测是否正确,希望无限提高准确率,但最终却在补偿结果上遭受损失,导致决策出现巨大的错配。本章我们讨论预测与补偿的关系。
首先我们需要认识到:
• 人们的预测会包含各种偏见,外界信息和心理因素会极大影响预测能力,如果很容易做出正确的预测,我们就不会在金融市场看到贪婪和恐惧,自然也不会看到周期性。
• 成为预测大师并不一定能保证取得好成绩,这主要是因为预测和收益之间存在非线性。预测大师的预测准确率可能有 99%,但也有可能在 1% 的时间内亏损。
举个例子,一个老板问他的交易员:你觉得市场会涨还是跌?交易员满怀信心地说会涨,然后就做空。老板很生气,感觉被骗了,因为他只能接受二元期权。状态:价格上涨时做多,价格下跌时做空,但他们无法理解大概率上涨对应“小涨”,小概率下跌对应“大跌”。交易员在这里锚定的是预期,而不是预测。
从统计学角度来看,预测本身对应的是概率分布的零阶矩,而支付往往是概率分布的一阶或更高阶矩。
可能的概率和支付关系:
•二元预测和支付,例如赌博、彩票、选举结果、新药开发等,只有两种结果:成功和失败。在这种情况下,预测或意见相当于一种投票机制。支付和预测本质上是联系在一起的。如果将两者脱钩,就会出现无风险套利机会,例如荷兰式赌注。
• 赔偿无界(包括无上限和无下限),例如战争伤亡、市场崩溃损失、通货膨胀水平、新产品销售和利润率、保险保障等。此类非线性关系会导致预测和结果不一致。即使预测器只是稍微正确,尾部的巨额赔付仍可能值得,或者预测器大多数时候是正确的,但可能会被尾部的巨额损失打败。
在金融衍生品中,上述补偿的典型例子是二元期权(0或1)和普通期权(单向无界),如下图所示:
一般而言,概率只是积分里面的核函数。现实世界中重要的是报酬,也就是概率事件对每个人的实际影响。金融领域风险管理的本质在于改变报酬关系,而不是追求正确的预测。因为在厚尾分布下很难做出“正确的预测”。因此,只要有利于报酬关系,预测准确度降低是无所谓的。另一方面,如果预测准确度的提高对应着报酬的大幅恶化,那么这样的准确度就毫无意义了。正如人们所说,把熊误认为石头远比把石头误认为熊要糟糕得多!
扫描二维码,领取开户福利!
海量资讯、精准解读,尽在新浪财经APP