Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
为什么交易者不能忽视相关性——以及它的实际运作方式
在构建投资组合时,大多数投资者认为多元化仅仅是混合不同资产类型。但他们常常忽视决定这些资产是否真正独立变动的隐藏关系:相关性。理解这一指标可能是对冲头寸与灾难之间的关键差异。
相关性真正告诉你什么
从本质上讲,相关系数是一个单一指标——介于-1到1之间的数字——用以量化两个变量的变动紧密程度。可以将其看作关系模式的调速旋钮。接近1的值意味着它们同步上涨和下跌;接近-1意味着它们呈相反方向变动;大约0则表明几乎没有可预测的联系。
对于交易者而言,这很重要,因为它决定了额外资产实际上能在多大程度上降低投资组合风险。两个回报相同的股票,其表现可能截然不同,取决于它们的相关结构。在将股票与债券、商品或另类资产结合时亦是如此。
大陷阱:相关性不等于因果关系
许多投资者在这里犯错。两个资产一起变动,并不意味着其中一个导致另一个。第三个因素——利率、地缘政治事件、行业趋势——可能同时驱动两者。识别这一区别可以防止你构建脆弱的对冲,或误以为关系会持续,实际上基础驱动因素发生变化。
在市场压力期间尤为关键。平静时期看似弱相关的关系,在波动性激增时可能完全消失,让你在最需要多元化时变得毫无防护。
如何衡量:三大主要方法
皮尔逊相关系数是标准。它通过将两个连续变量的协方差除以它们标准差的乘积,衡量线性关系。公式简单:相关性 = 协方差(X, Y) / (SD(X) × SD(Y))
这种标准化让你可以在不同资产对和市场之间进行一致的比较。
但皮尔逊有盲点:它只捕捉线性关系。如果两个变量以曲线或阶梯式模式共同变动,皮尔逊会显示较弱的相关性,即使实际上存在强关联。这时斯皮尔曼和肯德尔相关系数就派上用场了。这些基于秩的指标能捕捉单调关系,更适合非正态分布或样本较小时使用。
选择合适的指标很重要。股票和流动性资产用皮尔逊。处理序数数据或关系非线性时,切换到斯皮尔曼或肯德尔。
读懂相关性数值:背景至关重要
大多数分析师使用的粗略基准:
负值遵循相同的尺度,但表示反向变动。相关性-0.7意味着相当强的负相关——对冲时常常是理想的。
但问题在于:“强”的定义因情境而异。物理实验室要求相关性接近±1才算显著。金融市场则不同。即使两个资产类别的相关性很弱,只要规模足够,也能显著降低组合波动。
样本规模决定一切
相关系数在10个数据点和10,000个数据点时看起来完全一样,但其可靠性天差地别。样本少时,即使是中等数值也可能纯属偶然。样本多时,即使是温和的值也具有统计意义。
尤其在数据有限时,务必检查p值或置信区间。来自100个观察值的弱相关性,比来自20个观察值的相同数值更具参考价值。
真实投资中的相关性:三个实用例子
股票与债券: 历史上,美国股票与政府债券表现出低或负相关性,是经典的多元化工具。但这种关系并非一成不变。在某些时期,尤其是滞涨时期,这种关系会剧烈崩溃。
石油公司与原油价格: 直觉认为能源股应紧跟油价。长期数据显示,相关性仅为中等,且极不稳定。公司特定因素、炼油利润率和地缘政治对冲会制造噪音。
商品对: 一种金属的价格变动对另一种的预测能力有限,尽管交易者常常假设相反。需求动态、供应冲击和货币波动会形成弱相关结构,令人难以用简单的对冲策略应对。
关键教训:相关性在危机中会发生变化。你最需要对冲时,既有关系往往会失效。这也是专业人士定期重新计算滚动窗口相关性,并在历史模式变化时调整仓位的原因。
数学背后(简化版)
想手动验证结果的读者,可以用以下基本逻辑:
取两个数据序列X和Y。计算它们的均值。每个观察值减去均值,得到偏差。将配对偏差相乘并求和(这是协方差的分子)。然后计算每个序列的标准差。用协方差除以标准差的乘积,即得相关系数r。
如果Y与X成比例上升,结果接近1;如果一升一降,接近-1。大多数实际金融数据会落在中间。
实际上,你不会手算。Excel可以瞬间完成这些运算。
在Excel中计算相关性
Excel提供两种简单方法:
单对数据:=CORREL(范围1, 范围2),即可立即返回皮尔逊系数。
多资产对同时计算:使用数据分析工具包(Analysis Toolpak)。启用后,选择“数据”>“数据分析”>“相关性”,输入你的范围,工具会生成一个显示所有配对相关性的矩阵。
技巧:仔细对齐数据,正确处理标题(勾选“第一行包含标签”),在信任结果前检查原始数据中的异常值。单个极端值可能会大幅扭曲相关系数。
R与R平方:不同工具,适用不同场景
R是相关系数本身,显示线性关系的强度和方向。
R平方是R的平方,表示一个变量的方差中有多少可以由另一个线性回归解释。如果R=0.7,则R²=0.49,意味着Y的变动中有49%可以用X预测。
可以这样理解:R告诉你点在一条线(正或负斜率)周围的聚集程度;R平方告诉你用X可以解释Y的涨跌的比例。
相关性失效的情况
避免的最大陷阱:
非线性关系表现为弱相关: 两个变量可能以曲线方式共同变动。皮尔逊会显示弱相关,但实际上它们关系密切。务必先用散点图观察。
异常值扭曲一切: 一个极端观察值可能让相关系数剧烈偏离。筛查数据,判断异常值是否为真实信号或测量误差。
假设被违反: 非正态分布、类别变量或秩次数据都违反了皮尔逊的假设。应使用其他指标。
相关性不稳定: 市场环境变化。去年有效的对冲,今年可能失效。定期重新计算,并在策略中加入弹性。
结论
相关系数是理解资产关系的实用起点。它将复杂的关系压缩成一个易于解释的数字。但将其视为全部信息是危险的。
结合可视化(散点图)、统计显著性检验、异常值检测,以及关系演变监控,才能全面理解。用相关性生成假设,而非绝对结论。某些情况下,弱相关仍有价值;而强相关在危机中可能一夜之间消失。
最终获胜的投资者,不是找到“完美”的相关系数,而是懂得其局限性,并据此调整思路。