理解相关性:数据驱动决策的实用指南

robot
摘要生成中

为什么相关性在真实市场中很重要

在深入公式之前,先考虑一下为什么投资者关心相关性。当两个资产的走势具有可预测的同步性时,你可以构建更有效应对下行的投资组合。当它们的走势相反时,将它们结合可以降低整体风险。这就是理解变量关系的力量——这不仅仅是学术问题,而是与金钱相关。

基础知识:相关性到底衡量什么

相关系数是一个单一指标,反映两个数据流的同步紧密程度。它的值始终在 -1 和 1 之间。接近 1 表示它们一起上涨和下跌。接近 -1 表示它们呈反向运动。接近 0 表示几乎没有线性关系。这个简单的数字可以将杂乱的散点图转化为你可以采取行动的依据。

其美在于普遍适用:无论你是在研究温度与冰淇淋销量,还是资产价格变动,-1 到 1 的尺度都能让你在完全不同的场景中进行比较。这是一种关系强度的通用语言。

选择合适的相关性测量方法

并非所有的相关性指标都适用于每种情况。选择取决于你的数据类型。

皮尔逊相关系数适用于两个变量都是连续型的——意味着它们可以取任何范围内的值,比如价格变动或收益。它衡量两个连续变量是否沿一条直线紧密相关。

斯皮尔曼和肯德尔是基于秩的替代方法。当数据是序数型(排序但不均匀),或者关系呈曲线而非直线时,使用它们。这些方法在处理复杂、真实世界中的数据时,比皮尔逊更有效。

区别在于:类别型变量与连续型变量需要不同的处理方式。类别变量(比如“风险等级:低/中/高”或“市场状态:牛市/熊市”),需要用不同的工具——比如列联表或Cramér’s V,而不是皮尔逊。连续变量(价格、成交量、时间),则是皮尔逊的理想应用场景。

对于类别型数据与连续型数据的组合,可能需要专门的技术,或者先将一种数据转换成另一种形式。

理解尺度:数字代表什么

这些范围提供了大致的指导,尽管具体情况总是重要的:

相关性范围 解释
0.0 到 0.2 几乎没有线性关系
0.2 到 0.5 关系较弱
0.5 到 0.8 中等到强烈的联系
0.8 到 1.0 非常紧密的追踪

负值的含义相同:-0.7 表示强烈的反向运动。

为什么要强调上下文?粒子物理学要求相关性接近 ±1 才能认定为真实关系。社会科学则接受更弱的相关性,因为人类行为本身就充满噪声。在市场中,“有意义”的相关性取决于你的策略和时间跨度。

相关性是如何计算的 (机制)

皮尔逊公式在概念上很简单:用协方差除以标准差的乘积。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)