Перш ніж занурюватися у формули, розглянемо, чому інвестори цікавляться кореляцією. Коли два активи рухаються разом передбачувано, ви можете створювати портфелі, які краще витримують спади. Коли вони рухаються у протилежних напрямках, їх поєднання зменшує загальний ризик. Це сила розуміння того, як змінні пов’язані — це не лише академічне знання, а й гроші.
Основи: що насправді вимірює кореляція
Коефіцієнт кореляції — це єдина метрика, яка показує, наскільки тісно дві потоки даних рухаються разом. Він завжди знаходиться у межах від -1 до 1. Близько 1 означає, що вони зростають і падають разом. Близько -1 — що рухаються у протилежних напрямках. Близько 0 свідчить про відсутність лінійної залежності. Це просте число перетворює хаотичні розсіяння точок у щось, на що можна реагувати.
Гарна новина — універсальність: незалежно від того, чи вивчаєте температуру і продаж морозива, чи рух цін активів, шкала від -1 до 1 дозволяє порівнювати різні сценарії. Це спільна мова для сили зв’язку.
Вибір правильного методу кореляції
Не всі методи кореляції однаково добре працюють у кожній ситуації. Вибір залежить від типу ваших даних.
Кореляція Пірсона підходить, коли обидва змінні є безперервними — тобто можуть приймати будь-яке значення у межах, наприклад, рух цін або доходи. Вона кількісно визначає, наскільки тісно дві безперервні змінні слідують за прямою лінією.
Спірмен і Кендалл — це альтернативи на основі рангів. Використовуйте їх, коли дані є порядковими (ранжовані, але не рівномірно розподілені) або коли залежність має криву, а не пряму форму. Ці методи краще справляються з хаотичними, реальними даними у багатьох випадках.
Різниця важлива: категорійні проти безперервних змінних вимагають різних підходів. Категорійні змінні (типу “рівень ризику: низький/середній/високий” або “режим ринку: бичачий/ведмежий”) потребують зовсім інших інструментів — наприклад, таблиць сопряженості або Cramér’s V замість Пірсона. Безперервні змінні (ціна, обсяг, час) — це зона комфорту Пірсона.
Для поєднання категорійних і безперервних даних можливо знадобляться спеціальні техніки або спочатку потрібно перетворити одне з вимірів у іншу форму.
Розуміння шкали: що означають числа
Ці діапазони дають приблизне уявлення, хоча контекст завжди важливий:
Діапазон кореляції
Інтерпретація
0.0 до 0.2
Майже відсутня лінійна залежність
0.2 до 0.5
Слабкий зв’язок
0.5 до 0.8
Помірний до сильного зв’язку
0.8 до 1.0
Дуже тісне слідування
Від’ємні значення працюють так само: -0.7 означає сильний зворотній рух.
Чому застереження щодо контексту? Частинки фізики вимагають кореляцій близько ±1, щоб вважати щось реальним. Соціальні науки допускають набагато слабші значення, оскільки людська поведінка за своєю природою більш шумна. На ринках, що вважається “значущим”, залежить від вашої стратегії та горизонту часу.
Як обчислюється кореляція (Механіка)
Формула Пірсона проста за концепцією: ділимо коваріацію на добуток стандартних відхилень.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Зрозуміти кореляцію: практичний посібник для прийняття рішень на основі даних
Чому кореляція важлива у реальних ринках
Перш ніж занурюватися у формули, розглянемо, чому інвестори цікавляться кореляцією. Коли два активи рухаються разом передбачувано, ви можете створювати портфелі, які краще витримують спади. Коли вони рухаються у протилежних напрямках, їх поєднання зменшує загальний ризик. Це сила розуміння того, як змінні пов’язані — це не лише академічне знання, а й гроші.
Основи: що насправді вимірює кореляція
Коефіцієнт кореляції — це єдина метрика, яка показує, наскільки тісно дві потоки даних рухаються разом. Він завжди знаходиться у межах від -1 до 1. Близько 1 означає, що вони зростають і падають разом. Близько -1 — що рухаються у протилежних напрямках. Близько 0 свідчить про відсутність лінійної залежності. Це просте число перетворює хаотичні розсіяння точок у щось, на що можна реагувати.
Гарна новина — універсальність: незалежно від того, чи вивчаєте температуру і продаж морозива, чи рух цін активів, шкала від -1 до 1 дозволяє порівнювати різні сценарії. Це спільна мова для сили зв’язку.
Вибір правильного методу кореляції
Не всі методи кореляції однаково добре працюють у кожній ситуації. Вибір залежить від типу ваших даних.
Кореляція Пірсона підходить, коли обидва змінні є безперервними — тобто можуть приймати будь-яке значення у межах, наприклад, рух цін або доходи. Вона кількісно визначає, наскільки тісно дві безперервні змінні слідують за прямою лінією.
Спірмен і Кендалл — це альтернативи на основі рангів. Використовуйте їх, коли дані є порядковими (ранжовані, але не рівномірно розподілені) або коли залежність має криву, а не пряму форму. Ці методи краще справляються з хаотичними, реальними даними у багатьох випадках.
Різниця важлива: категорійні проти безперервних змінних вимагають різних підходів. Категорійні змінні (типу “рівень ризику: низький/середній/високий” або “режим ринку: бичачий/ведмежий”) потребують зовсім інших інструментів — наприклад, таблиць сопряженості або Cramér’s V замість Пірсона. Безперервні змінні (ціна, обсяг, час) — це зона комфорту Пірсона.
Для поєднання категорійних і безперервних даних можливо знадобляться спеціальні техніки або спочатку потрібно перетворити одне з вимірів у іншу форму.
Розуміння шкали: що означають числа
Ці діапазони дають приблизне уявлення, хоча контекст завжди важливий:
Від’ємні значення працюють так само: -0.7 означає сильний зворотній рух.
Чому застереження щодо контексту? Частинки фізики вимагають кореляцій близько ±1, щоб вважати щось реальним. Соціальні науки допускають набагато слабші значення, оскільки людська поведінка за своєю природою більш шумна. На ринках, що вважається “значущим”, залежить від вашої стратегії та горизонту часу.
Як обчислюється кореляція (Механіка)
Формула Пірсона проста за концепцією: ділимо коваріацію на добуток стандартних відхилень.