Excel - это просто!

A+ A A-

Что делать, если достоверная корреляция не получается

Статья по построению корреляции (ее текст здесь) вызвала серьезный интерес со стороны читателей, поэтому я решил написать эту статью. Она посвящена тому, что делать, если достоверная корреляция не получается по необъяснимым причинам.

Недавно на работе прилетел интересный запрос. Рассчитать достоверную корреляцию между курсом рубль/доллар США и ценой на нефть. По смыслу понятно, что она есть. И она должна быть достаточно хорошей. Проблемы появляются, когда начинаешь строить корреляцию на основе статистики.

Рабочий файл с данными и графиками вы можете скачать по ссылке ниже.

Итак, шаг первый - нашли данные здесь и здесь.

Шаг второй (необязательный) - построили график с двумя крывыми, отложенными на разных осях, чтобы визуально оценить, есть ли корреляция вообще.

Вроде бы, зависимость есть.

Строим точечный график, добавляем на него тренд с уравнением и достоверностью. R^2 получается 18% - считай, корреляции нет.

Считаем на разных отрезках (хотя бы от 30 значений) - достоверной корреляции нет. Хоть убей. Почему?

Смотрим на первый график еще раз, и тут нас осеняет по нескольким пунктам:

Первое. Связь между показателями явно есть. Когда нефть падает, рубль слабеет (курс увеличивается), и наоборот.

Второе, и самое важное. При уменьшении цены нефти, рубль слабеет сильно. А при росте нефти, крепнет весьма неторопливо. Вот оно! Именно поэтому нет статистически достоверной корреляции. Метод малых квадратов, используемый в Microsoft Excel для построения формулы корреляционной зависимости, направление изменения просто не учитывает. Отсюда вывод - построить достоверную статистическую корреляцию этих двух показателей не получится.

Но не сдаваться же, в конце концов. Задайте себе вопрос, зачем эта корреляция вообще нужна. Обычно для прогнозирования, но для прогнозирования чего: спадов (консервативные сценарии) или роста (оптимистичные сценарии). А дальше смотрите, какой метод анализа для вас считается допустимым. 

Если вы прогнозируете рецессию как в 2008 году, возьмите этот период и на его основе делайте выводы. Если вы прогнозируете постепенный рост как в 2009-2012 - ответ тот же, делайте анализ на основе данных этого периода.

Пошаговая инструкция, как построить корреляцию - здесь.

Последние новости

Как быстро удалить тысячи строк из громадной таблицы по филь…

Пошаговая инструкция по удалению множества строк, которые перемешаны в огромном массиве данных. Так, чтобы компьютер не ...

О нас

Напишите мне edward@youcanexcel.ru

О проекте

Копирование материалов сайта разрешено только с согласия владельца с размещением ссылки на источник.

Веб-сайт оптимизирован под разрешение не менее 1024x768.

Сайт отражается некорректно? Должно быть вы пользуетесь Internet explorer. Установите себе хороший браузер!