Как правильно выявлять взаимосвязи в экономике? Ключевое слово - коинтеграция!
Привет! Ты пришел в блог Андрея Голобородько о финансовом анализе. Эта статья - первая в цикле статей по эконометрике.
Цикл по эконометрике - это новый, второй цикл статей в моем блоге. Предыдущий цикл (вот его первая статья), посвященный оценке бизнеса, не завершен и писать в рамках первого цикла я продолжу, но позже. Пока же моя работа перестала иметь отношение к оценке бизнеса и превратилась в сплошное эконометрическое исследование, и я буду писать про эконометрику.
Итак, вернемся к теме статьи. В экономике мы, как правило, изучаем взаимосвязи между временными рядами - между доходами и потреблением, производством электроэнергии и ВВП, ценами на нефть и курсом доллара и так далее. При этом, многие (и я до недавнего времени был среди них) не имеют ни малейшего представления о том, как такую связь правильно моделировать и описывать.
Вот, например, сравнение динамики стоимости золота и курса акций компании "Полюс Золото" примерно за полгода:
Котировки взяты с сайта Финама. Стоимость акций в рублях поделена на биржевой курс доллара с расчетом "завтра".
Похоже, что взаимосвязь очевидна. Тот, кто знаком с начальным курсом статистики, может даже построить модель регрессии и получить высокий коэффициент корреляции.
А теперь посмотрите, как тесно связаны между собой импорт нефти в США из Норвегии и число водителей, погибших от столкновений с поездом:
Взято отсюда
Абсурд? Конечно, абсурд. Авторы называют этот и подобный ему примеры ложной корреляцией, при этом вводя нас в заблуждение. Дело в том, что при анализе временных рядов никакой истинной корреляции быть не может. Точнее, любой статистический метод пригоден только для работы со стационарными временными рядами.
Стационарные временные ряды - это те ряды, которые описываются как случайная величина. Пример стационарного временного ряда - белый шум, он выглядит вот так:
Что такое стационарные и нестационарные временные ряды, можно посмотреть здесь (YouTube).
Дело в том, что корреляция двух любых временных рядов, содержащих тренд (а также сезонность или цикличность), будет высокой. Удои коров в Белгородской области будут на 75-95% коррелировать с добычей угля в Австралии. Это значит, что использовать корреляцию для изучения взаимосвязи между между временными рядами нельзя.
Как же тогда посчитать, как взаимосвязаны между собой доход и потребление, например? Ответ такой - нужно искать коинтеграцию между рядами.
Другими словами, если мы прогнозируем временной ряд А, используя временной ряд Б, и ошибка нашего прогноза является случайной величиной, то ряды А и Б коинтегрированы.
Алгоритм тестирования на коинтеграцию и построения модели можно посмотреть здесь:
- https://utmagazine.ru/posts/6820-kointegracionnyy-podhod-k-parnomu-treydingu - наиболее простой способ моделирования. Из всех материалов на тему коинтеграции, которые я встречал, здесь тема раскрыта наиболее доступно.
- http://pe.cemi.rssi.ru/pe_2015_3_106-135.pdf - перевод научной статьи Роберта Ф. Энгла и К. У. Дж. Грэнджера, придумавших коинтеграцию. Есть примеры. Здесь тема раскрыта наиболее полно.
Другие статьи этого цикла:
2. Что делать, когда срочно нужен эконометрический анализ. Пошаговая инструкция
Другие циклы:
Статьи по оценке бизнеса