Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Проверка временного ряда на стационарность. Определение порядка интеграции процесса

Первым этапом анализа временных рядов является проверка исходной информации (временного ряда) на стационарность и определение порядка интеграции процесса.

Выполнить проверку временного ряда на стационарность в Eviews можно с помощью расширенного теста Дики-Фуллера, а также с помощью анализа коррелограмм автокорреляционной и частичной автокорреляционной функций (АКФ, ЧАКФ).

Для построения АКФ и ЧАКФ необходимо в открытой рабочей группе выбрать меню View/Correlogram (1)…. В появившемся диалоговом окне Correlogram Specification (рис. 22.) указывается принцип построения коррелогамм (на исходных уровнях ряда (level), на первых разностях[1] (1-st difference) или на вторых разностях (2-nd difference)), а также указать количество лагов (lags to include), отражаемых в коррелограмме (оптимальное число лагов зависит от длины ряда Т и не должно превышать числа Т/4).

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рис.22. Окно спецификации коррелограмм.

Окно вида коррелограмм АКФ и ЧАКФ представлено на рис. 23. Здесь помимо графиков коррелограммм дается список значений автокорреляционной и частной автокорреляционной функций, а также приводятся рассчитанные для них соответственные значения Q-статистики с соответствующими уровнями значимости (Prob), на основании которых можно принять решение о значимости коэффициента автокорреляции для каждого лага.Согласно подходу Бокса-Дженкинса[2] анализ коррелограмм позволяет провести идентификацию моделей АРСС, а также определить наличие тренда или сезонной/циклической компоненты временного ряда. Но кроме этого по поведению АКФ и ЧАКФ процесса можно судить о его стационарности. Процесс, скорее всего стационарный[3], если коррелограммы АКФ и ЧАКФ убывают по модулю.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рис. 23. Коррелограммы АКФ и ЧАКФ

Проверку стационарности стохастического процесса можно на основе тестов единичного корня. Для проведения теста Дики-Фуллера необходимо в рабочем файле открыть тестируемую переменную (с помощью правой кнопки мыши и выбора команды Open) и в появившемся окне выбрать команду View/Unit Root Test… откроется окно задания параметров теста единичного корня (рис. 24). Здесь следует определить:

1. Расширенный тест Дики-Фуллера Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

2. Тест Филипса-Перрона Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста.

Для каких уровней тестировать ряд Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста: на исходных уровнях, первых разностях, вторых разностях.

Следует ли включать в уравнение теста Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение тестасвободный член, тренд и свободный член или ничего не включать.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рис. 24. Окно задания параметров теста единичного корня.

Результаты проведения расширенного теста Дики-Фулера (ADF) будут сведены в таблицу (рис. 25), где для каждой из лаговых переменных указываются не только их значения (столбец Coefficient), но и соответствующие им t-статистики с определенными р-уровнями значимости (соответственно столбцы t-Statistic и Prob). В верхней части окна результатов проведения теста Дики-Фуллера приводятся критические значения статистики Маккинона для 1%, 5% и 10% уровней значимости (MacKinnon critical values), что позволяет значительно облегчить процедуру принятия решения о порядке интегрируемости процесса. Также в столбцах t-Statistic и Prob.* указываются значение ADF статистики и соответствующая вероятность отклонения альтернативной гипотезы о нестационарности тестируемого ряда. В силу того что тест Дики-Фуллера односторонний, ADF статистика должна быть меньше указанных значений статистик МакКинона на выбранном уровне значимости. На рисунке 25 приведен пример проведения теста Дики-Фуллера на исходных уровнях ряда без учета константы и трендовой составляющей, результатом которого является подтверждение нулевой гипотезы о наличии единичных корней (нестационарности процесса). Так как пакет проводит тест Дики-Фуллера в расширенной модификации, то обязательно следует указывать число лагов, для которых проверяется соответствующая гипотеза (см. лекции): Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста. Так в приведенном примере уже первая лаговая переменная является незначимой, ее е-статистика не превышает критического значения.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

В случае если ряд становится стационарным после перехода к ряду разностей первого или второго порядка, то считают, что порядок интеграции процесса соответственно равен d=1 или d=2.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рис. 25. Результаты оценки расширенного теста Дики-Фулера.

Видео:Занятие 20. Временные рядыСкачать

Занятие 20. Временные ряды

Тесты на стационарность ряда

Расширенный тест Дики — Фуллера является одним из основных методов проверки нестационарности ряда. В основе этого теста лежит предпосылка, что любой ряд можно аппроксимировать с заданной точностью процессом типа AR(p) необходимого порядка:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Сначала введем понятие первой и второй разностей значений ряда у;.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рис. 12.7. Визуализация нестационарных процессов (2):

а — AR(2) с двумя корнями +1; б — AR(2) с двумя корнями -1; в — AR(2) с корнями +1 и -1; г — AR(2) с корнями 0,4 и +1; д — AR(2) с корнями 0,4 и -1; е — у( = 0,1 + 0,2f + yt_x + ?,;

во всех случаях sf

Оригинальный ряд у< называется рядом в уровнях.

Вычтем у< , из обеих частей уравнения (12.1)

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Затем вычтем и прибавим к правой части уравнения apyt_(l)_u:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Эту процедуру необходимо повторить для каждого лага, и в итоге получится следующее выражение:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

где у = а, — 1, Д = — ? а-.

Существует три спецификации расширенного теста Дики — Фуллера.

1. Без константы:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

SO 100 150 200 250 300 350 400 450 S00 550 600 50 100 150 200 250 300 350 400 450 500 550 600

Рис. 12.8. Визуализация необратимых процессов:

а — yt = в, + 8,_б — yt = е( в,_вМЛ(2) с двумя корнями -1; г — МА(2) с двумя корнями +1; во всех случаях s,

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

3. С трендом и константой:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Для каждой спецификации нулевая и альтернативная гипотезы выглядят следующим образом:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Мы предполагаем, что с,

i.i.d.: N(0; а 2 ). Тестовая статистика рассчитывается по формуле, аналогичной с формулой ^-статистики на значимость у

коэффициента у: -, где s.e. — квадратный корень из выборочной дис-

Персии оценки коэффициента (стандартная ошибка), однако распределение этой тестовой статистики отлично от привычного ^-распределения. Более того, этот тест односторонний, а значит, область неотвергания нулевой гипотезы лежит левее критического значения, а область отвергания, соответственно, правее. Можно заметить, что по факту мы тестируем нулевую гипотезу о том, что среди корней есть один X, = 1, а в альтернативную гипотезу попадают все другие варианты значений Xjy которые в том числе могут привести и к нестационарное™ процесса (например, в диапазон у [1] , а в случае отвергания — стационарным вокруг тренда. При использовании этого теста необходимо точно подобрать спецификацию, так как результаты отвергания/неотвергания нулевой гипотезы сильно зависят от формы модели. Иногда начинающие исследователи считают, что если они выберут наиболее общую спецификацию, то тест даст правильные результаты, однако на практике это не совсем так, потому что при изменении формы модели меняется распределение тестовой статистики, что может привести к некорректным выводам, поэтому необходимо дать точную спецификацию модели.

Если в ряде нет ярко выраженной инерции или закономерности, среднее значение ряда примерно равно нулю, то желательно использовать первую спецификацию. Если в ряде присутствуют значимая инерционность и его среднее значение явно не равно нулю, то более корректной является вторая спецификация. Третья спецификация применима, когда в данных присутствует значимый квадратичный тренд. Более того, нет однозначного критерия выбора числа лагов, но существует большое количество эвристических критериев. Например, зачастую используют информационные критерии Акаике (AIC) и Шварца (BIC) для определения наилучшего в каком-то смысле числа лагов. Критерии, соответственно, выглядят следующим образом:

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

где 1п?* — значение логарифма функции правдоподобия оцениваемой модели в точке максимума; k — количество оцениваемых параметров; Т — количество наблюдений.

Как можно заметить, формулы для данных критериев состоят из двух частей. Первое слагаемое обозначает штраф за введение дополнительных параметров. Критерий Акаике вводит меньший штраф за добавление параметров, чем критерий Шварца [2] . Первое слагаемое, домноженное на -1, 21п?*, обозначает качество подгонки модели (чем выше значение, тем качественнее модель).

Исходя из всего вышесказанного можно сделать вывод о том, что чем меньше значение информационного критерия, тем лучше модель. Однозначно корректного метода выбора того или иного информационного критерия для оценивания качества моделей нет. Обычно при исследовании временных рядов лучше пользоваться критерием AIC. Однако применение этих критериев обосновано с теоретической точки зрения лишь для независимых наблюдений, что не выполнено естественным образом для временных рядов, таким образом, применение этих критериев носит эвристический характер. Более того, опираться на результаты этих критериев можно лишь при достаточно большом количестве наблюдений.

Отдельно хочется отметить тот факт, что на практике не всякий ряд может хорошо аппроксимироваться процессом типа AR(p), так как AR(p) это линейный процесс как по параметрам, так и по переменным, а значит, он не может описывать иррегулярные колебания в данных.

Распределение тестовой статистики при верной нулевой гипотезе отличается от привычного распределения Стьюдента (в силу того что в этом случае процесс является нестационарным) и называется распределением Дики — Фуллера. Критические значения данного распределения приведены, например, в приложении 2.

Многие исследователи отмечают достаточно низкую мощность этого теста. На малых выборках 1 .

Если в результате проведенного теста было получено, что процесс имеет единичные корни лагового полинома [3] [4] [5] , то необходимо взять столько разностей зависимой переменной, сколько есть единичных корней. Рассмотрим процесс AR <p)с k единичными корнями в лаговом полиноме (притом что остальные корни по модулю меньше единицы):

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Применив оператор (1 — Ь) к к у< и перейдя, таким образом, к разностям порядка k, получим Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Мы рассматриваем A k yt как новую переменную, поэтому такой процесс является ARI(j) — k, k) :i (последний параметр отвечает за то, сколько разностей мы взяли от наших данных). Этот процесс является стационарным, так как не содержит единичных корней. Таким образом, взяв необходимое количество разностей, мы привели процесс к стационарному виду.

Нестационарность ведет к нестандартным распределениям полученных оценок. Рассчитать математическое ожидание, дисперсию и автоковариацию в общем случае можно не для всех нестационарных рядов (в отличие от стационарных). Однако но большей части эти проблемы возникают, когда размер выборки стремится к бесконечности.

Видео:Что такое Стационарные и нестационарные временные ряды?Скачать

Что такое Стационарные и нестационарные временные ряды?

Как проверить, являются ли данные временного ряда стационарными с Python

Дата публикации 2016-12-30

Временные ряды отличаются от более традиционных задач классификации и прогнозного регрессионного моделирования.

Временная структура добавляет порядок наблюдениям. Этот навязанный порядок означает, что важные допущения в отношении согласованности этих наблюдений должны рассматриваться конкретно.

Например, при моделировании существуют предположения о том, что сводная статистика наблюдений согласована. В терминологии временных рядов мы называем это ожидание временным рядом.

Эти предположения могут быть легко нарушены во временных рядах путем добавления тренда, сезонности и других зависящих от времени структур.

В этом уроке вы узнаете, как проверить, является ли ваш временной ряд стационарным с Python.

После завершения этого урока вы узнаете:

  • Как идентифицировать очевидные стационарные и нестационарные временные ряды, используя линейный график.
  • Как проверить итоговую статистику, такую ​​как среднее значение и дисперсию, для изменения во времени.
  • Как использовать статистические тесты со статистической значимостью, чтобы проверить, является ли временной ряд стационарным.
  • Обновление февраль / 2017: Исправлена ​​опечатка в интерпретации значения p, добавлены маркеры для большей ясности.
  • Обновлено май / 2018: Улучшенный язык вокруг отклонения против неспособности отклонить статистические тесты.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Видео:Временные ряды 6.6 Тест Дики ФулераСкачать

Временные ряды 6.6 Тест Дики Фулера

Стационарный временной ряд

Наблюдения в стационарном временном ряду не зависят от времени.

Временные рядыстационарныйесли они не имеют тенденции или сезонных эффектов. Суммарные статистические данные, рассчитанные по временным рядам, согласованы во времени, например, среднее значение или дисперсия наблюдений.

Когда временной ряд является стационарным, его легче моделировать. Методы статистического моделирования предполагают или требуют, чтобы временные ряды были стационарными, чтобы быть эффективными.

Ниже приведен примерЕжедневные женские рождениянабор данных, который является стационарным.

Выполнение примера создает следующий график.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Видео:Урок 2. Часть 1. Eviews. Анализ временных рядов.Скачать

Урок 2. Часть 1. Eviews. Анализ временных рядов.

Нестационарный временной ряд

Наблюдения из нестационарного временного ряда показывают сезонные эффекты, тренды и другие структуры, которые зависят от временного индекса.

Сводные статистические данные, такие как среднее значение и дисперсия, меняются с течением времени, предоставляя дрейф в концепциях, которые модель может попытаться отразить.

Классические методы анализа и прогнозирования временных рядов направлены на то, чтобы сделать данные нестационарных временных рядов стационарными путем выявления и устранения тенденций и устранения сезонных эффектов.

Ниже приведен примерПассажиры авиакомпаниинабор данных, который является нестационарным, показывая как трендовые, так и сезонные компоненты.

Выполнение примера создает следующий график.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Видео:АвторегрессияСкачать

Авторегрессия

Типы стационарных временных рядов

Понятие стационарности происходит от теоретического изучения временных рядов, и это полезная абстракция при прогнозировании.

Есть несколько более тонких понятий стационарности, с которыми вы можете столкнуться, если углубитесь в эту тему. Они есть:

  • Стационарный процесс: Процесс, который генерирует стационарную серию наблюдений.
  • Стационарная модельМодель, описывающая стационарную серию наблюдений.
  • Тенденция Стационарная: Временной ряд, который не показывает тенденцию.
  • Сезонные стационарные: Временной ряд, который не показывает сезонность.
  • Строго Стационарный: Математическое определение стационарного процесса, в частности, что совместное распределение наблюдений не зависит от временного сдвига.

Видео:14-02 Временной ряд как структура данныхСкачать

14-02 Временной ряд как структура данных

Стационарные временные ряды и прогнозирование

Должны ли вы сделать свой временной ряд стационарным?

Если у вас есть четкая тенденция и сезонность в ваших временных рядах, то смоделируйте эти компоненты, удалите их из наблюдений, а затем обучите модели на невязках.

Если мы подгоняем данные к стационарной модели, мы предполагаем, что наши данные являются реализацией стационарного процесса. Таким образом, наш первый шаг в анализе должен состоять в том, чтобы проверить, есть ли какие-либо признаки тенденции или сезонные эффекты и, если есть, удалить их.

Методы статистических временных рядов и даже современные методы машинного обучения получат выгоду от более четкого сигнала в данных.

Мы обращаемся к методам машинного обучения, когда классические методы терпят неудачу. Когда мы хотим больше или лучше результатов. Мы не можем знать, как лучше моделировать неизвестные нелинейные отношения в данных временных рядов, и некоторые методы могут привести к лучшей производительности при работе с нестационарными наблюдениями или некоторой смесью стационарных и нестационарных представлений о проблеме.

Здесь предлагается использовать свойства временного ряда, которые являются стационарными или нет, как еще один источник информации, который можно использовать при проектировании объектов и выборе функций для задачи временных рядов при использовании методов машинного обучения.

Видео:Временные ряды. Аддитивная и мультипликативная моделиСкачать

Временные ряды. Аддитивная и мультипликативная модели

Чеки на стационарность

Существует много способов проверить, является ли временной ряд (прямые наблюдения, остатки и т. Д.) Стационарным или нестационарным.

  1. Посмотрите на участки: Вы можете просмотреть график временных рядов своих данных и визуально проверить, есть ли какие-либо очевидные тенденции или сезонность.
  2. Сводные статистические данные: Вы можете просмотреть сводную статистику по вашим данным за сезон или случайные разделы и проверить наличие явных или значительных различий.
  3. Статистические тесты: Вы можете использовать статистические тесты, чтобы проверить, оправданы ли ожидания стационарности или были ли они нарушены.

Выше мы уже представили наборы данных «Ежедневные роды» и «Пассажиры авиакомпаний» как стационарные и нестационарные соответственно, причем графики демонстрируют явное отсутствие и наличие компонентов тренда и сезонности.

Далее мы рассмотрим быстрый и грязный способ вычисления и просмотра сводной статистики в нашем наборе данных временных рядов, чтобы проверить, является ли он стационарным.

Видео:Простой метод долгосрочного прогнозирования многомерных временных рядовСкачать

Простой метод долгосрочного прогнозирования многомерных временных рядов

Сводные статистические данные

Быстрая и грязная проверка, чтобы увидеть, не является ли ваш временной ряд нестационарным, заключается в просмотре сводной статистики.

Вы можете разбить свой временной ряд на два (или более) раздела и сравнить среднее значение и дисперсию каждой группы. Если они различаются, а разница статистически значима, временной ряд, вероятно, нестационарный.

Далее, давайте попробуем этот подход в наборе данных Daily Births.

Набор данных ежедневных рождений

Поскольку мы смотрим на среднее значение и дисперсию, мы предполагаем, что данные соответствуют гауссовскому (также называемому кривой колокольчика или нормальному) распределению.

Мы также можем быстро проверить это, взглянув на гистограмму наших наблюдений.

При выполнении примера строится гистограмма значений из временного ряда. Мы ясно видим, что форма гауссовского распределения напоминает кривую колокольчика, возможно, с более длинным правым хвостом.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Далее мы можем разбить временной ряд на две смежные последовательности. Затем мы можем рассчитать среднее значение и дисперсию каждой группы чисел и сравнить значения.

Выполнение этого примера показывает, что среднее значение и значения дисперсии различны, но в одном и том же парке.

Далее, давайте попробуем тот же трюк с набором данных пассажиров авиакомпании.

Набор данных пассажиров авиакомпании

Переходя прямо к погоне, мы можем разделить наш набор данных и вычислить среднее значение и дисперсию для каждой группы.

Запустив пример, мы видим, что среднее значение и дисперсия выглядят очень по-разному.

У нас есть нестационарные временные ряды.

Хорошо, может быть.

Давайте сделаем один шаг назад и проверим, имеет ли смысл в данном случае распределение Гаусса, построив значения временного ряда в виде гистограммы.

Выполнение примера показывает, что распределение значений действительно не похоже на гауссову, поэтому среднее значение и значения дисперсии менее значимы.

Это сжатое распределение наблюдений может быть еще одним индикатором нестационарного временного ряда.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Рассматривая график временных рядов еще раз, мы видим, что существует очевидный компонент сезонности, и, похоже, компонент сезонности растет.

Это может указывать на экспоненциальный рост от сезона к сезону. Логарифмическое преобразование может использоваться для выравнивания экспоненциального изменения обратно к линейному отношению.

Ниже та же самая гистограмма с логарифмическим преобразованием временного ряда.

Запустив пример, мы увидим более знакомое распределение значений, подобное гауссовскому или равномерному.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Мы также создаем линейный график из преобразованных логарифмических данных и видим, что экспоненциальный рост кажется уменьшенным, но у нас все еще есть тренд и сезонные элементы.

Проверить временной ряд на стационарность объяснить как это сделать и выписать уравнение теста

Теперь мы можем рассчитать среднее значение и стандартное отклонение значений преобразованного набора данных.

Выполнение примеров показывает средние значения и значения стандартного отклонения для каждой группы, которые снова похожи, но не идентичны.

Возможно, из одних только этих чисел мы бы сказали, что временные ряды являются стационарными, но мы твердо верим, что это не относится к рассмотрению линейного графика.

Это быстрый и грязный метод, который можно легко обмануть.

Мы можем использовать статистический тест, чтобы проверить, является ли разница между двумя выборками гауссовских случайных величин реальной или статистической случайностью. Мы могли бы исследовать тесты статистической значимости, такие как критерий Стьюдента, но все становится сложнее из-за последовательной корреляции между значениями.

В следующем разделе мы будем использовать статистический тест, предназначенный для явного комментирования того, является ли одномерный временной ряд стационарным.

Видео:Матан за час. Шпаргалка для первокурсника. Высшая математикаСкачать

Матан за час. Шпаргалка для первокурсника. Высшая математика

Дополненный тест Дики-Фуллера

Статистические тесты делают серьезные предположения о ваших данных. Они могут использоваться только для информирования о степени, в которой нулевая гипотеза может быть отклонена или не отклонена. Результат должен быть интерпретирован для данной проблемы, чтобы быть значимым.

Тем не менее, они могут предоставить быструю проверку и подтверждение того, что ваш временной ряд является стационарным или нестационарным.

Интуиция за единичным корневым тестом заключается в том, что он определяет, насколько сильно временной ряд определяется трендом.

Существует целый ряд тестов единичного корня, и Augmented Dickey-Fuller может быть одним из наиболее широко используемых. Он использует авторегрессионную модель и оптимизирует информационный критерий для множества различных значений запаздывания.

Нулевая гипотеза теста состоит в том, что временной ряд может быть представлен единичным корнем, что он не является стационарным (имеет некоторую зависящую от времени структуру). Альтернативная гипотеза (отвергающая нулевую гипотезу) состоит в том, что временной ряд является стационарным.

  • Нулевая гипотеза (H0): Если не удалось отклонить, он предполагает, что временной ряд имеет единичный корень, то есть он нестационарный. Он имеет некоторую временную структуру.
  • Альтернативная гипотеза (H1): Нулевая гипотеза отвергается; он предполагает, что временной ряд не имеет единичного корня, то есть он является стационарным. Он не имеет временной структуры.

Мы интерпретируем этот результат, используя значение p из теста. Значение p ниже порогового значения (например, 5% или 1%) предполагает, что мы отвергаем нулевую гипотезу (стационарную), в противном случае значение p выше порогового значения указывает на то, что мы не можем отклонить нулевую гипотезу (нестационарную).

  • р-значение & gt; 0,05: Не удается отклонить нулевую гипотезу (H0), данные имеют единичный корень и являются нестационарными.
  • р-значение & lt; = 0,05Отклонить нулевую гипотезу (H0), данные не имеют единичного корня и являются стационарными.

Ниже приведен пример расчета расширенного критерия Дики-Фуллера для набора данных Daily Women Births. Библиотека statsmodels предоставляетadfuller ()функция, которая реализует тест.

При выполнении примера выводится тестовое статистическое значение -4. Чем более отрицательна эта статистика, тем больше вероятность того, что мы отвергнем нулевую гипотезу (у нас есть стационарный набор данных).

Как часть выходных данных, мы получаем справочную таблицу, чтобы помочь определить статистику ADF. Мы можем видеть, что наше статистическое значение -4 меньше, чем -3,449 при 1%.

Это говорит о том, что мы можем отклонить нулевую гипотезу с уровнем значимости менее 1% (т. Е. Низкая вероятность того, что в результате получится статистическая случайность).

Отказ от нулевой гипотезы означает, что процесс не имеет единичного корня и, в свою очередь, временной ряд является стационарным или не имеет временной структуры.

Мы можем выполнить тот же тест на наборе данных Пассажира авиакомпании.

Выполнение примера дает другую картину, чем приведенная выше. Статистика теста положительна, что означает, что мы гораздо реже отвергаем нулевую гипотезу (она выглядит нестационарной).

Сравнивая статистику теста с критическими значениями, похоже, что нам не следует отвергать нулевую гипотезу о том, что временной ряд нестационарный и имеет зависящую от времени структуру.

Давайте снова преобразуем набор данных, чтобы сделать распределение значений более линейным и лучше соответствовать ожиданиям этого статистического теста.

Выполнение примера показывает отрицательное значение для статистики теста.

Мы можем видеть, что значение больше, чем критические значения, опять же, это означает, что мы не можем отклонить нулевую гипотезу и, в свою очередь, что временной ряд не является стационарным.

Видео:Приказ комиссара. Warhammer 40kСкачать

Приказ комиссара. Warhammer 40k

Резюме

В этом уроке вы узнали, как проверить, является ли ваш временной ряд стационарным с Python.

В частности, вы узнали:

  • Важность того, чтобы данные временных рядов были постоянными для использования с методами статистического моделирования и даже некоторыми современными методами машинного обучения.
  • Как использовать линейные графики и основную сводную статистику, чтобы проверить, является ли временной ряд стационарным.
  • Как рассчитать и интерпретировать тесты статистической значимости, чтобы проверить, является ли временной ряд стационарным.

У вас есть вопросы о стационарных и нестационарных временных рядах или об этом посте?
Задайте свои вопросы в комментариях ниже, и я сделаю все возможное, чтобы ответить.

Видео:29 Нейронные сети для прогноза и выявления аномалий временных рядовСкачать

29 Нейронные сети для прогноза и выявления аномалий временных рядов

Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Ехсеl и ЕViеws.

Шаг 3. Интерпретация результатов теста.

Теория тестирования стационарности временных рядов изложена ниже. А чтобы просто сделать вывод о стационарности временного ряда на основе расширенного теста Дикки — Фуллера, нужно знать следующее. После того как ранее мы заполнили мини-окно Unit Rооt tеst и щелкнули кнопку ОК, в результате у нас получилась табл. 4.4 с итогами теста. При этом главное внимание нужно обратить на верхнюю строчку теста, выделенную жирным шрифтом: Аugmеntеd Diскеу — Fullеr tеst stаtistiс (статистика расширенного теста Дикки — Фуллера). Поскольку статистика теста Дикки — Фуллера в этом случае равна 11,05764, а ее значимость (Рrоb.) равна 0,0000, то нулевая гипотеза о том, что D(RЕSID) имеет единичный корень, отвергается. Следовательно, мы можем принять альтернативную гипотезу о стационарности полученных остатков.

При этом в табл. 4.4 даются критические значения теста (Теst сritiсаl vаluеs), на основе которых о стационарности остатков можно судить с различным уровнем надежности. Так, в том случае, когда статистика расширенного теста Дикки — Фуллера меньше -2,576127, то вывод о стационарности остатков можно сделать с 99 %-ным уровнем надежности, а если меньше -1,942361, но больше -2,576127, то с 95 %-ным уровнем надежности. Если интересующая нас статистика меньше -1,615684, но больше -1,942361, то уровень надежности вывода о стационарности остатков снижается до 90 %.

В основе теории единичного корня лежит довольно простая формула, которая считается базовой для понимания стационарности в уравнениях авторегрессии:

Где Yt результативная зависимая переменная;

Yt-1 — независимая факторная переменная с лагом в один период (в нашем случае в один месяц);

Уравнение авторегрессии 1-го порядка считается стационарным в том случае, когда коэффициент регрессии 1, то оно считается нестационарным, а следовательно, волатильность с течением времени может нарастать и стремиться к бесконечности. Следует заметить, что при необходимости в формулу (4.4) может быть добавлена константа либо константа и тренд, если, конечно, они будут статистически значимыми.

Проверка авторегрессионного процесса на стационарность проводится следующим образом. Согласно нулевой гипотезе, предполагается, что если = 1, то временной ряд нестационарный, а в случае ее опровержения принимается альтернативная гипотеза, утверждающая, что

📽️ Видео

Моделирование временных рядов 20/21. Семинар 7.Скачать

Моделирование временных рядов 20/21. Семинар 7.

Моделирование временных рядов 20/21. Семинар 1.Скачать

Моделирование временных рядов 20/21. Семинар 1.

Т-критерий Стьюдента за 12 минут. Биостатистика.Скачать

Т-критерий Стьюдента за 12 минут. Биостатистика.

Statistica 10. Спектральный анализ Фурье или о том как узнать период сезонности временного рядаСкачать

Statistica 10. Спектральный анализ Фурье или о том как узнать период сезонности временного ряда

Прикладные задачи анализа данных, лекция 7 – временные ряды 1Скачать

Прикладные задачи анализа данных, лекция 7 – временные ряды 1

Интервальный вариационный ряд в MS Excel. Гистограмма, полигон, функция распределенияСкачать

Интервальный вариационный ряд в MS Excel. Гистограмма, полигон, функция распределения
Поделиться или сохранить к себе: