- 9.4. АНАЛИЗ МОДЕЛИ С МУЛЬТИПЛИКАТИВНОЙ КОМПОНЕНТОЙ: А = Т х S x E
- Рис. 9.5. Квартальные объемы продаж компании CD plc
- 9.4.1. Расчет значений сезонной компоненты
- 9.4.2. Десезонализация данных и расчет уравнения тренда
- Рис. 9.6. Фактический и десезонализированный объем продаж по 3-месячной средней
- 9.4.3. Расчет ошибок: А/(Т х S) = Е или А — (Т х S) = Е
- 9.4.4. Прогнозирование по модели с мультипликативной компонентой
- РЕЗЮМЕ
- Как разложить данные временных рядов на тренды и сезонность
- Компоненты временного ряда
- Объединение компонентов временного ряда
- Аддитивная модель
- Мультипликативная модель
- Разложение как инструмент
- Автоматическая декомпозиция временных рядов
- Аддитивное разложение
- Мультипликативное Разложение
- Набор данных пассажиров авиакомпании
- Дальнейшее чтение
- Резюме
- Мультипликативная и аддитивная модели временных рядов. Прогнозирование на их основе.
- 📽️ Видео
Видео:Прогнозирование в Excel с помощью линий трендаСкачать
9.4. АНАЛИЗ МОДЕЛИ С МУЛЬТИПЛИКАТИВНОЙ КОМПОНЕНТОЙ: А = Т х S x E
В некоторых временных рядах значение сезонной компоненты не является константой, а представляет собой определенную долю трендового значения. Таким образом, значения сезонной компоненты увеличиваются с возрастанием значений тренда.
Пример 9.3. Компания CD plc осуществляет реализацию нескольких видов продукции. Объемы продаж одного из продуктов за последние 13 кварталов представлены в таблице 9.6.
Рис. 9.5. Квартальные объемы продаж компании CD plc
Таблица 9.6. Квартальные объемы продаж компании CD plc
Количество проданной продукции, тыс. шт. А
Построим по этим данным точечную диаграмму:
Объем продаж этого продукта так же, как и в предыдущем примере, подвержен сезонным колебаниям, и значения его в зимний период выше, чем в летний. Однако размах вариации фактических значений относительно линии тренда постоянно возрастает. К таким данным следует применять модель с мультипликативной компонентой:
Фактическое значение = Трендовое значение х Сезонная вариация х Ошибка, т. е.
В нашем примере есть все основания предположить существование линейного тренда, но чтобы полностью в этом убедиться, проведем процедуру сглаживания временного ряда.
9.4.1. Расчет значений сезонной компоненты
В сущности эта процедура ничем не отличается от той, которая применялась для аддитивной модели. Так же вычисляются центрированные скользящие средние для трендовых значений, однако оценки сезонной компоненты представляют собой коэффициенты, полученные по формуле А/Т = S х Е. Результаты расчетов приведены в табл. 9.7.
Таблица 9.7. Расчет значений сезонной компоненты для CD plc
Коэффициент
сезонности A/Т = S х E
Январь-март 19X6
Апрель-июньИюль-сентябрь
Октябрь-декабрь
Январь-март 19X7
Апрель-июнь
Июль-сентябрь
Значения сезонных коэффициентов получены на основе квартальных оценок по аналогии с алгоритмом, который применялся для аддитивной модели. Так как значения сезонной компоненты — это доли, а число сезонов равно четырем, необходимо, чтобы их сумма была равна четырем, а не нулю, как в предыдущем случае. (Если бы в исходных данных предполагалось семь сезонов в течение недели по одному дню каждый, то общая сумма значений сезонной компоненты должна была бы равняться семи). Если эта сумма не равна четырем, производится корректировка значений сезонной компоненты точно таким же образом, как это уже делалось ранее. В таблице оценки, рассчитанные в последнем столбце предшествующей табл. 9.8, расположены под соответствующим номером квартала.
Таблица 9.8. Расчет значений сезонной компоненты для CD plc
* Скорректированная оценка сезонной компоненты получена в результате умножения соответствующей доли на (4/3,984).
Как показывают оценки, в результате сезонных воздействий объемы продаж в январе —марте увеличиваются на 11,6% соответствующего значения тренда (1,116). Аналогично сезонные воздействия в октябре-декабре приводят к увеличению объема продаж на 5,5% от соответствующего значения тренда. В двух других кварталах сезонные воздействия состоят в снижении объемов продаж, которое составляет 90,7 и 92,2% от соответствующих трендовых значений.
9.4.2. Десезонализация данных и расчет уравнения тренда
После того как оценки сезонной компоненты определены, можем приступить к процедуре десезонализации данных по формуле A /S = Т х Е. Результаты расчетов этих оценок значений тренда приведены в табл. 9.9.
Таблица 9.9. Расчет уравнения тренда для компании CD plc
Десезонализированный
объем продаж,
тыс. шт. А/Т = S x E
Январь-март 19X7
Апрель-июнь
Июль— сентябрь
Октябрь-декабрь
Полученные трендовые значения наносятся на исходную точечную диаграмму.
Точки, образующие представленный на графике тренд, достаточно сильно разбросаны. Объемы продаж в данном случае не образуют такой строгой последовательности, как в предыдущем примере с компанией Lewplan plc. Скорее всего, пример с CD plc более близок к реальной действительности.
Рис. 9.6. Фактический и десезонализированный объем продаж по 3-месячной средней
Теперь нужно принять решение о том, какой вид будет иметь уравнение тренда. Очевидно, что линия тренда — не кривая, наоборот, она несколько больше напоминает прямую, хотя отдельные точки, особенно значения за 19X6 г, расположены хаотически. Предположим для простоты, что тренд линейный, и для расчета параметров прямой, наилучшим образом его аппроксимирующей, будем применять метод наименьших квадратов. Воспользовавшись той же процедурой, что и в разделе 9.3.2, находим, что
Т = 64,6 + 1,36 х номер квартала (тыс. шт. в квартал) .
Это уравнение будем использовать в дальнейшем для расчета оценок трендовых объемов продаж на каждый момент времени.
9.4.3. Расчет ошибок: А/(Т х S) = Е или А — (Т х S) = Е
Итак, мы нашли значения тренда и сезонной компоненты. Теперь мы можем использовать их для того, чтобы рассчитать ошибки в прогнозируемых по модели объемах продаж Т х S по сравнению с фактическими значениями А. В табл. 9.10 эти ошибки рассчитаны как отношение Е = А/(Т х S).
Для каждого рода ошибки достаточно велики, что видно из графика десезонализированных значений. Однако начиная с первого квартала 19X7 г. величина ошибки составляет в среднем 2-3% от фактического значения, и можно сделать вывод о соответствии построенной модели фактическим данным.
Таблица 9.10. Расчет ошибок для компании CD plc
Январь— март
19X6
Апрель-июнь
Июль-сентябрь
Октябрь— декабрь
9.4.4. Прогнозирование по модели с мультипликативной компонентой
При составлении прогнозов по любой модели предполагается, что можно найти уравнение, удовлетворительно описывающее значения тренда. В обоих изложенных выше примерах эта предпосылка была успешно выполнена. Тренд, который нами рассматривался, был очевидно линейным. Если бы исследуемый тренд представлял собой кривую, мы были бы вынуждены моделировать эту связь с помощью одного из методов формализации нелинейных взаимосвязей, рассмотренных в предыдущей главе. После того как параметры уравнения тренда определены, процедура составления прогнозов становится совершенно очевидной. Прогнозные значения определяются по формуле:
Т = 64,6 + 1,36 х номер квартала (тыс. шт. за квартал),
а сезонные компоненты составляют 1,116 в первом квартале, 1,097 — во втором, 0,922 — в третьем и 1,055 в четвертом квартале. Ближайший следующий квартал — это второй квартал 19X9 г., охватывающий период с апреля по июнь и имеющий во временном ряду порядковый номер 14. Прогноз объема продаж в этом квартале составляет:
F = Т х S = (64,6 + 1,36 х 14) х 0,907 = 83,64 х 0,907 = 75,9 (тыс. шт. за квартал).
С учетом величины ошибки прогноза мы можем сделать вывод, что данная оценка будет отклоняться от фактического значения не более чем на 2-3%. Аналогично, прогноз на октябрь-декабрь 19X9 г., рассчитывается для квартала с порядковым номером 16 с использованием значения сезонной компоненты для IV квартала года:
F = Т х S = (64,6 + 1,36 х 16) х 1,055 = 83,36 х 1,055 = 91,1 (тыс. шт. за квартал) .
Разумно предположить, что величина ошибки данного прогноза будет несколько выше, чем предыдущего, поскольку этот прогноз рассчитан на более длительную перспективу.
Видео:Excel. Линия трендаСкачать
РЕЗЮМЕ
Под временным рядом понимается любое множество данных, относящихся к определенным моментам времени. Это могут быть, скажем, годы, кварталы, месяцы ли недели. В моделях временного ряда ретроспективная тенденция используется для прогнозирования поведения переменной в будущем. Краткосрочные прогнозы являются более точными, чем долгосрочные. Если прогноз составлялся на более длительный период времени при условии, что существующая тенденция сохранится в будущем, то тем больше величина ошибки.
Для моделирования временных рядов используются два типа моделей — аддитивная и мультипликативная. В обоих случаях предполагается, что значение переменной включает в себя ряд компонент. Временной ряд может состоять из собственно тренда — общей тенденции изменения значений переменной; сезонной вариации — краткосрочных периодических колебаний значений переменной; циклической вариации — долгосрочных периодических колебаний значений переменной; ошибки или остатка. В данном учебном пособии не рассматривались массивы данных за длительные промежутки времени, содержащие циклическую вариацию.
Рассмотренные нами модели имеют следующий вид:
Аддитивная А = Т + S + Е,
Мультипликативная А = Т х S х Е.
В обоих видах моделей для десезонализации данных применяется метод скользящего среднего. Затем десезонализированные данные используются при построении модели тренда. По этой модели составляют прогнозы будущих значений тренда. В случае линейной модели для нахождения параметров прямой, наилучшим образом аппроксимирующей фактические значения, используется метод наименьших квадратов. Процесс построения нелинейных моделей гораздо более сложен.
В отличие от линейных регрессионных моделей для оценки обоснованности или точности прогнозных моделей статистические методы, как правило, не используются. Наилучшую среди нескольких моделей выбирает специалист, составляющий прогноз. Чтобы определить, насколько точно рассматриваемая модель аппроксимирует прошлые данные, применяются два показателя:
Видео:Парная регрессия: линейная зависимостьСкачать
Как разложить данные временных рядов на тренды и сезонность
Дата публикации 2017-01-30
Разложение временных рядов включает в себя представление о серии как о комбинации компонентов уровня, тренда, сезонности и шума.
Разложение обеспечивает полезную абстрактную модель для размышления о временных рядах в целом и для лучшего понимания проблем во время анализа и прогнозирования временных рядов.
В этом руководстве вы узнаете, как разложить временные ряды и как автоматически разбивать временные ряды на его компоненты с помощью Python.
После завершения этого урока вы узнаете:
- Метод анализа временных рядов и как он может помочь с прогнозированием.
- Как автоматически разложить данные временных рядов в Python.
- Как разложить аддитивные и мультипликативные задачи временных рядов и построить результаты.
Видео:Эконометрика. Моделирование временных рядов. Построение аддитивной модели.Скачать
Компоненты временного ряда
Полезной абстракцией для выбора методов прогнозирования является разбиение временного ряда на систематические и несистематические компоненты.
- систематическая: Компоненты временного ряда, которые имеют последовательность или повторяемость и могут быть описаны и смоделированы.
- Несистематический: Компоненты временного ряда, которые не могут быть смоделированы напрямую.
Считается, что данный временной ряд состоит из трех систематических компонентов, включая уровень, тренд, сезонность, и одного несистематического компонента, называемого шумом.
Эти компоненты определены следующим образом:
- уровень: Среднее значение в серии.
- тенденция: Увеличение или уменьшение значения в серии.
- Сезонность: Повторяющийся краткосрочный цикл в серии.
- Шум: Случайное изменение в ряду.
Видео:Прогнозирование на основе построения модели линейного тренда в MS ExcelСкачать
Объединение компонентов временного ряда
Считается, что серия представляет собой совокупность или комбинацию этих четырех компонентов.
Все серии имеют уровень и шум. Компоненты тренда и сезонности являются необязательными.
Полезно думать о компонентах как о комбинированных или аддитивных, или мультипликативных.
Аддитивная модель
Аддитивная модель предполагает, что компоненты добавляются вместе следующим образом:
Аддитивная модель является линейной, где изменения во времени последовательно вносятся в одну и ту же величину.
Линейный тренд — это прямая линия.
Линейная сезонность имеет одинаковую частоту (ширина циклов) и амплитуду (высота циклов).
Мультипликативная модель
Мультипликативная модель предполагает, что компоненты умножаются вместе следующим образом:
Мультипликативная модель является нелинейной, такой как квадратичная или экспоненциальная. Изменения увеличиваются или уменьшаются со временем.
Нелинейный тренд — это изогнутая линия.
Нелинейная сезонность имеет возрастающую или уменьшающуюся частоту и / или амплитуду во времени.
Видео:Лабораторная работа Прогнозирование по уравнению трендаСкачать
Разложение как инструмент
Это полезная абстракция.
Декомпозиция в основном используется для анализа временных рядов, а в качестве инструмента анализа она может использоваться для информирования моделей прогнозирования о вашей проблеме.
Он обеспечивает структурированный подход к проблеме прогнозирования временных рядов, как с точки зрения сложности моделирования, так и с точки зрения того, как наилучшим образом охватить каждый из этих компонентов в данной модели.
Каждый из этих компонентов — это то, о чем вам нужно подумать и рассмотреть во время подготовки данных, выбора модели и настройки модели. Вы можете обратиться к нему явно с точки зрения моделирования тренда и вычитания его из ваших данных, или неявно, предоставив достаточно истории для алгоритма, чтобы смоделировать тренд, если он может существовать.
Вы можете или не можете быть в состоянии чисто или идеально разбить ваш конкретный временной ряд как аддитивную или мультипликативную модель.
Проблемы реального мира беспорядочные и шумные. Могут быть аддитивные и мультипликативные компоненты. Может быть тенденция увеличения, сопровождаемая снижением тенденции. Могут быть неповторяющиеся циклы, смешанные с повторяющимися компонентами сезонности.
Тем не менее, эти абстрактные модели предоставляют простую структуру, которую вы можете использовать для анализа ваших данных и изучения способов обдумывания и прогнозирования вашей проблемы.
Видео:БАС ЛР3 Динамика 9 Уравнение трендаСкачать
Автоматическая декомпозиция временных рядов
Библиотека statsmodels обеспечивает реализацию простого или классического метода декомпозиции в функции, называемойseasonal_decompose (), Требуется указать, является ли модель аддитивной или мультипликативной.
Оба будут давать результат, и вы должны быть осторожны, чтобы быть критичным при интерпретации результата. Обзор графика временных рядов и некоторая сводная статистика часто могут быть хорошим началом, чтобы понять, выглядит ли ваша проблема временных рядов аддитивной или мультипликативной.
seasonal_decompose ()Функция возвращает объект результата. Объект результата содержит массивы для доступа к четырем частям данных из декомпозиции.
Например, приведенный ниже фрагмент демонстрирует, как разложить ряд на трендовый, сезонный и остаточный компоненты в предположении аддитивной модели.
Объект результата обеспечивает доступ к тренду и сезонным сериям в виде массивов. Он также обеспечивает доступ к остаткам, которые являются временными рядами после тренда, и сезонные компоненты удаляются. Наконец, оригинальные или наблюдаемые данные также сохраняются.
Эти четыре временных ряда могут быть построены непосредственно из объекта результата, вызвавсюжет()функция. Например:
Давайте посмотрим на некоторые примеры.
Видео:Временные ряды. Аддитивная и мультипликативная моделиСкачать
Аддитивное разложение
Мы можем создать временной ряд, состоящий из линейно возрастающего тренда от 1 до 99 и некоторого случайного шума, и разложить его как аддитивную модель.
Поскольку временные ряды были придуманы и представлены в виде массива чисел, мы должны указать частоту наблюдений (частота = 1аргумент). Если предоставляется объект серии Pandas, этот аргумент не требуется.
Выполнение примера создает серию, выполняет декомпозицию и выводит на график 4 результирующих ряда.
Мы можем видеть, что весь ряд был взят в качестве компонента тренда и что не было сезонности.
Мы также можем видеть, что остаточный участок показывает ноль. Это хороший пример, когда наивное или классическое разложение не смогло отделить шум, который мы добавили, от линейного тренда.
Наивный метод декомпозиции является простым, и существуют более продвинутые декомпозиции, такие как сезонная и трендовая декомпозиция с использованиемЛесс или STL разложение,
Осторожность и здоровый скептицизм необходимы при использовании автоматических методов разложения.
Видео:работа с уравнением линии тренда ExcelСкачать
Мультипликативное Разложение
Мы можем построить квадратичный временной ряд как квадрат временного шага от 1 до 99, а затем разложить его в предположении мультипликативной модели.
Запустив пример, мы видим, что, как и в аддитивном случае, тренд легко выделяется и полностью характеризует временной ряд.
Экспоненциальные изменения могут быть сделаны линейными путем преобразования данных. В этом случае квадратичный тренд можно сделать линейным, взяв квадратный корень. Экспоненциальный рост сезонности можно сделать линейным, взяв натуральный логарифм.
Опять же, важно рассматривать декомпозицию как потенциально полезный инструмент анализа, но рассмотреть возможность изучения множества различных способов ее применения для вашей задачи, таких как данные после их преобразования или остаточные ошибки модели.
Давайте посмотрим на набор данных реального мира.
Видео:Эконометрика. Линейная парная регрессияСкачать
Набор данных пассажиров авиакомпании
Набор данных «Пассажиры авиакомпании» описывает общее количество пассажиров авиакомпании за период времени.
Единицы измерения числа пассажиров авиакомпании в тысячах. Имеется 144 ежемесячных наблюдения с 1949 по 1960 год.
Загрузите набор данных в текущий рабочий каталог с именем файла «авиакомпания-passengers.csv«.
Во-первых, давайте наметим необработанные наблюдения.
Рассматривая линейный график, можно предположить, что может быть линейный тренд, но трудно быть уверенным в том, чтобы смотреть в глаза. Существует также сезонность, но амплитуда (высота) циклов, по-видимому, увеличивается, что говорит о мультипликативности.
Мы примем мультипликативную модель.
В приведенном ниже примере декомпозиция данных о пассажирах авиакомпании рассматривается как мультипликативная модель.
Выполнение примера отображает наблюдаемые, трендовые, сезонные и остаточные временные ряды.
Мы видим, что информация о тенденциях и сезонности, извлеченная из ряда, кажется разумной. Остатки также интересны, показывая периоды высокой изменчивости в ранние и поздние годы ряда.
Видео:МНК линейный тренд в MS ExcelСкачать
Дальнейшее чтение
В этом разделе перечислены некоторые ресурсы для дальнейшего чтения о декомпозиции временных рядов.
Видео:Excel для полных чайников Урок 16 Линия трендаСкачать
Резюме
В этом уроке вы обнаружили декомпозицию временных рядов и способы декомпозиции данных временных рядов с помощью Python.
В частности, вы узнали:
- Структура разложения временных рядов на уровень, тренд, сезонность и шум.
- Как автоматически декомпозировать набор данных временных рядов с помощью Python.
- Как разложить аддитивную или мультипликативную модель и построить график результатов.
У вас есть вопросы о разложении временных рядов или об этом уроке?
Задайте свои вопросы в комментариях ниже, и я сделаю все возможное, чтобы ответить.
Видео:04 Модель Хольта ВинтерсаСкачать
Мультипликативная и аддитивная модели временных рядов. Прогнозирование на их основе.
Читайте также:
|