Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Интервалы прогноза по линейному уравнению регрессии

Прогнозирование по уравнению регрессии представляет собой подстановку в уравнение регрессии соответственного значения х. Такой прогноз ух называется точечным. Он не является точным, поэтому дополняется расчетом его стандартной ошибки, в результате чего получается интервальная оценка прогнозного значения:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Преобразуем уравнение регрессии:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Ошибка т. зависит от ошибки у и ошибки коэффициента ре-

грессии Ь, т.е. Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Из теории выборки известно, что Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Используя в качестве оценки а 2 остаточную дисперсию на одну степень свободы S 2 , получаем:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Ошибка коэффициента регрессии из формулы (1.20):

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Таким образом, при х = хр получаем:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Как видно из формулы (1.31), величина т- достигает минимума при хр = х и возрастает по мере удаления хр от х в любом направлении (рис. 1.3). Для нашего примера эта величина составит:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Рис. 1.3. Доверительные границы прогноза при парной линейной регрессии При Интервальный прогноз для значения x xmax для линейного уравнения регрессииПри хр = 4.

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Для прогнозируемого значения у 95 %-ные доверительные интервалы при заданном хр определены выражением

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

т.е. прил:р = 4 у + 2,57х3,34 или у±8,58. Прихр = 4 прогнозное значение составит у* = —5,79 + 36,84 х 4 = 141,57. Это точечный прогноз.

Прогноз линии регрессии (1.32) лежит в интервале

Видео:Эконометрика. Линейная парная регрессияСкачать

Эконометрика. Линейная парная регрессия

Интервальный прогноз на основе линейного уравнения регрессии

В прогнозных расчетах по уравнению регрессии определяется предсказываемое уг значение как точечный прогноз ух при хр = Xk. т.е. путем подстановки в линейное уравнение регрессии ух = a + b • х соответствующего значения х. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки ух, т.е. т

и соответственно мы получаем интервальную оценку прогнозного значения у*:

Из теории выборки известно, чтош 2 = сг 2 /п. Используя в качестве оценки 2 -=^— (2.24)

Ошибка коэффициента регрессии, как уже было показано, определяется формулой

Считая, что прогнозное значение фактора хр = Хк, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, т.е. т- :

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Соответственно т-, имеет выражение:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении Хк характеризует ошибку положения линии регрессии. Величина стандартной ошибки т- достигает минимума при Хк = х и возрастает по мере того, как «удаляется» от х в любом направлении. Иными словами, чем больше разность между Хк и х, тем больше ошибка т- , с которой предсказывается среднее значение у для заданного значения Хк. Можно ожидать наилучшие результаты прогноза, если признак-фактор х находится в центре области наблюдения х и нельзя ожидать хороших результатов прогноза при удалении Хк от х. Если же значение Хк оказывается за пределами наблюдаемых значений, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько Хк отклоняется от области наблюдаемых значений фактора х.

Для примера 2.1 т- составит:

Соответственно ш- составит эту же величины и при Хк = 2,286. Для прогнозируемого значения ух 95%-ные доверительные интервалы при заданном Хк определяются выражением

т.е. у ±2,57 • 3,32 или у ±8,56, где Л)05-5 = 2,57 — значение J х к 7 J х к ’ ’ ’

критерия Стьюдента при уровне значимости а = 0,05 и числе степеней свободы 7-2 = 5.

При Хк = 4 прогнозное значение составит:

которое представляет собой точечный прогноз.

Прогноз регрессии в интервале составит:

Все вычисления в упорядоченном виде сведем в следующую таблицу:

На графике, приведенном на рис.2.3, доверительные границы для ух представляют собой гиперболы, расположенные по обе стороны от линии регрессии. Рис.2.3 показывает, как изменяются пределы в зависимости от изменения Хк’. две гиперболы по обе стороны от линии регрессии определяют 95%-е доверительные интервалы для среднего значения у при заданном значении х.

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Рис.2.3. Доверительный интервал линии регрессии: а — верхняя доверительная граница тахУ, б — линия регрессии (ух); в — нижняя доверительная граница (ymin)

Однако фактические значения у варьируют около среднего значения ух. Индивидуальные значения у могут отклоняться от ух на величину случайной ошибки Е, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы с^ост-Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку т — , но и случайную ошибку (Тост-

Средняя ошибка прогнозируемого индивидуального значения у составит:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

По данным примера 2.1 получим:

Доверительные интервалы прогноза индивидуальных значений у при Хк = 4 с вероятностью 0,95 составят: 141,58 ± 2,57 • 7,98, или 141,58 ±20,52, это означает, что 121,06 ЗД43 Н =13,21 у 7 10,857 )

Сравним ее с величиной предполагаемого снижения издержек производства, т. е. 38,95.

Поскольку оценивается значимость только уменьшения затрат, то используется односторонний z-критерий Стьюдента. При ошибке в 5% с пятью степенями свободы /табл = 2,015. Следовательно, предполагаемое уменьшение затрат значимо отличается от прогнозируемого по модели при 95%-ном уровне доверия. Однако если увеличить вероятность до 99%, при ошибке в 1% фактическое значение /-критерия оказывается ниже табличного 3,365, и рассматриваемое различие в величине затрат статистически незначимо.

Видео:Эконометрика. Точечный и интервальный прогнозы.Скачать

Эконометрика. Точечный и интервальный прогнозы.

Прогноз по модели парной регрессии

Видео:Точечный прогноз. Интервальный прогноз. Построение уравнения регрессии с помощью анализа данныхСкачать

Точечный прогноз. Интервальный прогноз. Построение уравнения регрессии с помощью анализа данных

Точечный прогноз по уравнению регрессии

Если известно значение независимой переменной х, то прогноз зависимой переменной осуществляется подстановкой этого значения в оценку детерминированной составляющей:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Вследствие несмещенности оценок параметров регрессии этот прогноз также является несмещенным

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Показателем точности прогноза служит его дисперсия (чем она меньше, тем точнее прогноз):

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Из формулы (1.2.3) видно, что чем больше объем выборки, тем точнее прогноз. При фиксированном объеме выборки прогноз тем точнее, чем больше «разнесены» выборочные данные и чем ближе значение независимой переменной к среднему выборочному значению.

Видео:Уравнение линейной регрессии. Интерпретация стандартной табличкиСкачать

Уравнение линейной регрессии. Интерпретация стандартной таблички

Интервальный прогноз по уравнению регрессии

Поскольку согласно (1.2.3) у(х)

N^y(x), а дисперсия а 2

в (1.2.3) заменяется ее несмещенной оценкой по формуле (1.1.15), то за середину доверительного интервала для детерминированной составляющей выбирается точечный прогноз зависимой переменной, а ширина доверительного интервала — пропорциональной стандартному отклонению точечного прогноза:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

где ta двусторонняя критическая граница распределения Стью- дента с (п — 2) степенями свободы.

О Пример 1.1. Зависимость розничного товарооборота от числа занятых

Исследуем зависимость розничного товарооборота (млн руб.) магазинов от среднесписочного числа работников. Товарооборот как результирующий признак обозначим через у, а среднесписочное число работников как независимую переменную (фактор) — через х.

На объем товарооборота влияют также такие факторы, как объем основных фондов, их структура, площадь торговых залов и подсобных помещений, расположение магазинов по отношению к потокам покупателей и т. п. Предположим, что в исследуемой группе магазинов значения этих других факторов примерно одинаковы, поэтому различие их значений на изменении объема товарооборота сказывается незначительно.

В табл. 1.1 в столбцах 2 и 3 приведены значения соответственно среднесписочного числа работников и объема розничного товарооборота, а в следующих столбцах — значения расчетных величин, необходимых для определения оценок коэффициентов регрессии и дисперсии случайной составляющей (Zj=Xj-x, Ayj=yj-y,

Фактические и выравненные значения товарооборота (млн руб.) в зависимости от числа занятых

Найдя по итогам столбцов 2 и 3 средние х = 904/8 = 113, у = 9,6/8 = 1,2, последовательно заполняем столбцы 4—8 и подводим итоги по этим столбцам. Теперь можно определять эмпирические коэффициенты регрессии. По формулам (1.1.6) находим следующие точечные оценки коэффициентов регрессии:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Значение нулевого коэффициента &° представляет собой ординату эмпирической линии регрессии в точке х = х = 113, а коэффициент регрессии dj = 0,01924 — угловой коэффициент этой прямой линии.

На рис. 1.2 изображены система соединенных штриховой линией точек наблюдений и прямая эмпирической регрессии.

Если не учитывать, что мы имеем не теоретическую, а эмпирическую линию регрессии (которая действительно является приближением теоретической линии регрессии), то коэффициент

а, = 0,01924 показывает, что увеличение среднесписочной численности на одного человека приводит к увеличению товарооборота в среднем на 19,24 тыс. руб. Это своего рода эмпирический норматив приростной эффективности использования работников для данной группы магазинов. Если увеличение численности на одного работника приводит к меньшему росту товарооборота, то прием его на работу необоснован.

Теперь можно вычислить выравненные значения (значения ординат эмпирической линии регрессии):

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

и использовать столбцы 9—11 табл. 1.1. Итог столбца 11, в свою очередь, позволяет получить оценку дисперсии случайной составляющей:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Зная дисперсию случайной составляющей, можно проверить статистические гипотезы о параметрах регрессии и уравнении

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Рис. 1.2. Фактические (штриховая ломаная линия) и выравненные (сплошная прямая линия) значения товарооборота

в целом, а также построить интервальные оценки параметров регрессии и прогнозного значения детерминированной составляющей.

Для проверки гипотезы о том, значимо ли отличается от нуля выборочный коэффициент ос,, находим согласно равенству (1.1.18) его эмпирическую значимость

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

которую теперь надо сравнить с теоретическим значением ta(n — 2), найденным по таблице распределения Стьюдента (см. табл. П.5.2).

Выбираем уровень значимости ос равным 5% (т. е. с вероятностью 0,05 мы допускаем, что гипотеза Н0: ос, = 0 будет отвергнута в том случае, когда она на самом деле верна). По табл. П.5.2 находим /005(6) = 2,45. Эмпирическая значимость (14,198) существенно

больше теоретической (2,45), поэтому d1 значимо отличается от нуля, т. е. принимаем гипотезу Н <.ос, *0.

Этот вывод подтверждается и высоким значением коэффициента детерминации:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

который показывает, что в исследуемой ситуации 97,1% общей вариабельности розничного товарооборота объясняется изменением числа работников, в то время как на все остальные факторы приходится лишь 2,9% вариабельности.

Этот статистический вывод не абсолютен. Допустим, что в магазинах исследуемой группы стало больше работников, при этом предельная эффективность работника падает и на первый план выходит влияние других факторов. По-видимому, это прежде всего доля дефицитных товаров в ассортименте, комплекс факторов, характеризующих культуру обслуживания, и расположение магазинов.

Построим интервальные оценки параметров регрессии а 0 , а,

в форме d° ± /а(Ьо, 6с, ± /„6^. Здесь середины интервалов являются точечными оценками коэффициентов регрессии, которые уже рассчитаны: &°=у = 1,2; а, =0,01924. При выборе уровня значимости 5% получаем /0,05(6) = 2,45. Остается только найти стандартные ошибки коэффициентов регрессии. Согласно формулам (1.1.8), (1.1.7)

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

заменяя а на 6, получаем

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Отсюда окончательно получаем, что с вероятностью 0,95 истинные значения параметров лежат в следующих пределах:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Найденные отклонения фактических значений от выравненных (столбец 10) позволяют провести сравнительный анализ работы различных магазинов рассматриваемой группы. Прежде всего необходимо обратить внимание на магазины с отрицательным отклонением (3, 4 и 6-й). Особенно велико отклонение у 4-го магазина. В реальной ситуации необходимо внимательно обследовать эти магазины и установить причины отклонения фактического значения товарооборота от выравненного («нормативного») значения. Это может быть расположение магазина в стороне от основных потоков покупателей, плохое снабжение товарами повышенного спроса, устаревшее оборудование, неудовлетворительный кадровый состав и т. п. При статистическом анализе с учетом сделанных ранее предположений и на основе имеющихся данных приходим к выводу, что в этих магазинах, по-видимому, имеются резервы в организации труда работников. Напротив, в 1, 2, 5, 7 и 8-м магазинах эффективность использования работников выше статистического норматива, но может оказаться, что эти магазины объективно находятся в лучших условиях.

Полученное уравнение регрессии может быть использовано для прогноза. В частности, пусть намечается открытие магазина такого же типа с численностью работников х = 140, тогда достаточно обоснованный объем товарооборота следует установить по уравнению регрессии

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

С точки зрения принятой теоретической схемы полученный прогноз у(х) является лишь точечной оценкой истинной детерминированной составляющей у (х), а сама составляющая лежит внутри доверительного интервала у (x) ± , в котором согласно формуле (1.2.4)

Интервальный прогноз для значения x xmax для линейного уравнения регрессии Интервальный прогноз для значения x xmax для линейного уравнения регрессии

В результате получаем следующий доверительный интервал для теоретического значения прогноза:

Интервальный прогноз для значения x xmax для линейного уравнения регрессии

или Интервальный прогноз для значения x xmax для линейного уравнения регрессии

Видео:Регрессия - как строить и интерпретировать. Примеры линейной и множественной регрессии.Скачать

Регрессия - как строить и интерпретировать. Примеры линейной и множественной регрессии.

Вопросы и задачи

1. Предскажите время реакции полуторамесячного ребенка по следующим данным:

🌟 Видео

Парная регрессия: линейная зависимостьСкачать

Парная регрессия: линейная зависимость

Быстрое прогнозирование в Microsoft ExcelСкачать

Быстрое прогнозирование в Microsoft Excel

Множественная регрессия в ExcelСкачать

Множественная регрессия в Excel

Эконометрика. Построение модели множественной регрессии в Excel. Часть 1.Скачать

Эконометрика. Построение модели множественной регрессии в Excel. Часть 1.

Регрессия в ExcelСкачать

Регрессия в Excel

Линейная регрессияСкачать

Линейная регрессия

Прогнозирование на основе регрессионных моделей на примере рекламной кампанииСкачать

Прогнозирование на основе регрессионных моделей на примере рекламной кампании

Множественная регрессияСкачать

Множественная регрессия

Регрессионный анализ в ExcelСкачать

Регрессионный анализ в Excel

Коэффициент линейной регрессии, 2 способаСкачать

Коэффициент линейной регрессии, 2 способа

Лекция 8. Линейная регрессияСкачать

Лекция 8. Линейная регрессия

Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2Скачать

Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2

Уравнение парной линейной регрессии с помощью Анализа ДанныхСкачать

Уравнение парной линейной регрессии с помощью Анализа Данных

Как применять линейную регрессию?Скачать

Как применять линейную регрессию?

Временные ряды и прогнозированиеСкачать

Временные ряды и прогнозирование
Поделиться или сохранить к себе: