Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме

Видео:Эконометрика. Оценка значимости уравнения регрессии. Критерий ФишераСкачать

Эконометрика. Оценка значимости уравнения регрессии. Критерий Фишера

Эконометрическая модель — это математическая модель

реальной экономической системы (объекта), построенная на статистических данных

Эконометрика синтезирует в себе науки:

экономическую теорию, математическую статистику и экономическую статистику

Проблемой спецификации не является …

расчет оценок параметров эконометрической модели

1. При построении модели множественной регрессии методом пошагового включения переменных на первом этапе рассматривается…

Модель с одной объясняющей переменной, которая имеет с зависимой переменной наибольший коэффициент корреляции

2. В исходное уравнение регрессии Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной формедобавляются факторы Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме

При этом Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме.

Определите, какие дополнительные факторы необходимо

включить в исходное уравнение.

3. Из двух коллинеарных факторов из модели множественной регрессии исключается тот, для которого абсолютное значение стандартизованного коэффициента …

Меньше

4. Отбор факторов в модель множественной регрессии с использованием метода включения может быть основан на сравнении …

-величины объясненной дисперсии до и после включения =фактора в модель

-величины остаточной дисперсии до и после включения фактора в модель

5. Матрица парных коэффициентов линейной корреляции может служить для решения следующих задач:

-определения тесноты линейной связи между переменными

-выявления мультиколлинеарных факторов

6.

В исходное уравнение регрессии Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной формедобавляются факторы Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме. При этом Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме. Определите, какие дополнительные факторы включать в исходное уравнение не целесообразно. Только Х4 7. В исходное уравнение множественной регрессии Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной формедобавляются факторы Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме. При этом Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной формеи Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме. Определите, какие дополнительные факторы необходимо включить в исходное уравнение. Только Х4 8. Взаимодействие коллинеарных факторов эконометрической модели означает, что теснота связи между ними превышает по абсолютной величине 0,7 -факторы дублируют влияние друг друга на результат 9. При отборе факторов в модель множественной регрессии проводят анализ … -остаточной дисперсии до и после включения факторов в модель -значений матрицы парных коэффициентов корреляции 10 Матрица парных коэффициентов корреляции строится для … отбора факторов в модель множественной регрессии

1)Для оценки заработной платы некоторого работника используется следующая модель Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, где Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— заработная плата Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме-го работника; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— общий стаж его работы; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— переменная, принимающая значение 1, если работник с высшим образованием и 0 в противном случае; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— количество детей у работника; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— переменная, принимающая значение 1, если работник мужчина и 0, если женщина. Сколько факторов необходимо представить в модели фиктивными переменными?

Ответ: 2

2)Фиктивная переменная может принимать значения:

Ответ: 0, 1

3)В модели необходимо учесть влияние возраста на производительность труда работника. На предприятии работают пенсионеры и лица, не достигшие пенсионного возраста (всего 2 категории). Тогда максимальное количество фиктивных переменных, необходимых для проведения анализа и построения оценок равно…

Ответ: 1

4)В страховой компании решили оценить влияние знака зодиака (всего 12), под которым рожден работник, на производительность его труда. Тогда максимальное количество фиктивных переменных, необходимых для проведения анализа и построения оценок равно…

Ответ: 11

5)Укажите уравнения регрессии, в которых фиктивная переменная D используется только в аддитивной форме:

Ответ: Y=b0+b1X2+b2D, Y=b0+b1X+b2D

6)Для оценки заработной платы некоторого работника используется следующая модель Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме, где Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— заработная плата Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме-го работника; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— общий стаж его работы; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— переменная, принимающая значение 1, если работник с высшим образованием и 0 в противном случае; Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— переменная, принимающая значение 1, если у работника есть дети и 0, если нет, Уравнения регрессии в которых фиктивная переменная d используется только в аддитивной форме— переменная, принимающая значение 1, если работник мужчина и 0, если женщина. Сколько факторов необходимо представить в модели фиктивными переменными?

Ответ: 3

7)В модели необходимо учесть влияние уровня образования на заработную плату работника. На предприятии работают люди со средним специальным, высшим и незаконченным высшим образованием (всего 3 категории). Тогда максимальное количество фиктивных переменных, необходимых для проведения анализа и построения оценок равно…

Ответ: 2

8)Проводится эконометрическое моделирование зависимости объема продаж компании от ряда факторов: х1 – цены на товар, х2 – степени известности торговой марки фирмы, х3 – дохода потребителя, х4 – уровня интенсивности рекламной деятельности (высокий уровень – массированная реклама; средний уровень – регулярно повторяющаяся; низкий уровень – время от времени повторяющаяся). Фиктивными переменными в модели не являются …

Ответ: х1, х3

9)Исследуется зависимость потребления кофе от ряда факторов: х1 – марки кофе, х2 – уровня крепости кофе (крепкий, средней крепости, слабой крепости), х3 – дохода потребителя, х4 – цены на кофе. Фиктивными переменными в модели не являются …

Ответ: х3, х4

10)Фиктивными переменными в уравнении множественной регрессии могут быть …

Ответ: качественные переменные, преобразованные в количественные; переменные, исходные значения которых не имеют количественного значения

Последнее изменение этой страницы: 2016-08-11; просмотров: 2256

Видео:Множественная регрессияСкачать

Множественная регрессия

Учебные материалы для студентов

Видео:Эконометрика Линейная регрессия и корреляцияСкачать

Эконометрика  Линейная регрессия и корреляция

Методические указания, конспекты, лекции, контрольные, лабораторные работы, курсовые.

Видео:Множественная регрессия в ExcelСкачать

Множественная регрессия в Excel

Тест по эконометрике

Тест №1

Первая главная компонента

A. Содержит максимальную долю изменчивости всей матрицы факторов.
B. Отражает степень влияния первого фактора на результат.

C. Отражает степень влияния результата на первый фактор.

D. Отражает долю изменчивости результата, обусловленную первым фактором.

E. Отражает тесноту связи между результатом и первым фактором.

Если расчетное значение F-критерия Фишера превышает табличное, то можно сделать вывод о.

статистической незначимости построеной модели

значимости(существенности) моделируемой зависимости

статистической значимости построенной модели

невозможности использования построенной модели для описания исследуемой зависимости

При применении метода наименьших квадратов к оценке параметров уравнений регрессии, величина зависимой переменной у не может определяться на основании ____________ уравнения регрессии

Выберите по крайней мере один ответ: дифференциального

линеаризованного

нелинейного

Фиктивной переменными в уравнении множественной регрессии могут быть.

a. количественные переменные

b. экономические показатели, выраженные в стоимостном измерении

c. качественные переменные, преобразованные в количественные

d. переменные, исходные значения которых не имеют количественного значения


Косвенный метод наименьших квадратов применим для .

a. идентифицируемой системы одновременных уравнений

b. неидентифицируемой системы рекурсивных уравнений

c. неидентифицируемой системы уравнений

d. любой системы одновременных уравнений

Индекс корреляции рассчитанный для нелинейного уравнения регрессии характеризует .

тесноту нелинейной связи между зависимой и независимой переменными

на сколько процентов изменится значение зависимой переменной при изменении на один процент независимой переменной

статистическую значимость (существенность) связи построенного уравнения

значение арифметического корня, взятого по значению индекса детерминации для этого нелинейного уравнения

Двухшаговый метод наименьших квадратов применим для .

Выберите один ответ.

сверхидентифицируемой системы одновременных уравнений

идентифицируемой системы одновременных уравнений

любой системы одновременных уравнений

неидентифицируемой системы уравнений

В роли расстояния между объектами может выступать

Выберите по крайней мере один ответ: обычное евклидово расстояние

квадрат евклидового расстояния

косинус угла между объектами-векторами

максимум модуля разности между координатами

Структурная форма системы эконометрических уравнений это.

Выберите один ответ.

a. система регрессионных уравнений, в каждом из которых содержатся все объясняемые переменные из других уравнений

b. система регрессионных уравнений, матрица коэффициентов которых симметрична

c. система уравнений регрессии, имеющих треугольную структуру

d. исходные уравнения регрессии, каждое из которых в качестве объясняющей переменной может содержать объясняемую переменную из других уравнений

Число главных компонент

Выберите один ответ.

A. Больше числа исходных факторов, но меньше длины базисного ряда данных.

B. Меньше числа исходных факторов.

C. Равно числу исходных факторов.

D. Равно длине базисного ряда данных.

E. Больше длины базисного ряда данных.

Значение коэффициента детерминации, рассчитанное для линейного уравнения парной регрессии составило . Следовательно, значение линейного коэффициента парной корреляции может быть равно

Выберите по крайней мере один ответ: -0.9; если b 0

Целью дискриминантного анализа является

Выберите один ответ. количество верно классифицированных объектов близко к 50%

количество верно классифицированных объектов близко к 100%

все группы имеют одинаковую размерность

При применении метода наименьших квадратов к линейному уравнению регрессии минимизируется сумма квадратов.

Выберите по крайней мере один ответ:

отклонений фактических (наблюдаемых) y от их модельных значений , рассчитанных по уравнению величин

Временным рядом называют.

Выберите один ответ.

a. Временно созданный набор данных

b. Упорядоченные во времени значения показателя

c. Ряд данных, полученный расчетным путем за короткое время

d. Набор данных для исследования

Главные компоненты представляют собой

Выберите один ответ. A. Статистически значимые факторы.

B. Экономически значимые факторы.

C. Линейные комбинации факторов.

D. Центрированные факторы.

E. Пронормированные факторы.

Значение коэффициента детерминации рассчитывается как отношение дисперсии результативного признака, объясненной регрессией, к __________ дисперсии результативного признака

Выберите один ответ.

Укажите уравнения регрессии, в которых фиктивная переменная используется только в мультипликативной форме.

При построении дендрограммы сначала объединяются

Выберите один ответ. объекты, совпадающие по всем признакам

наиболее близкие объекты относительно выбранного расстояния

наиболее далекие объекты

Автокорреляцией уровней временного ряда называют.

Выберите один ответ.

a. корреляционную зависимость между трендовой и сезонной компонентами временного ряда

b. корреляционную зависимость между наблюдаемыми и расчетными значениями исследуемого временного показателя

c. корреляционную зависимость между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на один или несколько периодов времени

d. автокорреляцию остатков временного ряда

С помощью частного F-критерия можно проверить значимость j-го коэффициента чистой регрессии в предложении, что j-й фактор в уравнение множественной регрессии.

Выберите один ответ. a. не был включен

b. был включен последним

c. был включен первым

d. был включен условно

Если оценки параметров уравнения регрессии, полученных при помощи метода наименьших квадратов обладают свойствами несмещенности, эффективности и состоятельности, то .

Выберите по крайней мере один ответ:

a. математическое ожидание остатков равно нулю и они характеризуются минимальной дисперсией

b. происходит накапливание значений остатков при большом числе выборочных оцениваний

c. возможен переход от точечного оценивания к интервальному

d. наблюдается уменьшение точности оценивания параметров с увеличением объема выборки

Компонентами временного ряда являются:

Выберите по крайней мере один ответ:

циклическая (сезонная) компонента

Качество подбора нелинейного уравнения регрессии можно охарактеризовать на основе показателей.

Выберите по крайней мере один ответ:

средней ошибки аппроксимации

коэффициента линейной корреляции

При работе по методу К-средних

Выберите по крайней мере один ответ:

элементы не могут переходить из одного кластера в другой

элементы могут переходить из одного кластера в другой

процесс заканчивается при стабилизации кластеров

процесс заканчивается за одну итерацию

В правой части структурной формы взаимозависимой системы могут стоять

Выберите один ответ.

A. Только экзогенные лаговые переменные.

B. Только экзогенные переменные (как лаговые, так и нелаговые).

C. Только эндогенные лаговые переменные.

D. Только эндогенные переменные (как лаговые, так и нелаговые).

E. Любые экзогенные и эндогенные переменные.

Одним из современных препятствий эффективного применения множественного регрессионного анализа является

Выберите один ответ.

a. малая диcперсия

b. мультиколлинеарность независимых переменных

c. низкая квалификация исследователя

d. малое количество факторов

Гипотеза об мультипликативной структурной схеме взаимодействия факторов, формирующих уровни временного ряда, означает правомерность следующего представления .

Выберите один ответ.

a. уровень тренда равен уровень временного ряда * конъюнктурная компонента * сезонный фактор * случайная компонента

b. уровень временного ряда равен (тренд + конъюнктурная компонента)*сезонный фактор + случайная компонента

c. случайная компонента равна тренд * конъюнктурная компонента * сезонный фактор * уровень временного ряда

d. уровень временного ряда равен тренд * конъюнктурная компонента * сезонный фактор * случайная компонента

Если оценки параметров уравнения регрессии обладают свойствами состоятельности, эффективности и несмещенности, то .

Выберите по крайней мере один ответ:

при большом числе выборочных оцениваний остатки не будут накапливаться

возможен переход от точечного оценивания к интервальному

точность модели снижается с увеличением объема выборки

предпосылки метода наименьших квадратов не выполняются

На практике для анализа коррелированности отклонений используют статистику.

Выберите один ответ.

Перечислить основные методы кластерного анализа

Выберите по крайней мере один ответ:

Параметр является статистически значимым (существенным), если

Выберите один ответ.

a. он положителен

b. вероятность того, что он равен нулю мала

c. известна формула для его расчета

d. вероятность того, что он не равен нулю мала

Целью кластерного анализа является

Выберите один ответ.

A. образование групп схожих между собой объектов

B. разбиение на группы по некоторым признакам

C. различение объектов наблюдения по некоторым признакам

D. извлечение наиболее важных факторов из групп данных

Показателями качества нелинейного уравнения парной регрессии является.

Выберите по крайней мере один ответ:

коэффициент нелинейной регрессии

множественный коэффициент корреляции

Тест №2

Целью дискриминантного анализа является
все группы имеют одинаковую размерность
количество верно классифицированных объектов близко к 100%
количество верно классифицированных объектов близко к 50%

Установите соответствие между наименованиями уравнений множественной регрессии:
построение уравнения на основе выровненных центрированных данных
построение уравнения регрессии на основе исходных данных для двух независимых переменных и расчетом средних значений для других независимых переменных
построение уравнения непосредственно на основе исходных данных
построение уравнения регрессии на основе исходных данных для одной независимой переменной и расчетом средних значений для других независимых переменных

Структурной формой модели называется система .
a. независимых уравнений
b. уравнений с фиксированным набором факторов
c. взаимосвязанных уравнений
d. рекурсивных уравнений

Число главных компонент
A. Больше числа исходных факторов, но меньше длины базисного ряда данных.
B. Меньше числа исходных факторов.
C. Равно числу исходных факторов.
D. Равно длине базисного ряда данных.
E. Больше длины базисного ряда данных.

Трендовая составляющая временного ряда характеризует.
a. периодические изменения уровней ряда
b. основную тенденцию уровней ряда
c. качество построенной модели временного ряда
d. структуру временного ряда

Если расчетное значение F-критерия Фишера меньше табличного, то можно сделать вывод о.
статистической незначимости построенной модели
статистической значимости построения модели
незначимости(несущественности) моделируемой зависимости
целесообразности использования построенной модели для описания исследуемой зависимости

Главные компоненты представляют собой
A. Статистически значимые факторы.
B. Экономически значимые факторы.
C. Линейные комбинации факторов.
D. Центрированные факторы.
E. Пронормированные факторы.

Целью кластерного анализа является
A. образование групп схожих между собой объектов
B. разбиение на группы по некоторым признакам
C. различение объектов наблюдения по некоторым признакам
D. извлечение наиболее важных факторов из групп данных

Факторы множественной линейной регрессионной зависимости не коррелируют между собой, тогда матрица парных коэффициентов корреляции является.
a. симметричной
b. нулевой
c. единичной
d. треугольной

Если значение коэффициента корреляции, рассчитанное для линейного уравнения регрессии равно единице, то .
связь между параметрами и функциональная
связь между переменными и функциональная
величина оказывает существенное влияние на переменную
величина не оказывает влияния на переменную

С помощью традиционного метода наименьших квадратов можно определить параметры уравнений, входящих в систему _____ уравнений.
a. независимых или рекурсивных
b. одновременных или независимых
c. рекурсивных или одновременных
d. одновременных

Все нижеприведенные нелинейные модели можно свести к модели множественной линейной регрессии . Установите соответствие между видом нелинейной модели и соотношениями между исходными параметрами a, b, c и параметрами линеаризованой модели

В роли расстояния между объектами может выступать
обычное евклидово расстояние
квадрат евклидового расстояния
косинус угла между объектами-векторами
максимум модуля разности между координатами

Аддитивно мультипликативная модель содержит компоненты в виде .
a. отношений
b. слагаемых
c. комбинации слагаемых и сомножителей
d. сомножителей

Перечислить основные методы кластерного анализа
К-средних
дивизимный
агломеративный
главных компонент

Выберите значение коэффицента корреляции, которое характеризует функциональность связи между переменными y и x.

Установите соответствие между видом модели и ее характеристиками.

На практике гетероскедастичность имеет место, когда.
a. вероятностные распределения случайных отклонений при различных наблюдениях будут одинаковы
b. вероятностные распределения случайных отклонений при различных наблюдениях будут различны
c. дисперсия случайных отклонений одинаковы для разных наблюдений
d. дисперсия случайных отклонений является постоянной величиной

Укажите группы факторов, формирующих уровень временного ряда:

временные факторы
случайные факторы
факторы, формирующие тенденцию ряда
факторы, формирующие циклические колебания ряда

Производственная функция Кобба-Дугласа относится к классу ___ моделей.
полулогарифмических
степенных
линейных
обратных

Какое условие не выполняется, если коэффициент регрессии является незначимым(несущественным)?
a. несущественность влияние соотвествующей независимой переменной на зависимую переменную
b. его значение признается равным нулю
c. его значение признается отличным от нуля
d. соответствующая независимая переменная не включается в модель

При построении дендрограммы сначала объединяются
наиболее далекие объекты
объекты, совпадающие по всем признакам
пропорциональные объекты
наиболее близкие объекты относительно выбранного расстояния
Вопрос 26

Первая главная компонента
A. Содержит максимальную долю изменчивости всей матрицы факторов.
B. Отражает степень влияния первого фактора на результат.
C. Отражает степень влияния результата на первый фактор.
D. Отражает долю изменчивости результата, обусловленную первым фактором.
E. Отражает тесноту связи между результатом и первым фактором.

Эконометрическая модель, являющаяся системой одновременных уравнений, состоит в общем случае .
a. из поведенческих уравнений и автокорреляционной функции
b. из поведенческих уравнений и тождеств
c. только из тождеств
d. из регрессионных уравнений и соотношений мультиколлинеарности в каждом из них

Если оценки параметров уравнения регрессии обладают свойствами состоятельности, эффективности и несмещенности, то .
предпосылки метода наименьших квадратов не выполняются
возможен переход от точечного оценивания к интервальному
точность модели снижается с увеличением объема выборки
при большом числе выборочных оцениваний остатки не будут накапливаться

При величине лага, равной нулю, автокорреляционная функция .
a. не существует
b. равна -1
c. равна 0
d. равна 1

Укажите последовательность этапов обобщенного метода наименьших квадратов.
изменяется спецификация модели (путём преобразования уравнения с учётом коэффициента пропорциональности дисперсий остатков)
устанавливается наличие гетероскедаcтичности или автокорреляции остатков
оцениваются параметры новой модели
оценивается общее качество преобразованной модели

Нарушение предпосылок метода наименьших квадратов ведет к нарушению свойств _________ оценок параметров уравнения регрессии.
a. несостоятельности
b. оперативности
c. эффективности
d. несмещенности

При работе по методу К-средних
элементы не могут переходить из одного кластера в другой
элементы могут переходить из одного кластера в другой
процесс заканчивается при стабилизации кластеров
процесс заканчивается за одну итерацию

Косвенный метод наименьших квадратов применим для .
a. неидентифицируемой системы рекурсивных уравнений
b. идентифицируемой системы одновременных уравнений
c. неидентифицируемой системы уравнений
d. любой системы одновременных уравнений

также в рубрике Контрольные, тесты:

Видео:Математика #1 | Корреляция и регрессияСкачать

Математика #1 | Корреляция и регрессия

Фиктивные переменные в линейных регрессионных моделях

До сих пор рассматривались регрессионные модели, в которых в качестве объясняющих переменных (регрессоров) выступали количественные переменные (толщина угольного пласта, уровень механизации и т.д.), которые принимали значение из некоторого непрерывного интервала. Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (градаций). Например, пол (мужской, женский), фактор сезонности (зима, весна, лето, осень) и т.д.

Фиктивные переменные. Качественные признаки могут существенно влиять на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят о регрессионных моделях с переменной структурой.

Например, надо изучить зависимость размера заработной платы Y не только от количественных факторов Хь Х2. Хк, но и от качественного признака (например, от пола работника). В принципе можно получить оценки регрессионной модели

Ь = ?о + Pi-хи + ••• ?№ + ?» (4.3.1)

для каждого уровня качественного признака (т.е. одно уравнение регрессии для мужчин, второе — для женщин), а затем изучать различия между ними.

Но есть и другой подход, позволяющий оценивать влияние количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии благодаря введению так называемых фиктивных (или структурных) переменных. В качестве фиктивных переменных обычно используются бинарные (булевы) переменные, которые принимают всего два значения: «О» или «1» (например, значение переменной Zi = 0 для работников-женщин и Zj = 1 — для мужчин). В этом случае первоначальная модель (4.3.1) изменится и примет вид:

У/ = ?о + РЛ1 + • • • рл + OCiZil + ?f, (4.3.2)

f 1, если z-й работник мужчина;

[ О, если 1-и работник женщина.

Таким образом, работая с моделью (4.3.2), видно, что заработная плата у мужчин на (Xi • 1 = ОС] выше, чем у женщин. Проверяя гипотезу Но: ОС] = 0, можно установить влияние фактора «пол» на размер заработной платы.

Пример 4.3.1. Необходимо построить линейную регрессионную модель для исследования зависимости между результатами письменных вступительных экзаменов (объясняющая переменная X — число решенных задач), полом студента (качественный признак «пол» — мужчина, женщина) и успешно сданными курсовыми работами на первом курсе (зависимая переменная Y — число курсовых работ). Исходные данные представлены в табл. 4.3.

Решение. Первоначально рассмотрим регрессионную модель, не учитывающую признака «пол», т.е.

Методами парной регрессии вычислим оценки Ьо = -1.437, = 0.815 и эмпирическое уравнение регрессии примет вид:

Коэффициент детерминации Ry х =0.530, и уравнение значимо по F-критерию на уровне 0.05:

F = 9.46 > Fo.95; 1; 10 = 4.96.

Введем фиктивную переменную Z со значениями:

0, если студент женского пола

и рассмотрим регрессионную модель вида

Очевидно, что из этой модели можно получить (при разных значениях фиктивной переменной Z) следующие частные функции регрессии f(x) = М (У I %):

Эти два соотношения в рамках одной регрессионной модели объясняют название таких моделей — регрессионные модели с переменной структурой.

Для вычисления коэффициентов соответствующего уравнения регрессии

сформируем матрицу X (размером 12×3) и вектор коэффициен-

тов (размерности 3):

1 1 1 1 1 1 1 1 1 1 1 1 Т Ьо

1 01001011010 а

Решая систему нормальных уравнений

(x T x)b = X T y, получаем b = 1—1.165, 0.743, 0.46б| г , а уравнение регрессии (4.3.6) примет вид

у = -1.165 + 0.743.x + 0.466z. (4.3.7)

Полученное уравнение регрессии значимо по F-критерию на уровне 0.05:

Коэффициент детерминации R

xz = 0.549 несколько выше, чем Ry х =0.530 у парной регрессии.

Таким образом, из уравнения (4.3.7) следует, что при том же числе решенных задач на вступительных экзаменах (переменная X) юноши сдают успешно на 0.466

0.5 курсовых работ больше. Это различие видно из рис. 4.1, на котором построены графики регрессии (4.3.7) при Z = 0 и Z = 1.

Для того чтобы убедиться в справедливости сделанного вывода проверим по r-критерию значимость коэффициента а:

Та= 1.15 2 [0, во всех остальных случаях.

Тогда вышеперечисленным случаям соответствуют следующие значения фиктивных переменных: l)Zi=0, Z2 = 0; 2) Zi = 1, Z2 = 0; 3) Zi = 0, Z2 = 1; 4) Zi = 1, Z2 = 1. Использование двух фиктивных переменных упрощает интерпретацию построенной модели. Так коэффициент ал при Z] представляет разность веса новорожденного, если мать одинока (ожидаем отрицательный знак у коэффициента), а коэффициент а2 при Z2 будет определять дополнительный вес новорожденного, если ребенок не является первенцем (ожидаем положительный знак у коэффициента).

Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются моделями дисперсионного анализа (AN О VA-моделями).

Например, пусть Y — начальная заработная плата.

ГО, если претендент не имееет высшего образования;

[1, если претендент имеет высшее образование.

Тогда зависимость можно выразить моделью парной регрессии:

Из этой модели можно получить следующие частные функции регрессии:

При этом коэффициент 0О определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент а указывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования у претендента. Проверяя статистическую значимость коэффициента а с помощью r-статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.

В литературе коэффициент а называется дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равном единице, от свободного члена модели при нулевом (базовом) значении фиктивной переменной.

Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются моделями ковариационного анализа (ANCOVA-моделями).

Пример 4.3.3 (ANCOVA-модель). В табл. 4.4 приведены данные, характеризующие зависимость между весом новорожденного Y (в граммах), X — количеством сигарет, выкуриваемых в день будущей матерью во время беременности и фиктивной переменной определяемой как:

f0, если ребенок первенец;

[1, если ребенок не первенец.

Данная модель содержит одну количественную и одну качественную переменную. Поэтому регрессионная модель имеет вид:

а соответствующее эмпирическое уравнение регрессии:

Для вычисления эмпирических коэффициентов bQ,bx,a обратимся к режиму Регрессия (см. пример 3.5.1) и получим следующие значения: Ьо = 3443.64,^ =-11.93,а = 103.39 . Тогда

у(%) = 3443.64-11.93%+ 103.39г. (4.3.12)

Проверим статистическую значимость эмпирического коэффициента а. Для этого вычислим значение критерия

(см. п. 3.4): Та= — = 1.23. По формуле (3.3.6) вычисляем s a

/(0.95,20-3) = 2.110. Неравенство |Та| >/(0.95,20-3) не выполняется и поэтому делаем вывод, что коэффициент а при фиктивной переменной Z незначим с уровнем значимости 0.05 и поэтому эмпирическое уравнение (4.3.12) принимает вид:

Наверное, незначимость коэффициента а обусловлена небольшим объемом выборки. Если объем выборки был бы достаточно большим, то возможно коэффициент а стал бы значим.

Рассмотрим пример регрессии (ANCOVA-модель) с одной количественной и двумя качественными переменными. Пусть Y — заработная плата сотрудников фирмы, X- стаж работы, Zj -наличие высшего образования, Z2 — пол сотрудника:

СО, если сотрудник — женщина;

1 [1, если сотрудник — мужчина;

1, в противоположном случае.

Таким образом, получим следующую модель:

Из этой модели получаются следующие функции регрессии:

1. Средняя зарплата женщины без высшего образования:

  • 2. Средняя зарплата женщины с высшим образованием: M(y|Z,=0,Z, =1) = (р02) + р,Х.
  • 3. Средняя зарплата мужчины без высшего образования:

4. Средняя зарплата мужчины с высшим образованием:

Очевидно, что все регрессии отличаются только свободными членами. Дальнейшее определение статистической значимости коэффициентов ocj и ос2 позволяет убедиться, влияют ли образование и пол сотрудника на его заработную плату.

В примерах, рассматриваемых до сих пор, предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена уравнения регрессии. Но это не всегда так. Изменение качественного фактора может привести также к изменению наклона прямой регрессии.

Обычно это характерно для временных рядов экономических данных при изменении институциональных условий, введении новых правовых или налоговых ограничений. Например, можно предположить, что до некоторого года (или до некоторого месяца) в стране налог на ввозимые автомобили был одним, а затем он существенно изменился. В этом случае зависимость может быть выражена так (нижний индекс означает некоторый временный аргумент — день, месяц или год):

[О. до изменения институциональных условий; г Д е z , = ?, + п2 = и) и построить для каждой из выборок свое (частное) уравнение регрессии. Обозначим через 5] и S-, суммы квадратов отклонений значений уг каждой из подвыборок от соответствующих частных уравнений регрессий. Затем рассчитывается F-статистика, которая для теста Чоу имеет вид:

где т — число количественных объясняющих переменных в уравнении регрессии (одинаково для всех трех уравнений регрессии).

Далее для заданного уровня значимости а и числа степеней свободы г, = т +1, v2 = п — 2т — 2 вычисляется критическое значение

💡 Видео

Парная регрессия: линейная зависимостьСкачать

Парная регрессия: линейная зависимость

Эконометрика. Построение модели множественной регрессии в Excel. Часть 1.Скачать

Эконометрика. Построение модели множественной регрессии в Excel. Часть 1.

Эконометрика. Линейная парная регрессияСкачать

Эконометрика. Линейная парная регрессия

Интерпретация коэффициента при логарифмировании в уравнениях регрессииСкачать

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Практика Многофакторная регрессияСкачать

Практика Многофакторная регрессия

МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.Скачать

МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.

Лекция 2.1: Линейная регрессия.Скачать

Лекция 2.1: Линейная регрессия.

Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.Скачать

Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.

Эконометрика. Нелинейная регрессия. Полулогарифмические функции.Скачать

Эконометрика. Нелинейная регрессия. Полулогарифмические функции.

Корреляционно-регрессионный анализ многомерных данных в ExcelСкачать

Корреляционно-регрессионный анализ многомерных данных в Excel

Тема по SPSS: множественная линейная регрессия - одновременное включение всех переменных в модель.Скачать

Тема по SPSS: множественная линейная регрессия - одновременное включение всех переменных в модель.

Множественная степенная регрессияСкачать

Множественная степенная регрессия

Эконометрика. Нелинейная регрессия. Степенная функция.Скачать

Эконометрика. Нелинейная регрессия. Степенная функция.

Линейная регрессия. Что спросят на собеседовании? ч.1Скачать

Линейная регрессия. Что спросят на собеседовании? ч.1

Уравнение линейной регрессии. Интерпретация стандартной табличкиСкачать

Уравнение линейной регрессии. Интерпретация стандартной таблички
Поделиться или сохранить к себе: