Фиктивная переменная это переменная не отражаемая в уравнении регрессии

Фиктивные переменные во множественной регрессии

До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Для того чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные необходимо преобразовать в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В отечественной литературе можно встретить термин «структурные переменные».

Качественные признаки могут приводить к неоднородности исследуемой совокупности, что может быть учтено при моделировании двумя путями:

  • — регрессия строится для каждой качественно отличной группы единиц совокупности, т.е. для каждой группы в отдельности, чтобы преодолеть неоднородность единиц общей совокупности;
  • — общая регрессионная модель строится для совокупности в целом, учитывающей неоднородность данных. В этом случае в регрессионную модель вводятся фиктивные переменные, т.е. строится регрессионная модель с переменной структурой, отражающей неоднородность данных.

Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе у от цены х. В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

у = а + Ь • х+ ?. (3.42)

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: yi = а + Ь • xi + ?и женского пола: уг = «2 + Z?2 • *2 + ?•

Различия в потреблении кофе проявятся в различии средних yi и у2. Вместе с тем сила влияния х на у может быть одинаковой, т.е. b

/ъ- В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединив уравнения yi и у2 и введя фиктивные переменные, придем к следующему выражению:

у = а + b ‘ zi + Ъ2 • Z2 + Ь • х + ?, (3.43)

где zi и Z2 — фиктивные переменные, фиктивные переменные, принимающие значения:

  • 1 — мужской пол ф О — женский пол
  • 1 — женский пол

В общем уравнении регрессии (3.43) зависимая переменная у рассматривается как функция не только цены х, но и пола (zi, Z2). Переменная z рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом когда zi = 1, то Z2 = 0 и, наоборот, при zi = 0 Z2 = 1 •

Для лиц мужского пола, когда z = 1 и Z2 = 0, объединенное уравнение регрессии составит у = а + b • х, а для лиц женского пола, когда zi = 0 и Z2 = 1 — У = «2 + b х. Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии а Ф а2. Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.

Следует иметь в виду, что при введении фиктивных переменных zi и Z2 в модель у = а + Ь • zi + b2 • Z2 + b • х+ г применение МНК для оценивания параметров а и а,2 приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т.е. уравнение (3.43) примет вид

у = а + Ь • zi + Z?2 • Zi + Ъ • х + А. (3.45)

Предполагая при параметре А независимую переменную, равную 1, имеем матрицу исходных данных:

Xy-Z = a-Xz + b-Xx-z + c-Xz 2

Ввиду того, что z принимает лишь два значения (1 и 0), Ez = п (число полей с зяблевой вспашкой), Ех • z = E*i (количество внесенных удобрений на полях с зяблевой вспашкой), Ez 2 = Ez = щ, z = Eyi (сумма у по полям зяблевой вспашки).

В рассматриваемом примере вся совокупность из 25 единиц разделена на две подгруппы: с зяблевой вспашкой — 13 полей и с весенней — 12 полей, т.е. п = 13 и П2 = 12. Соответственно делению на эти две группы имеем:

Хх = Exi + Ех2 = 99 + 93 = 192;

Еу = Eyi + Еу2 = 199,4 + 149,7 = 349,1.

Тогда система нормальных уравнений примет вид:

25• а+ 192 Z?+ 13-с = 349,1

2 ух = 0,517 2 = 0,267) до 57,2% (R 2 yx = 0,756 2 = 0,572). При этом сила влияния количества внесенных органических удобрений на урожайность осталась практически неизменной: коэффициенты регрессии по существу, одинаковы (0,326 в парном уравнении и 0,331 в множественном). Корреляция между видом вспашки и количеством внесенного удобрения на 1 га практически отсутствует: rxz = -0,016.

Применение зяблевой вспашки способствует росту урожайности в среднем на 2,9 ц/га при одном и том же количестве внесенного удобрения на 1 га, что в целом соответствует и различию средней урожайности по видам вспашки (15,3 ц/га для зяблевой вспашки и 12,5 ц/га для весенней). Частный F-критерий для фактора z составил 16,58, что выше табличного значения при числе степеней свободы 1 и 22 (4,30 при а= 0,05 и 7,94 при а = 0,01). Это подтверждает целесообразность включения фиктивной переменной в уравнение регрессии.

Уравнение парной регрессии по отдельным видам вспашки показывают практически единую меру влияния количества внесенных уравнений на урожайность:

у = 12,119 + 0,423 • х, R = 0,677 — при зяблевой вспашке;

у = 10,828 + 0,211 • x,R = 0,574 — при весенней вспашке.

Поэтому можно предположить единую меру влияния данного фактора, равную значению коэффициента регрессии, в уравнении регрессии с фиктивной переменной (0,331). Включив фиктивную переменную, удалось измерить ее влияние на изменение урожайности: частный коэффициент корреляции ryz.x, оценивающий в чистом виде влияние данного фактора, составил 0,6555, что несколько выше, чем аналогичный показатель для фактора х, т.е. ryx.z = 0,6385.

Частные уравнение регрессии по отдельным видам вспашки составили:

y(z=i) = 12,816 + 0,331 • х- для зяблевой вспашки;

У(2=о) = 9,908 + 0,331 • х, — для весенней вспашки.

Как видим, функция урожайности для первой группы (г = 1) параллельна функции для второй группы, но сдвинута вверх.

В примере 3.6 качественный фактор имел только два состояния, которым соответствовали обозначения 1 и 0. Если же число градаций качественного признака-фактора превышает два, то в модель вводится несколько фиктивных переменных, число которых должно быть меньше числа качественных градаций. Только при соблюдении этого положения матрица исходных фиктивных переменных не будет линейно зависима и возможна оценка параметров модели.

Пример 3.7. Проанализируем зависимость цены двухкомнатной квартиры от ее полезной площади. При этом в модель могут быть введены фиктивные переменные, отражающие тип дома: «хрущевка», панельный, кирпичный.

При использовании трех категорий домов вводятся две фиктивные переменные: zi и Z2- Пусть переменная z принимает значение 1 для панельных домов и значение 0 для всех остальных типов домов; переменная Z2 принимает значение 1 для кирпичных домов и 0 для остальных; тогда переменные z и Z2 принимают значение 0 для домов типа «хрущевка».

Предположим, что уравнение регрессии с фиктивными переменными составило:

у = 320 + 500 • х + 2200 • z + 1600 • Z2-

Частные уравнения регрессии для отдельных типов домов, свидетельствуя о наиболее высоких ценах квартир в панельных домах, будут иметь следующий вид:

  • — «хрущевки» у = 320 + 500 • х;
  • — панельные у = 2520 + 500 • х;
  • — кирпичные у = 1920 + 500 • х.

Параметры при фиктивных переменных zi и Z2 представляют собой разность между средним уровнем результативного признака для соответствующей группы и базовой группы. В рассматриваемом примере за базу сравнения цены взяты дома «хрущевки», для которых z = Z2 = 0. Параметр при zi = 2200 означает, что при одной и той же полезной площади квартиры цена ее в панельных домах в среднем на 2200 долл. США выше, чем в «хрущевках». Соответственно параметр при Z2 показывает, что в кирпичных домах цена выше в среднем на 1600 долл, при неизменной величине полезной площади по сравнению с указанным типом домов.

Рассмотренная трактовка параметров регрессии при фиктивных переменных справедлива, если сила влияния на у фактора х действительно не меняется в разных структурных частях совокупности. Иными словами, отсутствует взаимодействие факторов Xj и фиктивных переменных z, т.е. для каждого значения z влияние фактора х на у одинаково (рис.3.2).

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

  • —-при z = О
  • ——при Z = 1

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

  • —-приz = О
  • —-при Z = 1

Рис.3.2. Графическая иллюстрация взаимодействия факторов: а — без взаимодействия; б — с взаимодействием

При отсутствии взаимодействия целесообразно построение модели:

При наличии взаимодействия факторов х и z модель с фиктивной переменной принимает вид:

у = а + bx + cz + d(xz),

что соответствует графическому изображению (рис.3.26).

Предположим, рассматриваются две группы наблюдений, для каждой из которых имеет место функциональная зависимость у от фактора х:

yi = 20 + 5 х; ТуХ = 1 ;yi = 35;

Поскольку налицо четкое взаимодействие факторов, попытка построить общую регрессионную модель вида у = а + Ьх + cz приведет к ухудшению результатов аппроксимации модели у = 58+1 ? х-26 • z;2? 2 = 0,842.

Верной в ней будет лишь трактовка коэффициента регрессии при фиктивной переменной z. Поскольку в модели z = 1 для I группы наблюдений, когда yi = 35, a z = 0 для II группы наблюдений, когда уц = 61, то параметр при z, равный — 26, означает, что yi — уц = — 26.

Модель с учетом взаимодействия факторов составит:

у = 70-3 • х-50 • z +8 • (zx); Я 2 = 1,

т.е. функциональная зависимость, заложенная в информацию для каждой группы, продолжает действовать. При z = 0 мы получим уравнение связи для второй группы, т.е. уп = 70 — 3 х. Параметр с при z показывает различие в параметрах а для двух сравниваемых групп: с = щ — «ц = — 50. Параметр d при совмещенной переменной (zx) фиксирует различие в силе связи у и х в группах:

Фиктивные переменные широко используются для оценки сезонных различий в потреблении.

Фиктивные переменные могут вводиться не только в линейные, но и в нелинейные модели, приводимые путем преобразований к линейному виду. Так, модель с фиктивными переменными может иметь вид:

1пу = я + Ъ • %i + . Р • Хр + с • z + ?, (3.51)

где z — фиктивная переменная.

Целесообразность такого вида модели диктуется характером связи между экономическими переменными:

Фиктивная переменная вводится в эту модель как очередной сомножитель:

Логарифмируя данное выражение, получим модель вида

In у — In а + Ху • In b 4- Х2 • In Z?2 + . + хр In bp + z • In c + In ?, которая равносильна приведенной ранее, где параметры и случайная составляющая представлены в логарифмах.

Включение в модель фиктивных переменных может иметь цель отразить в модели неоднородность совокупности. Однако нельзя рассматривать фиктивные переменные как панацею при применении методов регрессии к неоднородным данным.

Пример 3.8. Рассмотрим зависимость уровня квалификации рабочих от сферы применения ручного труда. Если неоднородность вызвана резкими качественными различиями единиц совокупности, обусловливающими искажения характера рассматриваемой связи признаков х и у, то фиктивные переменные мало изменят результаты анализа. В этом случае более результативным является построение уравнений регрессии по отдельным группам совокупности (табл.3.4).

Таблица 3.4. Зависимость среднего уровня квалификации рабочих у от сферы применения ручного труда х

Видео:Решение биквадратных уравнений. 8 класс.Скачать

Решение биквадратных уравнений. 8 класс.

Фиктивные переменные

Видео:Нелинейные уравнения с двумя переменными и их геометрический смысл. 9 класс.Скачать

Нелинейные уравнения с двумя переменными и их геометрический смысл. 9 класс.

Особенности включения в модели регрессии неколичественных показателей

В предыдущих главах при рассмотрении уравнений парной и множественной регрессии мы предполагали, что все изучаемые переменные являются количественными, т.е. принимают числовые значения. В общем случае это предположение может не выполняться. Значение зависимой переменной у часто складывается под влиянием факторов, описываемых как количественными, так и неколичественными показателями. Например, на величину надоя с одной фуражной коровы (количественный показатель) оказывает влияние качество кормов – высшее, 1 сорт, 2 сорт (неколичественный показатель). Для отражения влияния неколичественного показателя на результативный признак используют так называемые фиктивные переменные (dummy variables).

Фиктивные переменные – это переменные бинарного типа, имеющие всего два значения – единица и ноль:

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

Если неколичественный показатель принимает всего два альтернативных значения, то необходимо ввести одну фиктивную переменную. Например, выдвинута гипотеза о разном уровне производительности труда для разных форм собственности – государственной и негосударственной. Тогда каждой форме собственности будет соответствовать одно значение фиктивной переменной. Например:

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

Возможно и другое закрепление значений фиктивной переменной за категориями неколичественного показателя «форма собственности»:

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

В общем случае необходимо ввести на единицу меньше фиктивных переменных, чем категорий неколичественного показателя. В частности, для приведенного выше примера с качеством кормов (три возможные категории) необходимо ввести две фиктивные переменные.

Фиктивная переменная равна единице, если неколичественный показатель принял закрепленное за этой переменной значение. Значение неколичественного показателя, не закрепленное ни за одной фиктивной переменной, называют базой сравнения значений зависимой переменной при разных состояниях неколичественного фактора. Ей соответствует равенство всех фиктивных переменных нулю:

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

где k – количество значений неколичественного показателя.

В качестве базового значения неколичественного показателя целесообразно выбирать такое, которое, как предполагается, обеспечивает минимальные или максимальные значения зависимой переменной. Для примера с качеством кормов

базовой категорией можно выбрать «2 сорт» как фактор, дающий минимальные надои коров:

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

Если в модели регрессии необходимо учесть несколько неколичественных показателей, то для каждого из них вводится свой набор фиктивных переменных. В этом случае фиктивные переменные нумеруются двойным индексом ji: Zjj, где; – номер неколичественного показателя, і – номер значения (категории) ;-го неколичественного показателя.

Видео:Дамми (фиктивные) переменные. Разные зависимости для подвыборокСкачать

Дамми (фиктивные) переменные. Разные зависимости для подвыборок

Спецификация моделей регрессии с фиктивными независимыми переменными

В общем случае модель с фиктивными переменными имеет вид

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

где у – зависимая переменная; Фиктивная переменная это переменная не отражаемая в уравнении регрессии– количественные независимые переменные; zu, z12 – фиктивные переменные, соответствующие категориям первого неколичественного показателя; z2J, z22 – фиктивные переменные, соответствующие категориям второго неколичественного показателя; z;1, z)2 – фиктивные переменные, соответствующие категориям ;-го неколичественного показателя; ε – случайный остаток.

Включение фиктивных переменных в модель расширяет круг вопросов, подлежащих решению на этапе спецификации модели.

Учет влияния неколичественного показателя, принимающего три и более значений, означает необходимость ввода в уравнение регрессии двух и более фиктивных переменных, что приводит к значительному увеличению количества параметров и должно быть подкреплено соответствующим объемом наблюдений (не менее семи на один параметр, не считая свободного члена).

При включении в уравнение регрессии фиктивных переменных возникает также вопрос о характере влияния количественных независимых переменных на результативную переменную при различных значениях неколичественного показателя. Ниже будут рассмотрены различные варианты моделей регрессии с фиктивными переменными.

Видео:Математика без Ху!ни. Частные производные функции нескольких переменных. Градиент.Скачать

Математика без Ху!ни. Частные производные функции нескольких переменных. Градиент.

Фиктивные переменные в эконометрике

Вы будете перенаправлены на Автор24

Видео:Как решать уравнения с модулем или Математический торт с кремом (часть 1) | МатематикаСкачать

Как решать уравнения с модулем или Математический торт с кремом (часть 1) | Математика

Понятие фиктивных переменных

Фиктивные переменные используются в противоположность переменным, имеющим значение и отражающим уровень количественного показателя, который принимает значения непрерывного интервала.

Фиктивная переменная представляет собой индикаторную переменную, которая отражает качественную характеристику. Например, такими переменными могут быть атрибутивные признаки:

  • Пол человека,
  • Образование и профессия,
  • Принадлежность к региону,
  • Климатические условия и др.

Видео:Дискретная математика. ДНФСкачать

Дискретная математика. ДНФ

Ввод фиктивных переменных в модель

Для ввода фиктивных переменных в регрессионную модель им присваиваются цифровые метки, которые представляют собой качественные переменные, преобразованные в количественное состояние.

Такие сконструированные переменные в эконометрике и принято называть фиктивными (структурными, искусственными).

В опросах групп людей цифра 0 присваивается мужчинам, а цифра 1 женщинам. В данном случае фиктивной переменной будет являться регрессор, который состоит из одних единиц (константа или свободный член), в том числе временной тренд.

С помощью фиктивных переменных можно выстраивать и проводить оценку кусочно-линейных моделей, применяемых в процессе исследования структурных изменений.

Видео:Решение системы неравенств с двумя переменными. 9 класс.Скачать

Решение системы неравенств с двумя переменными. 9 класс.

Фиктивные переменные моделей с временными рядами

Регрессионные модели с временными рядами используют 3 типа фиктивных переменных:

  • Переменные индикаторы, которые определяют принадлежность наблюдения к соответствующему периоду;
  • Переменные сезонного характера;
  • Линейный временной тренд.

Переменные-индикаторы принадлежности наблюдения к определенному периоду применяются в процессе моделирования структурных скачкообразных сдвигов. Моменты “скачков” устанавливаются в этом случае из априорных соображений.

Готовые работы на аналогичную тему

При принадлежности наблюдения к периоду 1941 — 1945 годам и 0 в противном случае, что является примером применения моделирования временного структурного сдвига. При этом постоянный структурный сдвиг смоделирован переменной 0 (до определенного момента времени) и 1 (для совокупности наблюдений после этого момента времени).

Сезонные переменные применяются при моделировании сезонности, они принимают различные значения в соответствии с тем, к какому месяцу или кварталу года (дню недели) относится наблюдение.

Линейный временной тренд используется в процессе моделирования постепенных (плавных) структурных сдвигов. Данная переменная отражает промежуток времени, который проходит от определенного (нулевого) момента времени до того времени, к которому отнесли это наблюдение (то есть координаты наблюдения по временной шкале). В случае, когда промежутки времени между последовательными наблюдениями будут равны, то временной тренд составляется из номеров наблюдений. Указанные виды фиктивных переменных можно комбинировать, создавая при этом переменные “взаимодействия” определенных эффектов.

При комбинации рассмотренных фиктивных переменных можно моделировать еще один эффект, называемый изменение наклона тренда с какого-либо момента. В этом случае, кроме тренда, в регрессию вводят следующую переменную: на начало выборки и до определенного момента она будет равна 0, а вторая ее часть будет выглядеть в виде временного тренда (1, 2, 3).

Видео:Парная регрессия: линейная зависимостьСкачать

Парная регрессия: линейная зависимость

Преимущества использования фиктивных переменных

Использование фиктивных переменных обладает следующими преимуществами:

  1. Не обязательно одинаковые интервалы между наблюдениями, а также наличие пропущенных интервалов между наблюдениями;
  2. Легкая интерпретация коэффициентов при фиктивных переменных, легко и наглядно представляющих структуру динамического процесса;
  3. В процессе оценки модели не обязательно выходить за рамки классического метода наименьших квадратов.

Получи деньги за свои студенческие работы

Курсовые, рефераты или другие работы

Автор этой статьи Дата последнего обновления статьи: 13.10.2021

Фиктивная переменная это переменная не отражаемая в уравнении регрессии

Эксперт по предмету «Эконометрика» , преподавательский стаж — 8 лет

🎬 Видео

Математический анализ, 20 урок, Метод замены переменнойСкачать

Математический анализ, 20 урок, Метод замены переменной

Алгебра логики: Логические переменные и логические функции. Центр онлайн-обучения «Фоксфорд»Скачать

Алгебра логики: Логические переменные и логические функции. Центр онлайн-обучения «Фоксфорд»

Математика без Ху!ни. Функции нескольких переменных. Область определения. Линии уровня.Скачать

Математика без Ху!ни. Функции нескольких переменных. Область определения. Линии уровня.

Линейная регрессионная модель IMDb 4 Включение фиктивных переменныхСкачать

Линейная регрессионная модель IMDb 4 Включение фиктивных переменных

Линейные уравнения с одной переменной, содержащие переменную под знаком модуля. 6 класс.Скачать

Линейные уравнения с одной переменной, содержащие переменную под знаком модуля. 6 класс.

Способы решения систем нелинейных уравнений. Практическая часть. 9 класс.Скачать

Способы решения систем нелинейных уравнений. Практическая часть. 9 класс.

Математика без Ху!ни. Интегралы, часть 3. Замена переменной.Скачать

Математика без Ху!ни. Интегралы, часть 3. Замена переменной.

Задача на Тепловой обмен. физика 8 классСкачать

Задача на Тепловой обмен. физика 8 класс

Урок по теме РЕШЕНИЕ НЕРАВЕНСТВ С ОДНОЙ ПЕРЕМЕННОЙСкачать

Урок по теме РЕШЕНИЕ НЕРАВЕНСТВ С ОДНОЙ ПЕРЕМЕННОЙ

Решение системы линейных неравенств с одной переменной. 6 класс.Скачать

Решение системы линейных неравенств с одной переменной. 6 класс.

Решение тригонометрических уравнений. Подготовка к ЕГЭ | Математика TutorOnlineСкачать

Решение тригонометрических уравнений. Подготовка к ЕГЭ | Математика TutorOnline

Уравнения с модулем. Часть 2 | Математика | TutorOnlineСкачать

Уравнения с модулем. Часть 2  | Математика | TutorOnline
Поделиться или сохранить к себе: