Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Видео:Множественная регрессия в ExcelСкачать

Множественная регрессия в Excel

Определение коэффициентов уравнения регрессии методом Брандона.

По этому методу уравнение регрессии записывается в виде:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

где Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов— любая функция величины xj.

Порядок расположения факторов x1, x2, … xk в выражении не безразличен для точности обработки результатов наблюдений: чем больше влияние на у оказывает параметр xj , тем меньше должен быть порядковый номер индекса j. Вид функции выбирается с помощью графических построений. Вид функции выбирается с помощью графических построений. Вначале по точкам выборки системы величин y, x1, x2, … xk строятся поле корреляции и эмпирическая линия регрессии y-x1 . Таким образом определяется тип зависимости

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

и методом наименьших квадратов рассчитываются коэффициенты этого уравнения регрессии. Затем составляется выборка новой величины

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Эта величина не зависит уже от х1 , а определяется только параметрами x2, x3, … xk. Поэтому можно записать

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

По точкам новой выборки величин y1 и х2 вновь строятся корреляционное поле и эмпирическая линя регрессии, характеризующая зависимость y1 от х2 :

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Рассчитываются ее коэффициенты и вновь составляется выборка новой величины

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Эта величина не зависит уже от двух факторов x1 и x2 и может быть определена из следующего уравнения регрессии:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Такая процедура определения функций продолжается до получения выборки величины:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Эта величина не зависит от всех факторов x1, x2, … xk и определяется коэффициентом исходного уравнения:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

где N – объем выборки.

Методы планирования экспериментов.

Методы планирования экспериментов позволяют свести к минимуму число необходимых опытов и одновременно выявить оптимальное значение искомой функции.

Оптимальный двухуровневый план 2 к .

При планировании экспериментов условия опытов представляют собой фиксированное число значений уровней для каждого фактора. Если эксперименты проводятся только на двух уровнях, при двух значениях факторов, и при этом в процессе эксперимента осуществляются все возможные комбинации из k факторов, то постановка опытов по такому плану носит название полного факторного эксперимента (ПФЭ) или плана 2 k .

Уровни факторов представляют собой в этом случае границы исследуемой области по данному технологическому параметру. Пусть, например, изучается влияние на выход продукта у трех факторов: температуры Т в диапазоне 100—200 ºС, давления Р в диапазоне 2—6 МПа == (20—60 кгс/см 2 ) и времени пребывания t = 10— 30 мин. Верхний уровень по температуре z1 max = 200 °С, нижний; z1 min = 100 °С, z1 0 = 150 °С, Δz1 = 50 °С:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Вообще для любого фактора zj имеем:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Точка с координатами (z1 0 , z2 0 , … ,zk 0 ) носит название центра плана, иногда ее называют основным уровнем; , Δzj — единица варьирования, или интервал варьирования по оси zj. От системы координат z1, z2 z3, . zk перейдем к новой безразмерной системе координат x1, x2, …. , xk. Формула перехода (кодирования)

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

В безразмерной системе координат верхний уровень равен +1 нижний равен — 1, координаты центра плана равны нулю и совпадают с началом координат. В нашей задаче k = 3. Число возможных комбинаций N из трех факторов на двух уровнях равно N = 2 k == 2 3 = 8. Запишем план проведения экспериментов (матрицу планирования) в виде таблицы.

Значение факторов в натуральном масштабеЗначение факторов в безразмерной системе координатВыход
№ опытаz1 0z2 0z3 0х1х2х3y
-1-1-1
+1-1-1
-1+1-1
+1+1-1
-1-1+1
+1-1+1
-1+1+1
+1+1+1

Значения выхода у, полученные в результате реализации плана экспериментов, приведены в последнем столбце таблицы.

Представленный в табл. кодированный план геометрически может быть интерпретирован в виде куба, восемь вершин которого, представляют собой восемь экспериментальных точек.

Запишем кодированную матрицу планирования 2 3 и результаты эксперимента, введя столбец так называемой фиктивной переменной x0=1.

Приведенная в таблице матрица планирования обладает следующими свойствами:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

где k — число независимых факторов; N — число опытов в матрице планирования.

Первое свойство — равенство нулю скалярных произведений всех вектор — столбцов — называется свойством ортогональности матрицы планирования. Благодаря этому свойству резко уменьшаются трудности, связанные с расчетом коэффициентов уравнения регрессии, так как матрица коэффициентов нормальных уравнений (Х*Х) становится диагональной и ее диагональные элементы равны числу опытов в матрице планирования N. Диагональные элементы обратной матрицы (Х*Х) -1 :

№ опытах0х1х2х3y
+1-1-1-1y1
+1+1-1-1y2
+1-1+1-1y3
+1+1+1-1y4
+1-1-1+1y5
+1+1-1+1y6
+1-1+1+1y7
+1+1+1+1y8

Следовательно, любой коэффициент уравнения регрессии bjопределяется скалярным произведением столбца у на соответствующий столбец xj, деленным на число опытов в матрице планирования N:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Пользуясь планом, представленным в таблице, сначала вычислим коэффициенты регрессии линейного уравнения

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Если в рассмотрение ввести более полное уравнение регрессии с коэффициентами взаимодействия:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

то для определения коэффициентов b12, b13, b23 (эффектов двойного взаимодействия) и b123 (эффекта тройного взаимодействия) необходимо расширить матрицу таблицы следующим образом:

№ опытах0х1х2х3х1 х2х1 х3х2 х3х1 х2 х3y
+1-1-1-1+1+1+1-1
+1+1-1-1-1-1+1+1
+1-1+1-1+1+1+1+1
+1+1+1-1+1-1-1-1
+1-1-1+1+1-1-1+1
+1+1-1+1-1+1+1-1
+1-1+1+1-1-1+1-1
+1+1+1+1+1+1+1+1

Если поставить дополнительно параллельные опыты, можно определить S 2 воспр , проверить значимость коэффициентов регрессии и при наличии степеней свободы — адекватность уравнения.

В связи с тем, что корреляционная матрица (Х*Х) -1 для спланированного эксперимента таблица есть матрица диагональная

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

коэффициенты уравнения регрессии некоррелированы между собой. Значимость коэффициентов уравнения регрессии можно проверять для каждого коэффициента в отдельности по критерию Стьюдента. Исключение из уравнения регрессии незначимого коэффициента не скажется на значениях остальных коэффициентов. При этом выборочные коэффициенты bj оказываются так называемыми несмешанными оценками для соответствующих генеральных коэффициентов βj.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

т. е. величины коэффициентов уравнения регрессии характеризуют вклад каждого фактора в величину у.

Диагональные элементы корреляционной матрицы равны между собой, поэтому все коэффициенты уравнений определяются с одинаковой точностью:

Видео:Выбор факторов, влияющих на результативный показательСкачать

Выбор факторов, влияющих на результативный показатель

Модель множественной регрессии

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Модель множественной регрессии

1 Понятие множественной регрессии

Множественная регрессия представляет собой уравнение связи с несколькими независимыми переменными:

где у – зависимая переменная (результативный признак); х1,х2,…,хр – независимые переменные (факторы).

Множественная регрессия применяется в ситуациях, когда из множества факторов, влияющих на результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать влияние нескольких факторов.

Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Постановка задачи множественной регрессии. По имеющимся данным n наблюдений за совместным изменением p+1 переменной y и xj и (табл.1) необходимо определить аналитическую зависимость y = f (x1,x2. xp), наилучшим образом описывающую данные наблюдений.

Критерий качества выбранной зависимости:

S=Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовУравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов2 –>min

Как и в случае парной регрессии, построение уравнения множественной регрессии осуществляется в два этапа:

– оценка параметров выбранной модели.

Спецификация модели включает в себя решение двух задач:

– отбор p факторов xj, наиболее влияющих на величину y;

– выбор вида уравнения регрессии y = f (x1,x2. xp);.

2 Отбор факторов при построении множественной регрессии

Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. Факторы не должны быть взаимно коррелированы и, тем более, находиться в точной функциональной связи. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются не интерпретируемыми.

2. Включаемые во множественную регрессию факторы должны существенно влиять на вариацию независимой переменной. Т. е. включаемые в модель факторы должны быть статистически значимыми и существенно улучшать показатель качества модели (например, коэффициент детерминации R2).

Отбор факторов производится на основе качественного теоретико-экономического анализа и обычно осуществляется в две стадии:

– на первой стадии факторы подбираются исходя из сущности проблемы;

– на второй стадии применяются формальные статистические критерии, например, значения t-статистики для соответствующих коэффициентов регрессии.

Наличие высокой корреляции выявляется по значению линейного коэффициента корреляции rxixj. Если выполняется условие

то факторные переменные xi, xj находятся в линейной зависимости между собой, а сами переменные xi, xj называются явно коллинеарными.

Значения линейных коэффициентов корреляции rxixj для всевозможных комбинаций переменные xi, xj составляют корреляционную матрицу .

Для трех факторов матрица принимает вид:

=Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовУравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

В уравнение регрессии включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

Для преодоления сильной межфакторной корреляции используется ряд подходов:

– исключение из модели одного или нескольких факторов;

– преобразование факторов, при котором уменьшается корреляция между ними;

– переход к совмещенным уравнениям регрессии, т. е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие, например y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+?, где члены b12x1x2,b13x1x3 выражают взаимодействие факторов.

После исключения коллинеарных факторов осуществляется процедура отбора факторов, наиболее влияющих на изменение результативного признака (факторов, включаемых в регрессию). Наиболее широкое применение получили:

    метод исключения; метод включения.

3 Парная коллинеарность и мультиколлинеарность

Две переменные считаются явно коллинеарными, т. е. находятся между собой в линейной зависимости, если коэффициент интеркорреляции (корреляции между двумя объясняющими переменными) ? 0,7.

Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из уравнения.

Предпочтение в эконометрике отдается не фактору, более сильно связанному с результатом, а фактору, который при сильной связи с результатом имеет наименьшую тесноту связи с другими факторами т. е. коэффициент корреляции между факторами меньше 0,3 или, в идеале, близок к нулю. В этом условии проявляется специфика множественной регрессии как метода исследования комплексного влияния факторов на результат в условиях их независимости друг от друга.

Мультиколлинеарность – линейная зависимость между более чем двумя переменными, т. е. совокупное воздействие факторов друг на друга.

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.

Включение в модель мультиколлинеарных факторов нежелательно
по следующим причинам:

    затрудняется интерпретация параметров множественной регрессии; параметры линейной регрессии теряют экономический смысл; оценки параметров не надежны, имеют большие стандартные ошибки и меняются с изменением количества наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарности используется определитель матрицы парных коэффициентов интеркорреляции.

Если факторы не коррелируют между собой, то матрица коэффициентов интеркорреляции является единичной, поскольку в этом случае все недиагональные элементы равны 0.

Например, для уравнения с тремя переменными Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Если между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Чем ближе к 0 определитель матрицы коэффициентов интеркорреляции, тем сильнее мультиколлинеарность и ненадежнее результаты множественной регрессии.

Чем ближе к 1 определитель матрицы коэффициентов интеркорреляции, тем меньше мультиколлинеарность факторов.

Способы преодоления мультиколлинеарности факторов:

    исключение из модели одного или нескольких факторов; переход к совмещенным уравнениям регрессии, т. е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Например, если y = f (x1,x2. xр), то можно построить следующее совмещенное уравнение:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

    переход к уравнениям приведенной формы (в уравнение регрессии подставляется рассматриваемый фактор, выраженный из другого уравнения).

4 Выбор формы уравнения регрессии

Кроме точности модели для исследователя наиболее важными качествами модели являются простота модели и возможность наглядной интерпретации параметров модели. По этой причине наиболее широко используются линейная и степенная модели.

В уравнении линейной множественной регрессии:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

параметры bi при хi называются коэффициентами «чистой» регрессии и интерпретируется следующим образом. Параметры bi характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.

В уравнении степенной множественной регрессии Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

показатели степеней bj являются коэффициентами эластичности. Они показывают, на сколько процентов изменяется в среднем результат с изменением соответствующего фактора на 1% при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления.

Так же существуют экспоненциальная модель Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

и гиперболическая Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов.

5 Оценка параметров уравнения множественной регрессии

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений регрессии строится система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовили Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

В случае линейной множественной регрессии система нормальных уравнений имеет следующий вид:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Решение системы уравнений с помощью метода определителей:

?=Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовУравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов, b1=Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовУравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов,…, bp=Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовУравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

где ? – определитель системы: Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

?a, ?b1, ?bp – частные определители (?j) , которые получаются из основного определителя путем замены j-го столбца на столбец свободных членов Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Метод оценки параметров через стандартизованные коэффициенты ?

Уравнение регрессии в стандартизованном (нормированном) масштабе:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов, где

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов, Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов– стандартизованные переменные;

? — стандартизованные коэффициенты регрессии.

?-коэффициенты показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результат за счет изменения соответствующего фактора xi на одну сигму при неизменном среднем уровне других факторов.

Связь коэффициентов «чистой» регрессии bi с коэффициентами ?i описывается соотношением:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторовили Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Коэффициенты ? определяются при помощи МНК из следующей системы уравнений методом определителей:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Параметр a определяется как: Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

6 Проверка качества уравнения регрессии

Дисперсионный анализ – самостоятельный инструмент (метод) математической статистики. Кратко рассмотрим схему дисперсионного анализа, представленную в виде таблицы.

Видео:Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2Скачать

Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2

Проблема выбора факторов для множественной регрессии

Тема № 3. Множественная корреляция и регрессия.

Проблема выбора факторов для множественной регрессии

2. Способы линеаризации связей фактора с результативным признаком

3. Уравнение многофакторной регрессии, его построение и интерпретация

Стандартизированные коэффициенты регрессии и коэффициенты эластичности и их интерпретация

Система показателей тесноты многофакторной связи

Методы оценки степени надежности многофакторной регрессии

Корреляционно-регрессивные модели и их применение в анализе и прогнозе социально-экономических явлений.

Измерение связи неколичественных признаков. Фиктивные переменные

Предпосылки метода наименьших квадратов при нахождении параметров уравнения множественной регрессии

Проблема выбора факторов для множественной регрессии

В реальной жизни, социальных и экономических системах на результативный признак всегда влияет множество факторных признаков. Кроме того, ввиду математических свойств МНК в уравнение регрессии нельзя включать число факторов ≥ (n — 1), где n число наблюдений. А для надлежащих оценок параметров число фактов должно быть в 5 – 6 раз меньше числа наблюдений. Т.к. между самими факторами существует связь, то парная корреляция и регрессия измеряют не чистое влияние каждого фактора, но и часть влияния других факторов, не включенных в модель, но связанных с данными.

Парная регрессия может дать хороший результат, если влиянием других факторов, не включенных в модель, можно пренебречь. Однако исследователь никогда не может быть уверен в справедливости данного предположения. Поэтому, как правило, в эконометрических исследованиях для более полной и точной оценки применяется модель множественной регрессии

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Множественная регрессия используется для решения проблем спроса, доходности акций при изучении функций издержек. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное влияние на моделируемый показатель. Построение модели начинают с решения вопроса о спецификации модели. Во множественной регрессии спецификация модели включает в себя решение двух вопросов:

1. отбор факторов

2. выбор вида уравнения.

Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими жизненными явлениями.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Факторы включенные в модель должны отвечать следующим требованиям:

1. должны быть количественно измеримы; если необходимо включать качественный фактор, то ему необходимо придать количественное определение.

2. не должны быть интеркоррелированны (т.е. факторные признаки не должны находится в тесной зависимости между собой) и находится в точной функциональной связи. При включении в модель факторов с высокой интеркорреляцией ( Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов) для множественной регрессии может привести к нежелательным последствиям, т.е. система норм уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если существует высокая корреляция между факторами, то нельзя установить их изолированное влияние на результативный показатель, и параметры уравнения регрессии окажутся не интерпретируемыми.

Факторы множественной регрессии должны объяснять вариацию зависимой переменной. Если строится модель с набором факторов P, то для нее рассчитывается показатель множественной детерминации R 2 , который фиксирует долю объяснений вариации результативного признака за счет рассмотрения в регрессии P — факторов. Влияние неучтенных факторов оценивается как 1 – R 2 с соответствующей остаточной дисперсией.

При дополнительном включении в регрессию (P+1) – го фактора R 2 должен возрастать, Docm уменьшаться. Если этого не происходит и данные показатели мало отличаются друг от друга, то включенный в анализ (P+1) – фактор не улучшает модель и является практически лишним фактором.

Пример. Допустим, для множественной регрессии, включающей 5 факторов, R 2 = 0,85, а при включении 6-го фактора ® R 2 = 0,786. Значит включение 6-го фактора нецелесообразно.

Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии, но и приводит к статической незначимости параметров регрессии по t – критерию Стьюдента. Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, но практически – в этом нет необходимости.

Отбор факторов производится на основе качественного теоретико-жизненного анализа и проходит в 2 стадии:

1. подбираются факторы, исходя из сущности проблемы,

2. на основе матрицы показателей корреляции определяют t–статистики для параметров регрессии. Коэффициенты интеркорреляции (т.е. корреляции между факторными признаками) позволяют исключить из модели факторы, дублирующие друг друга.

Считается, что 2 переменные являются коллинеарными, т.е. находятся между собой в линейной зависимости, если коэффициент

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов (в идеале коэффициент Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов), то коллинеарность факторов нарушает это условие.

Если факторы явно коллинеарны, то они дублируют друг друга и один из них необходимо исключить из модели.

Правило: предпочтение отдается не фактору, который более тесно связан с результатом, а тому фактору, который при достаточной связи с результатом имеет номинальную тесноту связи с другими факторами.

Пример. Изучается зависимость между Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Построим матрицу парных коэффициентов корреляции

yxzV
y
x0,9
z0,80,9
v0,70,60,3

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Факторы X и Z явно коллинеарны, т.е. дублируют друг друга

В модели оставляем фактор Z, т.к. несмотря на то, что коэффициенты парной корреляции

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов, но зато связь Z с другим фактором слабее:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем 2 фактора связаны между собой линейной зависимостью, т.е. наблюдается совокупность воздействия факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценивать влияние каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка параметров с помощью МНК.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

1. затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов «в чистом» виде, т.к. факторы интерколлинеарны. Параметры линейной регрессии теряют жизненный смысл.

2. оценки параметров ненадежны, обнаруживаются большие стандартные ошибки и меняют с изменением объема наблюдений не только по величине, но и по знаку, что делает модель непригодной для анализа и прогноза.

2. Способы линеаризации связей фактора с результативным признаком

Для оценки параметров нелинейных уравнений используют 2 подхода:

1. основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменный исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными.

2. обычно применяют в случае, когда подобрать соответствующее линеаризационное преобразование невозможно. В этом случае применяют методы нелинейной оптимизации на основе исходных переменных.

По аналогии с парной корреляцией.

3. Уравнение многофакторной регрессии, его построение и интерпретация

Как и в парной зависимости возможны различные виды множественной регрессии: линейные и нелинейные. В виду четной интерпретации параметров наиболее широко используются линейная и степенные функции.

В уравнении множественной регрессии:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Коэффициенты при х называются коэффициентами «чистой» регрессии. Они показывают среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

Параметр а не подлежит экономической интерпретации.

Параметры уравнения множественной регрессии оцениваются как в парной регрессии МНК, при котором строится система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии.

Т. о. для уравнения

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Система нормальных уравнений будет иметь следующий вид:

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Ее решение может быть осуществлено методом определителей

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Где Δа, Δb – частные определители системы, при этом

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Δа, Δb, … , Δbр получаются путем замены соответствующего столбца матрицы общего определителя данной системы данными левой части системы.

у – отношение прибыли ко всем активам банка, %

х1 – Доля ГКО в активах, %

х2 – отношение непроцентных доходов к процентным доходам деятельности банка, %

х3 – коэффициент полной ликвидности банка

Построить множественную модель

Таблица 1. Исходные данные и расчетные величины для анализа.

№ банку,%х1,%х2,%х3,% Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов
13,524,02,51,278,15,429,16
25,551,04,51,9720,15,429,16
1,210,42,52,157,8-6,643,56
1,314,11,61,274,8-3,512,25
4,54,70,31,341,92,66,76
2,715,80,50,973,8-1,11,21
12,229,20,51,159,42,87,84
4,231,06,61,0710,1-5,934,81
4,413,51,01,083,70,70,49
2,82,20,61,361,30,80,64
7,550,32,11,1115,7-8,267,24
14,428,37,21,189,74,722,09
11,430,41,21,109,22,24,84
S10,49304,931,11,7,02105,6х260,05
ср8,123,52,391,31

1. Рассчитать по всем показателям среднее значение ( и V. Результат занесем в таблицу 2.

Таблица 2. Характеристики ряда распределения

ФакторыСреднее значениеСреднее квадратное отклонениеКоэффициент вариации
х123,514,830,632
х22,392,220,929
х31,310,340,261
у8,16,800,843

Получим, что х1, х2, и у совокупность неоднородно, следовательно, должны исключить аномальные наблюдения

Не исключаем, т.к. важна методика .

2. Рассчитаем уравнение парной регрессии между результатом и каждым из факторных признаков.

Установим коэффициенты парной корреляции и детерминации (они характеризуют изолированное влияние каждого фактора на результат, т.к. другие факторы применяются на неизменном уровне).

Парные уравнения регрессии

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Уравнение регрессии позволяет сделать вывод, что с увеличением доли ГКО в активах на 1% пункт, доля прибыли по всем активам увеличивается в среднем на 0,329 % пунктов.

ryx1 = 0,718 – связь прямая и достаточно сильная

r 2 yx1 = 0,516 – при условии др. не считается

2) Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

с увеличением отношения непроцентных доходов к процентным доходам на 1% пунктов, доля прибыли по всем активам увеличивается в среднем на 1,215%

3) Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

ryx3 = 0,241 – связь непрямая и слабая

С увеличением коэффициента полной ликвидности банка на 1 % доля прибыли по всем активам увеличивается в среднем на 4,788%

Вариация х3 объясняет вариацию у на 5,8 %

3. Построим матрицу парных коэффициентов вариации для выявления явно коллинеарных факторов.

Таблица 3. Матрица парных коэффициентов корреляции.

Признакиух1х2х3
у
х10,718
х20,5160,462
х30,2410,00530,134

Явно коллинеарных факторов нет, т.к. коэффициенты парной корреляции между факторными признаками не превышают 0,7.

Способы определения коэффициентов условно чистой регрессии.

Для определения данных коэффициентов рассчитаем определители

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

i – номер наблюдения,

j – номер фактора.

Результаты занесем в вспомогательную таблицу.

Таблица 4. Расчет многофакторной регрессии.

№ банк123D 2 х1D 2 х2D 2 х3D 2 уDуDх1DуDх2DуDх3121323
0,5-0,04
27,50,66
-13,10,84
-9,4-0,04
-18,10,03
-7,7-0,34
5,7-0,16
7,5-0,24
-10,0-0,23
-21,30,05
-26,9-0,20
4,8-0,13
6,9-0,23
å64,111,5277,927,277197,820,551,320

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Для определения коэффициентов условно чистой регрессии рассчитаем систему нормальных уравнений

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Из вспомогательной таблицы № 4 подставляем необходимые данные

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Уравнение многофакторной регрессии примет вид

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Подставляя в данное уравнение значение факторов х1, х2, х3 получим теоретическое значение результативного признака.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Т.о. в отличии от коэффициентов парной регрессии, коэффициенты условно чистой регрессии измеряют влияние фактора, абстрагируясь от связей вариации этого фактора с вариациями другого фактора, включенных в модель.

Уравнения регрессии для 2 х и 3 х факторов с двойным бинарным взаимодействием факторов

Коэффициенты условно чистой регрессии, т.е. bj являются именованными числами, выраженными в различных единицах измерения, в тех же единицах, что и соответствующие им факторы. Поэтому они не сравнимы друг с другом, т.е. по их величине нельзя сделать вывод, какой из факторов в наибольшей степени влияет на результат. Для приведения их в сравнимый вид применяется то же преобразование, что и для получения парных коэффициентов. Полученную величину называют стандартизированным коэффициентом регрессии.

🎦 Видео

Множественная регрессия в Excel и мультиколлинеарностьСкачать

Множественная регрессия в Excel и мультиколлинеарность

Прогнозирование с помощью 2-хфакторного уравнения линейной регрессииСкачать

Прогнозирование с помощью 2-хфакторного уравнения линейной регрессии

Регрессия урок 1: отбор факторов для моделиСкачать

Регрессия урок 1: отбор факторов для модели

Множественная регрессия в MS Excel. Быстрое решение. И подробное решение. Калькулятор!Скачать

Множественная регрессия в MS Excel. Быстрое решение. И подробное решение. Калькулятор!

Множественная регрессияСкачать

Множественная регрессия

Эконометрика. Оценка значимости уравнения регрессии. Критерий ФишераСкачать

Эконометрика. Оценка значимости уравнения регрессии. Критерий Фишера

Эконометрика. Множественная регрессия и корреляция.Скачать

Эконометрика. Множественная регрессия и корреляция.

Корреляционно-регрессионный анализ многомерных данных в ExcelСкачать

Корреляционно-регрессионный анализ многомерных данных в Excel

РЕГРЕССИОННЫЙ АНАЛИЗ общая идея | АНАЛИЗ ДАННЫХ #16Скачать

РЕГРЕССИОННЫЙ АНАЛИЗ общая идея | АНАЛИЗ ДАННЫХ #16

Регрессия в ExcelСкачать

Регрессия в Excel

Множественный регрессионный анализСкачать

Множественный регрессионный анализ

РЕГРЕССИОННЫЙ АНАЛИЗ этапы | АНАЛИЗ ДАННЫХ #17Скачать

РЕГРЕССИОННЫЙ АНАЛИЗ этапы | АНАЛИЗ ДАННЫХ #17

РЕГРЕССИОННЫЙ АНАЛИЗ STATISTICA #12Скачать

РЕГРЕССИОННЫЙ АНАЛИЗ STATISTICA #12

Парная регрессия: линейная зависимостьСкачать

Парная регрессия: линейная зависимость

Точечный прогноз. Интервальный прогноз. Построение уравнения регрессии с помощью анализа данныхСкачать

Точечный прогноз. Интервальный прогноз. Построение уравнения регрессии с помощью анализа данных

Корреляционно-регрессионный анализ. ЭтапыСкачать

Корреляционно-регрессионный анализ. Этапы

Парная регрессия: парабола второго и третьего порядкаСкачать

Парная регрессия: парабола второго и третьего порядка
Поделиться или сохранить к себе: