Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Пример нахождения коэффициента детерминации

Коэффициент детерминации рассчитывается для оценки качества подбора уравнения регрессии. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%. Модели с коэффициентом детерминации выше 80% можно признать достаточно хорошими. Значение коэффициента детерминации R 2 = 1 означает функциональную зависимость между переменными.

Для линейной зависимости коэффициент детерминации равен квадрату коэффициента корреляции rxy: R 2 = rxy 2 .
2 «>Рассчитать свое значение
Например, значение R 2 = 0.83, означает, что в 83% случаев изменения х приводят к изменению y . Другими словами, точность подбора уравнения регрессии — высокая.

В общем случае, коэффициент детерминации находится по формуле: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюили Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению
В этой формуле указаны дисперсии:
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению,
где ∑(y- y ) 2 — общая сумма квадратов отклонений;
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению— сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению— остаточная сумма квадратов отклонений.

В случае нелинейной регрессии коэффициент детерминации рассчитывается через этот калькулятор. При множественной регрессии, коэффициент детемрминации можно найти через сервис Множественная регрессия

Пример . Дано:

  • доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и в покупку валюты, в общей сумме среднедушевого денежного дохода, % (Y)
  • среднемесячная начисленная заработная плата, тыс. руб. (X)

Следует выполнить: 1. построить поле корреляции и сформировать гипотезу о возможной форме и направлении связи; 2. рассчитать параметры уравнений линейной и A1; 3. выполнить расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят B2 % от их среднего уровня; 4. оценить тесноту связи с помощью показателей корреляции и детерминации, проанализировать их значения; 5. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом; 6. Оценить с помощью средней ошибки аппроксимации качество уравнений; 7. Оценить надежность уравнений в целом через F-критерий Фишера для уровня значимости а = 0,05. По значениям характеристик, рассчитанных в пп. 5,6 и данном пункте, выберете лучшее уравнение регрессии и дайте его обоснование.

  • Решение онлайн
  • Видео решение

Уравнение имеет вид y = ax + b
1. Параметры уравнения регрессии.
Средние значения

Связь между признаком Y фактором X сильная и прямая.
Уравнение регрессии

Коэффициент детерминации для линейной регрессии равен квадрату коэффициента корреляции.
R 2 = 0.91 2 = 0.83, т.е. в 83% случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

xyx 2y 2x ∙ yy(x)(y-y cp ) 2(y-y(x)) 2(x-x p ) 2
15.1255228.01650253850.5505.26527451.1762630.22420.25
17261289681214437549.38518772.0783161.41345.96
12293144858493516433.28473699.5319678.51556.96
10310100961003100386.84450587.755904.58655.36
741425547620306251054501872.88196906.672006001474.56
831985688939402251647552081.861007497.339381.62246.76
852549722564974012166652128.32457813.93176990.62440.36
812012656140481441629722035.421062428.38548.492061.16
221562484243984434364665.47337260.88803758.38184.96
103861001489963860386.84354332.480.71655.36
4383161466891532247.52357913.0318353.53998.56
14.1354.1198.81125386.814992.81482.04393327.5816368.87462.25
427.211775.127710.8219692405.81709494.3111775.18137990.811397376.912502.5
2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим

Анализ точности определения оценок коэффициентов регрессии

S a = 3.3432
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-557.64;913.38)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается (6.95>1.812).

Статистическая значимость коэффициента регрессии b не подтверждается (0.96 Fkp, то коэффициент детерминации статистически значим

Видео:Коэффициент детерминации. Основы эконометрикиСкачать

Коэффициент детерминации. Основы эконометрики

Проверка общего качества уравнения регрессии. Коэффициент детерминации R2

Суммарной мерой общего качества уравнения регрессии (соответствия построенного уравнения статистическим данным) является выборочный коэффициент детерминации R 2 .

Пусть уравнение регрессии имеет вид у< = Ь0 + фхг, тогда рассчитанные по модели значения у, для наблюдаемых значений х,- равны Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Наблюдаемые значения у, отличаются от рассчитанных по модели значений г/, на величину е<. yt — у, +е<. Представим это равенство в виде

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Введем обозначения: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениютогда Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Здесь Qt/ — полная сумма квадратов отклонений: мера разброса наблюдаемых значений результирующего признака У относительно среднего значения у; Q r — объясненная сумма квадратов отклонений: мера разброса отклонений, объясненного уравнением регрессии; Q^ — остаточная (необъ- ясненная) сумма квадратов отклонений: мера разброса отклонений, не объясненного уравнением регрессии.

Коэффициент детерминации R 2 определяется как доля разброса переменной У, объясняемая регрессией У на X:

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Так как Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Вывод. Коэффициент детерминации R 2 изменяется в пределах 0 2 2 — 1 и все наблюдаемые значения г/, лежат на линии регрессии, т.е. между У и X имеется строгая функциональная зависимость. Если R 2 = 0, то регрессия ничего не объясняет. Следовательно, чем ближе R 2 к единице, тем лучше уравнение регрессии объясняет наблюдаемые значения.

Связь коэффициента детерминации R 2 и выборочного коэффициента корреляции гху для парной линейной регрессии. Для парной линейной регрессии коэффициент детерминации R 2 связан с выборочным коэффициентом корреляции гху простым соотношением

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Проверка значимости уравнения регрессии. Проверить значимость уравнения регрессии — значит подтвердить соответствие математической модели экспериментальным данным. Проверка общего качества уравнения регрессии проводится с помощью проверки статистической значимости коэффициента детерминации К 2 .

Введем понятие числа степеней свободы для уравнения регрессии. Число степеней свободы есть мера независимого варьирования переменных. Числом степеней свободы для уравнения регрессии называется величина v = п — k, где п — число наблюдений; k — число оцениваемых в модели параметров. Для случая парной линейной регрессии оцениваем два параметра Ь0 и Ьь поэтому k = 2, а число степеней свободы v = п — 2.

Для общей проверки значимости построенной модели регрессии выдвигаются две гипотезы #0 и Н<

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Для проверки основной гипотезы //0 используется ^-статистика (статистика Фишера — Снсдекора)

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

которая имеет распределение Фишера cv1 = l,v2 = w- 2 степенями свободы (v, — количество объясняющих факторов, от которых зависит Y в уравнении регрессии; v2 — разность между числом наблюдений и числом определяемых параметров модели). Необходимо отметить, что проверка значимости коэффициента корреляции гху проводится с использованием статистики Стыодента, а проверка значимости коэффициента детерминации R 2 — с использованием статистики Фишера — Снсдекора.

Отметим, что для обеспечения статистической надежности построенной модели регрессии требуется, чтобы выполнялось соотношение п > 3 +1). Здесь т — число объясняющих переменных в уравнении регрессии. В случае парной регрессии т = 1.

Подставляя в выражение (3.22) полученное но выборке значение R 2 , вычисляем наблюдаемое значение критерия Гиабл- По таблице критических точек распределения Фишера по заданному уровню значимости а и числам степеней свободы v1 = 1hv2 = w- 2 находится критическая точкаFKp = Fa. 1;п_2.

Сравнивая наблюдаемое значение критерия с критическим, можно принять или отвергнуть гипотезу #0. Если FHaбл > FKp, то нулевая гипотеза отклоняется в пользу гипотезы Н< и делается вывод о том, что R 2 > 0, т.е. R 2 и уравнение регрессии статистически значимы. В противном случае принимается гипотеза Я0 и делается вывод о статистической незначимое™ построенного уравнения регрессии.

Проверим значимость уравнения регрессии, полученного по данным примера 3.1. Примем уровень значимости а = 0,01.

Решение. Объясненная уравнением регрессии сумма квадратов отклонений

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Полная сумма квадратов отклонений Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюКоэффициент детерминации

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Столь большая величина коэффициента детерминации показывает, что полученное уравнение регрессии хорошо объясняет наблюдаемые значения.

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Для проверки гипотезы о значимости уравнения регрессии используется статистика Фишера.

Наблюдаемое значение статистики равно

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Критическое значение статистики находим по таблице квантилей распределения Фишера [1] при уровне значимости а = 0,01 и числах степеней свободы Vj = 1 и v2 = п — 2:

Так как Тнабл = 99,690 > 11,26 = FKp, то с доверительной вероятностью у = 0,99 гипотеза //0: R [2] = 0 отвергается и принимается альтернативная гипотеза //,: R [2] > 0 (напоминаем, что по определению у + а = 1).

На основании этого делается вывод о статистической значимости уравнения регрессии с доверительной вероятностью у = 0,99.

Видео:МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.Скачать

МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.

Коэффициент детерминации

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Коэффициент детерминации (R2)— это доля объяснённой дисперсии отклонений зависимой переменной от её среднего значения. Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных, в частном случае является квадратом коэффициента корреляции между зависимой переменной и её прогнозными значениями с помощью объясняющих переменных. Тогда можно сказать, что R2 показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.

Формула для вычисления коэффициента детерминации:

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению-среднее арифметическое зависимой переменной.

Видео:Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)Скачать

Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)

Содержание

· 1 Проблемы и общие свойства R2

o 1.1 Интерпретация

o 1.2 Общие свойства для МНК регрессии

o 1.3 Общие свойства для МНК регрессии со свободным членом (единичным фактором)

o 1.4 Мнимая регрессия

· 2 Решение проблем или модификации R2

o 2.1 R2-скорректированный (adjusted)

o 2.2 R2-распространённый (extended)

o 2.3 R2-истинный (несмещённый)

· 3 Прочие используемые критерии

Видео:Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.Скачать

Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.

[править]Проблемы и общие свойства R2

[править]Интерпретация

Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока):

Количественная мера тесноты связи

Качественная характеристика силы связи

Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.

[править]Общие свойства для МНК регрессии

Линейная множественная регрессия методом наименьших квадратов (МНК) — наиболее распространённый случай использования коэффициента детерминации R2.

Линейная множественная МНК регрессия имеет следующие общие свойства [1]:

1. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям.

2. С увеличением количества объясняющих переменных увеличивается R2.

[править]Общие свойства для МНК регрессии со свободным членом (единичным фактором)

Для случая наличия в такой регрессии свободного члена коэффициент детерминации обладает следующими свойствами: [2]

1. принимает значения из интервала (отрезка) [0;1].

2. в случае парной линейной регрессионной МНК модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R2 = r2. А в случае множественной МНК регрессии R2 = r(y;f)2. Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.[3]

3. R2 можно разложить по вкладу каждого фактора в значение R2, причём вклад каждого такого фактора будет положительным. Используется разложение: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, где r0j — выборочный коэффициент корреляции зависимой и соответствующей второму индексу объясняющей переменной.

4. R2 связан с проверкой гипотезы о том, что истинные значения коэффициентов при объясняющих переменных равны нулю, в сравнении с альтернативной гипотезой, что не все истинные значения коэффициентов равны нулю. Тогда случайная величина Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюимеет F-распределение с (k-1) и (n-k) степенями свободы.

[править]Мнимая регрессия

Значения R2, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениютакже могут быть манипулированы, с помощью включения фиктивных факторов. Например, если два показателя имеют возрастающую динамику, то их коэффициент корреляции (который входит в факторное разложение) будет достаточно высок. Поэтому логическая и смысловая адекватность модели имеют первостепенную важность. Только качество модели может быль проверено или сопоставлено с использованием R2 и его модификаций.

Видео:Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2Скачать

Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2

[править]Решение проблем или модификации R2

[править]R2-скорректированный (adjusted)

Для того, чтобы исследователи не увеличивали R2 с помощью добавления посторонних факторов, R2 заменяется на скорректированный Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, который даёт штраф за дополнительно включённые факторы, где n — количество наблюдений, а k — количество объясняющих переменных, включая свободный член.>

[править]R2-распространённый (extended)

В случае отсутствия в линейной множественной МНК регрессии свободного члена все четыре вышеперечисленных свойства могут нарушаться для конкретной реализации. Поэтому регрессию со свободным членом и без него нельзя сравнивать по критерию R2. Эта проблема решается с помощью построения распространённого коэффициента детерминации Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, который будет совпадать с исходным для случая МНК регрессии со свободным членом, и для которого будут продолжать выполняться четыре свойства перечисленые выше. Суть этого метода заключается рассмотрении проекции единичного вектора на плоскость объясняющих переменных [2].
Для случая регрессии без свободного члена:
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению,
где X — матрица nxk значений факторов, P(X) = X * (X‘ * X) − 1 * X‘ — проектор на плоскость X, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, где in — единичный вектор nx1.

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюс условием небольшой модификации, также подходит для сравнения между собой регрессий построенных с помощью: МНК, обобщённого метода наименьших квадратов (ОМНК), условного метода наименьших квадратов (УМНК), обобщённо-условного метода наименьших квадратов (ОУМНК).

[править]R2-истинный (несмещённый)

Видео:Эконометрика. Оценка значимости уравнения регрессии. Критерий ФишераСкачать

Эконометрика. Оценка значимости уравнения регрессии. Критерий Фишера

[править]Прочие используемые критерии

AIC — информационный критерий Акаике — применяется исключительно для сравнения между моделями. Чем меньше значение тем лучше. Часто используется в виде сравнения моделей временных рядов с разным количеством лагов.
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению. Даёт меньший штраф за включение лишних лагов в модель, чем BIC.
BIC — информационный критерий Шварца — используется и интерпретируется аналогично AIC.
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению. Даёт больший штраф за включение лишних лагов в модель, чем BIC (см. формулу). [1]

Видео:Эконометрика Линейная регрессия и корреляцияСкачать

Эконометрика  Линейная регрессия и корреляция

[править]См. также

§ Дисперсия случайной величины

§ Метод группового учета аргументов

Видео:Математика #1 | Корреляция и регрессияСкачать

Математика #1 | Корреляция и регрессия

[править]Примечания

1. ↑ 1 2 , , Эконометрика. Начальный курс.. — 6,7,8-е изд., доп. и перераб.. — Москва: Дело, 2004. — Т. «». — 576 с. — ISBN -X

2. ↑ 1 2 Распространение коэффициента детерминации на общий случай линейной регрессии, оцениваемой с помощью различных версий метода наименьших квадратов (рус., англ.) //ЦЕМИ РАН Экономика и математические методы. — Москва: ЦЕМИ РАН, 2002. — В. 3. — Т. 38. — С. 107-120.

3. , Прикладная статистика. Основы эконометрики (в 2-х т.). — . — Москва: Юнити-Дана (проект TASIS), 2001. — Т. «1,2». — 1088 с. — ISBN -8

4. Выбор регрессии максимизирующий несмещённую оценку коэффициента детерминации (рус., англ.) // Прикладная эконометрика. — Москва: Маркет ДС, 2008. — В. 4. — Т. 12. — С. 71-83.

🌟 Видео

Множественная регрессияСкачать

Множественная регрессия

Интерпретация коэффициента при логарифмировании в уравнениях регрессииСкачать

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Как вычислить линейный коэффициент корреляции в MS Excel и построить уравнение регрессии?Скачать

Как вычислить линейный коэффициент корреляции в MS Excel  и построить уравнение регрессии?

Эконометрика. Множественная регрессия и корреляция.Скачать

Эконометрика. Множественная регрессия и корреляция.

Однофакторная регрессионная модель. Коэффициенты детерминации, корреляции. Критерий ФишераСкачать

Однофакторная регрессионная модель. Коэффициенты детерминации, корреляции. Критерий Фишера

Коэффициент линейной регрессии, 2 способаСкачать

Коэффициент линейной регрессии, 2 способа

Множественная регрессия в Excel и мультиколлинеарностьСкачать

Множественная регрессия в Excel и мультиколлинеарность

Множественная регрессия в ExcelСкачать

Множественная регрессия в Excel

Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессияСкачать

Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессия

Взаимосвязь по группировке, коэффициент детерминации, правило сложения дисперсийСкачать

Взаимосвязь по группировке, коэффициент детерминации, правило сложения дисперсий

Эконометрика. Линейная парная регрессияСкачать

Эконометрика. Линейная парная регрессия

Регрессия в ExcelСкачать

Регрессия в Excel
Поделиться или сохранить к себе: