Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Пример нахождения коэффициента детерминации

Коэффициент детерминации рассчитывается для оценки качества подбора уравнения регрессии. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%. Модели с коэффициентом детерминации выше 80% можно признать достаточно хорошими. Значение коэффициента детерминации R 2 = 1 означает функциональную зависимость между переменными.

Для линейной зависимости коэффициент детерминации равен квадрату коэффициента корреляции rxy: R 2 = rxy 2 .
2 «>Рассчитать свое значение
Например, значение R 2 = 0.83, означает, что в 83% случаев изменения х приводят к изменению y . Другими словами, точность подбора уравнения регрессии — высокая.

В общем случае, коэффициент детерминации находится по формуле: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюили Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению
В этой формуле указаны дисперсии:
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению,
где ∑(y- y ) 2 — общая сумма квадратов отклонений;
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению— сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению— остаточная сумма квадратов отклонений.

В случае нелинейной регрессии коэффициент детерминации рассчитывается через этот калькулятор. При множественной регрессии, коэффициент детемрминации можно найти через сервис Множественная регрессия

Пример . Дано:

  • доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и в покупку валюты, в общей сумме среднедушевого денежного дохода, % (Y)
  • среднемесячная начисленная заработная плата, тыс. руб. (X)

Следует выполнить: 1. построить поле корреляции и сформировать гипотезу о возможной форме и направлении связи; 2. рассчитать параметры уравнений линейной и A1; 3. выполнить расчет прогнозного значения результата, предполагая, что прогнозные значения факторов составят B2 % от их среднего уровня; 4. оценить тесноту связи с помощью показателей корреляции и детерминации, проанализировать их значения; 5. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом; 6. Оценить с помощью средней ошибки аппроксимации качество уравнений; 7. Оценить надежность уравнений в целом через F-критерий Фишера для уровня значимости а = 0,05. По значениям характеристик, рассчитанных в пп. 5,6 и данном пункте, выберете лучшее уравнение регрессии и дайте его обоснование.

  • Решение онлайн
  • Видео решение

Уравнение имеет вид y = ax + b
1. Параметры уравнения регрессии.
Средние значения

Связь между признаком Y фактором X сильная и прямая.
Уравнение регрессии

Коэффициент детерминации для линейной регрессии равен квадрату коэффициента корреляции.
R 2 = 0.91 2 = 0.83, т.е. в 83% случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

xyx 2y 2x ∙ yy(x)(y-y cp ) 2(y-y(x)) 2(x-x p ) 2
15.1255228.01650253850.5505.26527451.1762630.22420.25
17261289681214437549.38518772.0783161.41345.96
12293144858493516433.28473699.5319678.51556.96
10310100961003100386.84450587.755904.58655.36
741425547620306251054501872.88196906.672006001474.56
831985688939402251647552081.861007497.339381.62246.76
852549722564974012166652128.32457813.93176990.62440.36
812012656140481441629722035.421062428.38548.492061.16
221562484243984434364665.47337260.88803758.38184.96
103861001489963860386.84354332.480.71655.36
4383161466891532247.52357913.0318353.53998.56
14.1354.1198.81125386.814992.81482.04393327.5816368.87462.25
427.211775.127710.8219692405.81709494.3111775.18137990.811397376.912502.5
2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим

Анализ точности определения оценок коэффициентов регрессии

S a = 3.3432
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-557.64;913.38)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается (6.95>1.812).

Статистическая значимость коэффициента регрессии b не подтверждается (0.96 Fkp, то коэффициент детерминации статистически значим

Видео:Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)Скачать

Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)

Проверка общего качества уравнения регрессии. Коэффициент детерминации R2

Суммарной мерой общего качества уравнения регрессии (соответствия построенного уравнения статистическим данным) является выборочный коэффициент детерминации R 2 .

Пусть уравнение регрессии имеет вид у< = Ь0 + фхг, тогда рассчитанные по модели значения у, для наблюдаемых значений х,- равны Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Наблюдаемые значения у, отличаются от рассчитанных по модели значений г/, на величину е<. yt — у, +е<. Представим это равенство в виде

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Введем обозначения: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениютогда Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Здесь Qt/ — полная сумма квадратов отклонений: мера разброса наблюдаемых значений результирующего признака У относительно среднего значения у; Q r — объясненная сумма квадратов отклонений: мера разброса отклонений, объясненного уравнением регрессии; Q^ — остаточная (необъ- ясненная) сумма квадратов отклонений: мера разброса отклонений, не объясненного уравнением регрессии.

Коэффициент детерминации R 2 определяется как доля разброса переменной У, объясняемая регрессией У на X:

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Так как Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Вывод. Коэффициент детерминации R 2 изменяется в пределах 0 2 2 — 1 и все наблюдаемые значения г/, лежат на линии регрессии, т.е. между У и X имеется строгая функциональная зависимость. Если R 2 = 0, то регрессия ничего не объясняет. Следовательно, чем ближе R 2 к единице, тем лучше уравнение регрессии объясняет наблюдаемые значения.

Связь коэффициента детерминации R 2 и выборочного коэффициента корреляции гху для парной линейной регрессии. Для парной линейной регрессии коэффициент детерминации R 2 связан с выборочным коэффициентом корреляции гху простым соотношением

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Проверка значимости уравнения регрессии. Проверить значимость уравнения регрессии — значит подтвердить соответствие математической модели экспериментальным данным. Проверка общего качества уравнения регрессии проводится с помощью проверки статистической значимости коэффициента детерминации К 2 .

Введем понятие числа степеней свободы для уравнения регрессии. Число степеней свободы есть мера независимого варьирования переменных. Числом степеней свободы для уравнения регрессии называется величина v = п — k, где п — число наблюдений; k — число оцениваемых в модели параметров. Для случая парной линейной регрессии оцениваем два параметра Ь0 и Ьь поэтому k = 2, а число степеней свободы v = п — 2.

Для общей проверки значимости построенной модели регрессии выдвигаются две гипотезы #0 и Н<

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Для проверки основной гипотезы //0 используется ^-статистика (статистика Фишера — Снсдекора)

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

которая имеет распределение Фишера cv1 = l,v2 = w- 2 степенями свободы (v, — количество объясняющих факторов, от которых зависит Y в уравнении регрессии; v2 — разность между числом наблюдений и числом определяемых параметров модели). Необходимо отметить, что проверка значимости коэффициента корреляции гху проводится с использованием статистики Стыодента, а проверка значимости коэффициента детерминации R 2 — с использованием статистики Фишера — Снсдекора.

Отметим, что для обеспечения статистической надежности построенной модели регрессии требуется, чтобы выполнялось соотношение п > 3 +1). Здесь т — число объясняющих переменных в уравнении регрессии. В случае парной регрессии т = 1.

Подставляя в выражение (3.22) полученное но выборке значение R 2 , вычисляем наблюдаемое значение критерия Гиабл- По таблице критических точек распределения Фишера по заданному уровню значимости а и числам степеней свободы v1 = 1hv2 = w- 2 находится критическая точкаFKp = Fa. 1;п_2.

Сравнивая наблюдаемое значение критерия с критическим, можно принять или отвергнуть гипотезу #0. Если FHaбл > FKp, то нулевая гипотеза отклоняется в пользу гипотезы Н< и делается вывод о том, что R 2 > 0, т.е. R 2 и уравнение регрессии статистически значимы. В противном случае принимается гипотеза Я0 и делается вывод о статистической незначимое™ построенного уравнения регрессии.

Проверим значимость уравнения регрессии, полученного по данным примера 3.1. Примем уровень значимости а = 0,01.

Решение. Объясненная уравнением регрессии сумма квадратов отклонений

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Полная сумма квадратов отклонений Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюКоэффициент детерминации

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Столь большая величина коэффициента детерминации показывает, что полученное уравнение регрессии хорошо объясняет наблюдаемые значения.

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Для проверки гипотезы о значимости уравнения регрессии используется статистика Фишера.

Наблюдаемое значение статистики равно

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Критическое значение статистики находим по таблице квантилей распределения Фишера [1] при уровне значимости а = 0,01 и числах степеней свободы Vj = 1 и v2 = п — 2:

Так как Тнабл = 99,690 > 11,26 = FKp, то с доверительной вероятностью у = 0,99 гипотеза //0: R [2] = 0 отвергается и принимается альтернативная гипотеза //,: R [2] > 0 (напоминаем, что по определению у + а = 1).

На основании этого делается вывод о статистической значимости уравнения регрессии с доверительной вероятностью у = 0,99.

Видео:Коэффициент детерминации. Основы эконометрикиСкачать

Коэффициент детерминации. Основы эконометрики

Коэффициент детерминации

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

Коэффициент детерминации (R2)— это доля объяснённой дисперсии отклонений зависимой переменной от её среднего значения. Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных, в частном случае является квадратом коэффициента корреляции между зависимой переменной и её прогнозными значениями с помощью объясняющих переменных. Тогда можно сказать, что R2 показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.

Формула для вычисления коэффициента детерминации:

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению

где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению-среднее арифметическое зависимой переменной.

Видео:МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.Скачать

МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.

Содержание

· 1 Проблемы и общие свойства R2

o 1.1 Интерпретация

o 1.2 Общие свойства для МНК регрессии

o 1.3 Общие свойства для МНК регрессии со свободным членом (единичным фактором)

o 1.4 Мнимая регрессия

· 2 Решение проблем или модификации R2

o 2.1 R2-скорректированный (adjusted)

o 2.2 R2-распространённый (extended)

o 2.3 R2-истинный (несмещённый)

· 3 Прочие используемые критерии

Видео:Эконометрика. Оценка значимости уравнения регрессии. Критерий ФишераСкачать

Эконометрика. Оценка значимости уравнения регрессии. Критерий Фишера

[править]Проблемы и общие свойства R2

[править]Интерпретация

Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока):

Количественная мера тесноты связи

Качественная характеристика силы связи

Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.

[править]Общие свойства для МНК регрессии

Линейная множественная регрессия методом наименьших квадратов (МНК) — наиболее распространённый случай использования коэффициента детерминации R2.

Линейная множественная МНК регрессия имеет следующие общие свойства [1]:

1. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям.

2. С увеличением количества объясняющих переменных увеличивается R2.

[править]Общие свойства для МНК регрессии со свободным членом (единичным фактором)

Для случая наличия в такой регрессии свободного члена коэффициент детерминации обладает следующими свойствами: [2]

1. принимает значения из интервала (отрезка) [0;1].

2. в случае парной линейной регрессионной МНК модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R2 = r2. А в случае множественной МНК регрессии R2 = r(y;f)2. Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.[3]

3. R2 можно разложить по вкладу каждого фактора в значение R2, причём вклад каждого такого фактора будет положительным. Используется разложение: Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, где r0j — выборочный коэффициент корреляции зависимой и соответствующей второму индексу объясняющей переменной.

4. R2 связан с проверкой гипотезы о том, что истинные значения коэффициентов при объясняющих переменных равны нулю, в сравнении с альтернативной гипотезой, что не все истинные значения коэффициентов равны нулю. Тогда случайная величина Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюимеет F-распределение с (k-1) и (n-k) степенями свободы.

[править]Мнимая регрессия

Значения R2, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениютакже могут быть манипулированы, с помощью включения фиктивных факторов. Например, если два показателя имеют возрастающую динамику, то их коэффициент корреляции (который входит в факторное разложение) будет достаточно высок. Поэтому логическая и смысловая адекватность модели имеют первостепенную важность. Только качество модели может быль проверено или сопоставлено с использованием R2 и его модификаций.

Видео:Математика #1 | Корреляция и регрессияСкачать

Математика #1 | Корреляция и регрессия

[править]Решение проблем или модификации R2

[править]R2-скорректированный (adjusted)

Для того, чтобы исследователи не увеличивали R2 с помощью добавления посторонних факторов, R2 заменяется на скорректированный Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, который даёт штраф за дополнительно включённые факторы, где n — количество наблюдений, а k — количество объясняющих переменных, включая свободный член.>

[править]R2-распространённый (extended)

В случае отсутствия в линейной множественной МНК регрессии свободного члена все четыре вышеперечисленных свойства могут нарушаться для конкретной реализации. Поэтому регрессию со свободным членом и без него нельзя сравнивать по критерию R2. Эта проблема решается с помощью построения распространённого коэффициента детерминации Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, который будет совпадать с исходным для случая МНК регрессии со свободным членом, и для которого будут продолжать выполняться четыре свойства перечисленые выше. Суть этого метода заключается рассмотрении проекции единичного вектора на плоскость объясняющих переменных [2].
Для случая регрессии без свободного члена:
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению,
где X — матрица nxk значений факторов, P(X) = X * (X‘ * X) − 1 * X‘ — проектор на плоскость X, Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению, где in — единичный вектор nx1.

Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражениюс условием небольшой модификации, также подходит для сравнения между собой регрессий построенных с помощью: МНК, обобщённого метода наименьших квадратов (ОМНК), условного метода наименьших квадратов (УМНК), обобщённо-условного метода наименьших квадратов (ОУМНК).

[править]R2-истинный (несмещённый)

Видео:Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2Скачать

Нелинейная регрессия в MS Excel. Как подобрать уравнение регрессии? Некорректное значение R^2

[править]Прочие используемые критерии

AIC — информационный критерий Акаике — применяется исключительно для сравнения между моделями. Чем меньше значение тем лучше. Часто используется в виде сравнения моделей временных рядов с разным количеством лагов.
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению. Даёт меньший штраф за включение лишних лагов в модель, чем BIC.
BIC — информационный критерий Шварца — используется и интерпретируется аналогично AIC.
Коэффициент детерминации r2 для уравнения регрессии вида y a bx u определяется по выражению. Даёт больший штраф за включение лишних лагов в модель, чем BIC (см. формулу). [1]

Видео:Эконометрика Линейная регрессия и корреляцияСкачать

Эконометрика  Линейная регрессия и корреляция

[править]См. также

§ Дисперсия случайной величины

§ Метод группового учета аргументов

Видео:Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.Скачать

Эконометрика. Оценка значимости параметров уравнения регрессии. Критерий Стьюдента.

[править]Примечания

1. ↑ 1 2 , , Эконометрика. Начальный курс.. — 6,7,8-е изд., доп. и перераб.. — Москва: Дело, 2004. — Т. «». — 576 с. — ISBN -X

2. ↑ 1 2 Распространение коэффициента детерминации на общий случай линейной регрессии, оцениваемой с помощью различных версий метода наименьших квадратов (рус., англ.) //ЦЕМИ РАН Экономика и математические методы. — Москва: ЦЕМИ РАН, 2002. — В. 3. — Т. 38. — С. 107-120.

3. , Прикладная статистика. Основы эконометрики (в 2-х т.). — . — Москва: Юнити-Дана (проект TASIS), 2001. — Т. «1,2». — 1088 с. — ISBN -8

4. Выбор регрессии максимизирующий несмещённую оценку коэффициента детерминации (рус., англ.) // Прикладная эконометрика. — Москва: Маркет ДС, 2008. — В. 4. — Т. 12. — С. 71-83.

🎥 Видео

Интерпретация коэффициента при логарифмировании в уравнениях регрессииСкачать

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Как вычислить линейный коэффициент корреляции в MS Excel и построить уравнение регрессии?Скачать

Как вычислить линейный коэффициент корреляции в MS Excel  и построить уравнение регрессии?

Однофакторная регрессионная модель. Коэффициенты детерминации, корреляции. Критерий ФишераСкачать

Однофакторная регрессионная модель. Коэффициенты детерминации, корреляции. Критерий Фишера

Множественная регрессияСкачать

Множественная регрессия

Эконометрика. Множественная регрессия и корреляция.Скачать

Эконометрика. Множественная регрессия и корреляция.

Взаимосвязь по группировке, коэффициент детерминации, правило сложения дисперсийСкачать

Взаимосвязь по группировке, коэффициент детерминации, правило сложения дисперсий

Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессияСкачать

Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессия

Коэффициент линейной регрессии, 2 способаСкачать

Коэффициент линейной регрессии, 2 способа

Множественная регрессия в ExcelСкачать

Множественная регрессия в Excel

Множественная регрессия в Excel и мультиколлинеарностьСкачать

Множественная регрессия в Excel и мультиколлинеарность

Эконометрика. Линейная парная регрессияСкачать

Эконометрика. Линейная парная регрессия

Регрессия в ExcelСкачать

Регрессия в Excel
Поделиться или сохранить к себе: