Выборочное уравнение прямой линии регрессии имеет вид тогда выборочный коэффициент корреляции

Задача 60411 Выборочное уравнение прямой линии.

Содержание

Условие
Решение
Выборочное уравнение прямой линии регрессии имеет вид тогда выборочный коэффициент корреляции
Корреляция и регрессия
Выборочное уравнение прямой линии регрессии

Условие

Выборочное уравнение прямой линии регрессии
Y
на
X
имеет вид
y=3−1.5x
Тогда выборочный коэффициент корреляции может быть равен 1.6, -1.6, -0.5, 0.74. Выбрать один вариант

Решение

выборочный коэффициент корреляции принимает значения от -1 до 1

Значит остаются варианты: –0.5, 0.74.

Если коэффициент корреляции отрицательный, но нет линейной зависимости ⇒ остается вариант: 0.74.

ЗАДАЧИ ИЗ ТЕСТОВ С РЕШЕНИЯМИ

Задача 1. Из урны, в которой находятся 12 белых и 10 черных шаров, вынимают наудачу один шар. Тогда вероятность того, что этот шар будет черным, равна…

Задача 2. Игральная кость бросается один раз. Тогда вероятность того, что на верхней грани выпадет четное число очков, равна…

Воспользуемся формулой , где n — общее число возможных элементарных исходов испытания, а m — число элементарных исходов, благоприятствующих появлению события A . В нашем случае возможны n =6 элементарных исходов испытания (на верхней грани появится одно, два,…, шесть очков), из которых благоприятствующими являются три исхода (два, четыре и шесть очков). Следовательно, m =3 и .

Задача 3. Из урны, в которой находятся 6 черных и 10 белых шаров, вынимают одновременно 2 шара. Тогда вероятность того, что оба шара будут белыми, равна…

Воспользуемся формулой , где n — общее число возможных элементарных исходов испытания, а m — число элементарных исходов, благоприятствующих появлению события A . В нашем случае общее число возможных элементарных исходов равно числу способов, которыми можно извлечь два шара из 16 имеющих, то есть . А общее число благоприятствующих исходов равно числу способов, которыми можно извлечь два белых шара из десяти имеющихся, то есть . Следовательно, .

Задача 4. Два предприятия производят разнотипную продукцию. Вероятности их банкротства в течение года равны 0,1 и 0,2 соответственно. Тогда вероятность того, что в течение года обанкротится хотя бы одно предприятие, равна…

Введем обозначения событий: A ₁ — обанкротится первое предприятие; A ₂ — обанкротится второе предприятие; A — обанкротится хотя бы одно предприятие; — ни одно предприятие не обанкротится. Тогда = , где — событие, противоположное событию A_i . причем . Так как, по условию задачи, события A ₁ и A ₂ независимы, то .

Задача 5. Два стрелка производят по одному выстрелу. Вероятность попадания в цель для первого и второго стрелков равны 0,7 и 0,85 соответственно. Тогда вероятность того, что в цель попадет только один стрелок, равна …

Введем обозначения событий: A ₁ — в цель попадет первый стрелок, A ₂ — в цель попадет второй стрелок, A — в цель попадет только один стрелок. Тогда = + , где — событие, противоположное событию A_i , причем . Так как, по условию задачи, события A ₁ и A ₂ несовместны и независимы, то

Задача 6. Устройство состоит из трех элементов, работающих независимо. Вероятности безотказной работы этих элементов (в течение рабочего дня) равны соответственно 0,9, 0,8 и 0,7. Тогда вероятность того, что в течение рабочего дня будут работать безотказно все три элемента, равна…

Введем обозначения событий: A_i — в течение рабочего дня безотказно работает i — ый элемент, A – в течение рабочего дня работают безотказно все три элемента. Тогда A = A ₁ · A ₂ · A ₃ . Так как, по условию задачи, события A ₁ , A ₂ и A ₃ независимы, то P ( A )= P ( A ₁ · A ₂ · A ₃ )=

Задача 7. В первой урне 3 черных и 7 белых шаров. Во второй урне 4 белых и 6 черных шаров. В третьей урне 11 белых и 9 черных шаров. Из наудачу взятой урны вынули один шар. Тогда вероятность того, что этот шар окажется белым, равна…

Для вычисления вероятности события A (вынутый наудачу шар – белый) применим формулу полной вероятности: .

Здесь: — вероятность того, что шар извлечен из первой урны; — вероятность того, что шар извлечен из второй урны; — вероятность того, что шар извлечен из третьей урны. — условная вероятность того, что вынутый шар белый, если он извлечен из первой урны; — условная вероятность того, что вынутый шар белый, если он извлечен из второй урны; — условная вероятность того, что вынутый шар белый, если он извлечен из третьей урны.
Тогда .

Задача 8. В первой урне 6 черных и 4 белых шара. Во второй урне 2 белых и 18 черных шаров. Из наудачу взятой урны вынули один шар, который оказался белым. Тогда вероятность того, что этот шар извлечен из первой урны, равна…

Предварительно вычислим вероятность события A (вынутый наудачу шар – белый) по формуле полной вероятности: .

Здесь: — вероятность того, что шар извлечен из первой урны; — вероятность того, что шар извлечен из второй урны; — условная вероятность того, что вынутый шар белый, если он извлечен из первой урны; — условная вероятность того, что вынутый шар белый, если он извлечен из второй урны.
Тогда .
Теперь вычислим условную вероятность того, что шар извлечен из первой урны, если он оказался белым, по формуле Байеса:
.

Задача 9. С первого станка на сборку поступает 45%, со второго – 55% всех деталей. Среди деталей первого станка 90% стандартных, второго – 80%. Тогда вероятность того, что взятая наудачу деталь окажется нестандартной, равна …

Для вычисления вероятности события A (взятая наудачу деталь окажется нестандартной) применим формулу полной вероятности: . Здесь: — вероятность того, что деталь поступила с первого станка; — вероятность того, что деталь поступила с второго станка; — условная вероятность того, что деталь нестандартная, если она изготовлена на первом станке; — условная вероятность того, что деталь нестандартная, если она изготовлена на втором станке.
Тогда

P ( A )=0,45(1-0,9)+0,55(1-0,8)=0,045+0,11=0,155.

Задача 10. С первого станка на сборку поступает 20%, со второго – 80% всех деталей. Среди деталей первого станка 90% стандартных, второго – 70%. Взятая наудачу деталь оказалась стандартной. Тогда вероятность того, что эта деталь изготовлена на первом станке, равна …

Предварительно вычислим вероятности события A (взятая наудачу деталь окажется стандартной) по формуле полной вероятности: .

Здесь: — вероятность того, что деталь поступила с первого станка; — вероятность того, что деталь поступила с второго станка; — условная вероятность того, что деталь стандартная, если она изготовлена на первом станке; — условная вероятность того, что деталь стандартная, если она изготовлена на втором станке.
Тогда 0,2∙0,9+0,8∙0,7=0,74..
Теперь вычислим условную вероятность того, что деталь изготовлена на первом станке, если она оказалась стандартной, по формуле Байеса:
.

Задача 11. Дискретная случайная величина задана законом распределения вероятностей

Тогда ее функция распределения вероятностей имеет вид…

По определению F ( x )= P ( X x ).

Тогда
а) при , F ( x )= P ( X , F ( x )= P ( X =1)=0,1,
в) при ,

F ( x )= P ( X =1)+ P ( X =3)=0,1+0,3=0,4,
г) при x > 5,

F(x)=P(X=1)+ P(X=3)+P(X=5)+P(X=6)= 0,1+0,3+0,6=1.
Следовательно,

Задача 12. Дискретная случайная величина задана законом распределения вероятностей

Тогда значения a и b могут быть равны…

Так как сумма вероятностей возможных значений равна 1, то a + b =1-0,1-0,2=0,7. Этому условию удовлетворяет ответ: a =0,4, b =0,3.

Задача 13. Даны две независимые дискретные случайные величины X и Y :

Тогда закон распределения вероятностей суммы X + Y имеет вид…

Возможные значения x_ij суммы дискретных случайных величин X + Y определяются как x_ij = x_i + y_j , а соответствующие вероятности как произведение p_ij = p_i _∙ q_j = P ( X = x_i )_∙ P ( Y = y_j ).
Тогда ответ:

Задача 14. Проводится n независимых испытаний, в каждом из которых вероятность появления события A постоянна и равна 0,2. Тогда математическое ожидание дискретной случайной величины X — числа появлений события A в n =100 проведенных испытаниях, равно…

Случайная величина X подчиняется биномиальному закону распределения вероятностей. Поэтому M ( X )= np =100∙0,2=20.

Задача 15. Непрерывная случайная величина задана функцией распределения вероятностей:

Тогда плотность распределения вероятностей имеет вид…

Плотность распределения вероятностей непрерывной случайной величины вычисляется по формуле: f ( x )= F ’( x ). Тогда , (1)’=0 и

Задача 16. Непрерывная случайная величина X задана плотностью распределения вероятностей . Тогда математическое ожидание a и дисперсия σ 2 этой нормально распределенной случайной величины равны…

Плотность распределения вероятностей нормально распределенной случайной величины имеет вид: . Тогда a =3 ,σ 2 =16.

Задача 17. Дискретная случайная величина задана законом распределения вероятностей

Тогда ее функция распределения вероятностей имеет вид…

По определению F ( x )= P ( X x ).

Тогда
а) при , F ( x )= P ( X , F ( x )= P ( X =1)=0,2,
в) при ,

F ( x )= P ( X =1)+ P ( X =2)=0,2+0,1=0,3,
г) при ,

F ( x )= P ( X =1)+ P ( X =2)+ P ( X =4)=0,2+0,1+0,3=0,6,
д) при x > 6,

F(x)=P(X=1)+ P(X=2)+P(X=4)+P(X=6)=1.
Следовательно,

Задача 18. Даны две независимые дискретные случайные величины X и Y :

Решение.

Тогда закон распределения вероятностей суммы X + Y имеет вид…

Задача 19. Основная гипотеза имеет вид H ₀ : σ 2 =4. Тогда конкурирующей может являться гипотеза…

Конкурирующей (альтернативной) называют гипотезу, которая противоречит основной гипотезе. Условию σ 2 =4 противоречит H ₁ :σ 2 >4.

Задача 20. При построении выборочного уравнения парной регрессии вычислены: выборочный коэффициент корреляции r _В =0,85 и выборочные средние квадратические отклонения σ _X =3,2 σ _Y =1,6. Тогда выборочный коэффициент регрессии X на Y равен…

Выборочный коэффициент регрессии X на Y вычисляется по формуле: . Тогда .

Задача 21. Выборочное уравнение парной регрессии имеет вид y =-1,56-2,3 x .

Тогда выборочный коэффициент корреляции может быть равен…

(Варианты ответа: |1,56 | — 0,87 | — 2,3 | 0,87)

Значение выборочного коэффициента корреляции, во-первых, принадлежит промежутку [-1,1], а во-вторых, его знак совпадает со знаком выборочного коэффициента регрессии. Этим условиям удовлетворяет значение -0,87.

Задача 22. Выборочное уравнение парной регрессии имеет вид y =6-3 x . Тогда выборочный коэффициент корреляции может быть равен…

( Варианты ответов: 0,9 | -3,0 | 6,0 | — 0,9 )

Задача 23. Выборочное уравнение парной регрессии имеет вид y =-5+2 x . Тогда выборочный коэффициент регрессии равен…

Если выборочное уравнение парной регрессии имеет вид y =α+β x , то выборочный коэффициент регрессии равен β. То есть β=2.

Задача 24. При построении выборочного уравнения парной регрессии вычислены: выборочный коэффициент корреляции r _В =0,75 и выборочные средние квадратические отклонения σ _X =1,1 σ _Y =2,2. Тогда выборочный коэффициент регрессии X на Y равен…

Выборочный коэффициент регрессии X на Y вычисляется по формуле: . Тогда .

Задача 25. Мода вариационного ряда 1,2,2,3,3,3,4 равна…

Модой вариационного ряда называется варианта, имеющая наибольшую частоту. Такой вариантой является варианта 3, частота которой равна

Задача 26. Медиана вариационного ряда 3,4,5,6,7,12 равна…

Медианой вариационного ряда называется варианта, расположенная в середине вариационного ряда. Так как в середине ряда располагаются две варианты: 5 и 6, то медиана равна их средней арифметической 5,5.

Задача 27. Размах варьирования вариационного ряда 3,5,5,7,9,10,16 равен…

Размах варьирования вариационного ряда определяется как R = x_max — x_min , то есть R =16-3=13.

Задача 28. В результате измерений некоторой физической величины одним прибором (без систематических ошибок) получены следующие результаты (в мм): 8, 10, 12. Тогда несмещенная оценка дисперсии равна…

Несмещенная оценка дисперсии вычисляется по формуле: , где . Вычислив предварительно , получаем: .

Задача 29. Из генеральной совокупности извлечена выборка объема n =20:

Тогда несмещенная оценка математического ожидания равна…

Несмещенная оценка математического ожидания вычисляется по формуле: . То есть .

Задача 30. Проведено пять измерений (без систематических ошибок) некоторой случайной величины (в мм): 9, 10, 11, 13, 14. Тогда несмещенная оценка математического ожидания равна…

Несмещенная оценка математического ожидания вычисляется по формуле: . То есть .

Задача 31. Дана интервальная оценка (8,45;9,15) математического ожидания нормально распределенного количественного признака. Тогда точечная оценка математического ожидания равна…

Интервальная оценка математического ожидания нормально распределенного количественного признака представляет собой интервал, симметричный относительно точечной оценки. Тогда точечная оценка будет равна .

Задача 32. Дана интервальная оценка (10,45;11,55) математического ожидания нормально распределенного количественного признака. Тогда точность этой оценки равна…

Точность интервальной оценки ( a ; b ) определяется как , то есть .

Задача 33. Из генеральной совокупности извлечена выборка объема n =50, гистограмма частот которой имеет вид:

Тогда значение a равно…

Так как объем выборки вычисляется как n =( a +7+5+3) h , то a =50/2-7-5-3=10.

Корреляция и регрессия

Линейное уравнение регрессии имеет вид y=bx+a+ε
Здесь ε — случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения ε_i для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям x_i и y_i можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где e_i – наблюдаемые значения (оценки) ошибок ε_i, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β — используют МНК (метод наименьших квадратов).
Система нормальных уравнений.

Для наших данных система уравнений имеет вид:

10a + 356b = 49
356a + 2135b = 9485

Из первого уравнения выражаем а и подставим во второе уравнение
Получаем b = 68.16, a = 11.17

Уравнение регрессии:
y = 68.16 x — 11.17

1. Параметры уравнения регрессии.
Выборочные средние.

1.1. Коэффициент корреляции
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 Y фактором X весьма высокая и прямая.

1.2. Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 68.16 x -11.17
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент уравнения регрессии показывает, на сколько ед. изменится результат при изменении фактора на 1 ед.
Коэффициент b = 68.16 показывает среднее изменение результативного показателя (в единицах измерения у ) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 68.16.
Коэффициент a = -11.17 формально показывает прогнозируемый уровень у , но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений x , то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения x , можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и x определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе — обратная). В нашем примере связь прямая.

1.3. Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
Для этих целей вычисляются коэффициенты эластичности и бета — коэффициенты. Коэффициент эластичности находится по формуле:

Он показывает, на сколько процентов в среднем изменяется результативный признак у при изменении факторного признака х на 1%. Он не учитывает степень колеблемости факторов.
В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами — Х существенно влияет на Y.
Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

Т.е. увеличение x на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего Y на 0.9796 среднеквадратичного отклонения этого показателя.

1.4. Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве регрессии.

1.6. Коэффициент детерминации.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R 2 = 0.98 2 = 0.9596, т.е. в 95.96 % случаев изменения x приводят к изменению у . Другими словами — точность подбора уравнения регрессии — высокая. Остальные 4.04 % изменения Y объясняются факторами, не учтенными в модели.

x	y	x 2	y 2	x·y	y(x)	(y_i— y ) 2	(y-y(x)) 2	(x_i— x ) 2	\|y — y_x\|:y
0.371	15.6	0.1376	243.36	5.79	14.11	780.89	2.21	0.1864	0.0953
0.399	19.9	0.1592	396.01	7.94	16.02	559.06	15.04	0.163	0.1949
0.502	22.7	0.252	515.29	11.4	23.04	434.49	0.1176	0.0905	0.0151
0.572	34.2	0.3272	1169.64	19.56	27.81	87.32	40.78	0.0533	0.1867
0.607	44.5	.3684	1980.25	27.01	30.2	0.9131	204.49	0.0383	0.3214
0.655	26.8	0.429	718.24	17.55	33.47	280.38	44.51	0.0218	0.2489
0.763	35.7	0.5822	1274.49	27.24	40.83	61.54	26.35	0.0016	0.1438
0.873	30.6	0.7621	936.36	26.71	48.33	167.56	314.39	0.0049	0.5794
2.48	161.9	6.17	26211.61	402	158.07	14008.04	14.66	2.82	0.0236
7.23	391.9	9.18	33445.25	545.2	391.9	16380.18	662.54	3.38	1.81

2. Оценка параметров уравнения регрессии.
2.1. Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=7 находим t_крит:
t_крит = (7;0.05) = 1.895
где m = 1 — количество объясняющих переменных.
Если t_набл > t_критич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку t_набл > t_крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим
В парной линейной регрессии t 2 _r = t 2 _b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:

S 2 _y = 94.6484 — необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S_y = 9.7287 — стандартная ошибка оценки (стандартная ошибка регрессии).
S _a — стандартное отклонение случайной величины a.

S_b — стандартное отклонение случайной величины b.

2.4. Доверительные интервалы для зависимой переменной.
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения.
Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a + bx_p ± ε) где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X _p = 1 (-11.17 + 68.16*1 ± 6.4554)
(50.53;63.44)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Индивидуальные доверительные интервалы для Y при данном значении X.
(a + bx _i ± ε)
где

x_i	y = -11.17 + 68.16x_i	ε_i	y_min	y_max
0.371	14.11	19.91	-5.8	34.02
0.399	16.02	19.85	-3.83	35.87
0.502	23.04	19.67	3.38	42.71
0.572	27.81	19.57	8.24	47.38
0.607	30.2	19.53	10.67	49.73
0.655	33.47	19.49	13.98	52.96
0.763	40.83	19.44	21.4	60.27
0.873	48.33	19.45	28.88	67.78
2.48	158.07	25.72	132.36	183.79

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
1) t-статистика. Критерий Стьюдента.
Проверим гипотезу H₀ о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H₁ не равно) на уровне значимости α=0.05.
t_крит = (7;0.05) = 1.895

Поскольку 12.8866 > 1.895, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Поскольку 2.0914 > 1.895, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b — t_крит S_b; b + t_крит S_b)
(68.1618 — 1.895 • 5.2894; 68.1618 + 1.895 • 5.2894)
(58.1385;78.1852)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a — t_a)
(-11.1744 — 1.895 • 5.3429; -11.1744 + 1.895 • 5.3429)
(-21.2992;-1.0496)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

2) F-статистики. Критерий Фишера.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с lang=EN-US>n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H₀: R 2 =0 на уровне значимости α.
2. Далее определяют фактическое значение F-критерия:

где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=7, Fkp = 5.59
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна).

Проверка на наличие автокорреляции остатков.
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию, можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.

Обнаружение автокорреляции

1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения e_i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения e_i (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скоре всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости e_i от e_i-1.

Выборочное уравнение прямой линии регрессии

Рассмотрим выборочное уравнение прямой линии среднеквадратичной регрессии Y на X в виде

, (7.3)

где – угловой коэффициент прямой линии регрессии, который называют выборочным коэффициентом регрессии Y на X; он является оценкой коэффициента регрессии (раздел 4.4).

Подберём параметры и b таким образом, чтобы точки , ,…, , построенные на плоскости XоY, лежали как можно ближе к прямой (7.3).

При использовании метода наименьших квадратов (МНК) смысл этого требования интерпретируется так: сумма квадратов отклонений должна быть минимальной. Под отклонением понимают разность , , где – вычисленная по уравнению (7.3) ордината наблюдаемого значения ; – наблюдаемая ордината, соответствующая .

Запишем это требование в виде функции:

Для отыскания минимума функции приравняем нулю соответствующие частные производные

;

Выполнив преобразования, получим систему

Решив данную систему, найдём искомые параметры

;

. (7.4)

Аналогично можно найти выборочное уравнение прямой линии регрессии X на Y.

. (7.5)

Пример. Найти уравнение прямой линии регрессии по данным наблюдений:

X	1,00	1,50	3,00	4,50	5,00
Y	1,25	1,40	1,50	1,75	2,25

Составляем расчётную таблицу:


1,00	1,25	1,00	1,250
1,50	1,40	2,25	2,100
3,00	1,50	9,00	4,500
4,50	1,75	20,25	4,875
5,00	2,25	25,00	11,250

Находим неизвестные параметры из уравнения прямой линии регрессии:

;

Записываем искомое уравнение:

Если данные наблюдений представлены в виде корреляционнной таблицы 6.1, то можно вычислить по формуле

. (7.6)

Умножим обе части равенства (7.6) на дробь , получим формулу (6.3) для вычисления r_в.

. (7.7)

Отсюда уравнение (7.3) можно записать через r_в:

. (7.8)

Аналогично уравнение (7.5) примет вид

. (7.9)

Выборочное уравнение нелинейной регрессии

Функции регрессии Y на X могут иметь вид, например, параболической корреляции второго порядка

, (7.10)

параболической корреляции третьего порядка

где A, B, C, D – неизвествные параметры.

Определить неизвестные параметры можно МНК. Для уравнения (7.9) неизвестные параметры A, B, C находят из решения системы линейных уравнений:

Пример. В. Е. Гмурман «Руководство к решению задач по теории вероятностей и математической статистике», стр. 276.

Элементы дисперсионного анализа

Общие сведения

Дисперсионный анализ применяют, чтобы установить:

— оказывает ли существенное влияние некоторый качественный фактор , который имеет уровней на изучаемую величину ;

— являются ли однородными несколько совокупностей, т.к. однородные совокупности можно объединить в одну и тем самым получить о ней более полную информацию.

Суть дисперсионного анализасостоит в сравнении «факторной дисперсии» (т.е. межгрупповой), обусловленной воздействием фактора, и «остаточной дисперсии» (т.е. внутригрупповой), порождаемой случайными причинами по критерию Фишера-Снедекора.

Различают дисперсионный анализ:

— однофакторный, если исследуется влияние одного фактора на изучаемую СВ;

— многофакторный, если исследуется воздействие нескольких факторов.

Рассмотрим случай однофакторного дисперсионного анализа, когда на изучаемую величину влияет только один фактор, который имеет постоянных уровней.