Пример 1 . По данной корреляционной таблице построить прямые регрессии с X на Y и с Y на X . Найти соответствующие коэффициенты регрессии и коэффициент корреляции между X и Y .
y/x | 15 | 20 | 25 | 30 | 35 | 40 |
100 | 2 | 2 | ||||
120 | 4 | 3 | 10 | 3 | ||
140 | 2 | 50 | 7 | 10 | ||
160 | 1 | 4 | 3 | |||
180 | 1 | 1 |
Решение:
Уравнение линейной регрессии с y на x будем искать по формуле
а уравнение регрессии с x на y, использовав формулу:
где x x , y — выборочные средние величин x и y, σx, σy — выборочные среднеквадратические отклонения.
Находим выборочные средние:
x = (15(1 + 1) + 20(2 + 4 + 1) + 25(4 + 50) + 30(3 + 7 + 3) + 35(2 + 10 + 10) + 40(2 + 3))/103 = 27.961
y = (100(2 + 2) + 120(4 + 3 + 10 + 3) + 140(2 + 50 + 7 + 10) + 160(1 + 4 + 3) + 180(1 + 1))/103 = 136.893
Выборочные дисперсии:
σ 2 x = (15 2 (1 + 1) + 20 2 (2 + 4 + 1) + 25 2 (4 + 50) + 30 2 (3 + 7 + 3) + 35 2 (2 + 10 + 10) + 40 2 (2 + 3))/103 — 27.961 2 = 30.31
σ 2 y = (100 2 (2 + 2) + 120 2 (4 + 3 + 10 + 3) + 140 2 (2 + 50 + 7 + 10) + 160 2 (1 + 4 + 3) + 180 2 (1 + 1))/103 — 136.893 2 = 192.29
Откуда получаем среднеквадратические отклонения:
и
Определим коэффициент корреляции:
где ковариация равна:
Cov(x,y) = (35•100•2 + 40•100•2 + 25•120•4 + 30•120•3 + 35•120•10 + 40•120•3 + 20•140•2 + 25•140•50 + 30•140•7 + 35•140•10 + 15•160•1 + 20•160•4 + 30•160•3 + 15•180•1 + 20•180•1)/103 — 27.961 • 136.893 = -50.02
Запишем уравнение линий регрессии y(x):
и уравнение x(y):
Построим найденные уравнения регрессии на чертеже, из которого сделаем следующие вывод:
1) обе линии проходят через точку с координатами (27.961; 136.893)
2) все точки расположены близко к линиям регрессии.
Пример 2 . По данным корреляционной таблицы найти условные средние y и x . Оценить тесноту линейной связи между признаками x и y и составить уравнения линейной регрессии y по x и x по y . Сделать чертеж, нанеся его на него условные средние и найденные прямые регрессии. Оценить силу связи между признаками с помощью корреляционного отношения.
Корреляционная таблица:
X / Y | 2 | 4 | 6 | 8 | 10 |
1 | 5 | 4 | 2 | 0 | 0 |
2 | 0 | 6 | 3 | 3 | 0 |
3 | 0 | 0 | 1 | 2 | 3 |
5 | 0 | 0 | 0 | 0 | 1 |
Уравнение линейной регрессии с y на x имеет вид:
Уравнение линейной регрессии с x на y имеет вид:
найдем необходимые числовые характеристики.
Выборочные средние:
x = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 5.53
y = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 1.93
Дисперсии:
σ 2 x = (2 2 (5) + 4 2 (4 + 6) + 6 2 (2 + 3 + 1) + 8 2 (3 + 2) + 10 2 (3 + 1))/30 — 5.53 2 = 6.58
σ 2 y = (1 2 (5 + 4 + 2) + 2 2 (6 + 3 + 3) + 3 2 (1 + 2 + 3) + 5 2 (1))/30 — 1.93 2 = 0.86
Откуда получаем среднеквадратические отклонения:
σx = 2.57 и σy = 0.93
и ковариация:
Cov(x,y) = (2•1•5 + 4•1•4 + 6•1•2 + 4•2•6 + 6•2•3 + 8•2•3 + 6•3•1 + 8•3•2 + 10•3•3 + 10•5•1)/30 — 5.53 • 1.93 = 1.84
Определим коэффициент корреляции:
Запишем уравнения линий регрессии y(x):
и вычисляя, получаем:
yx = 0.28 x + 0.39
Запишем уравнения линий регрессии x(y):
и вычисляя, получаем:
xy = 2.13 y + 1.42
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (5.53; 1.93) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=30-m-1 = 28 находим tкрит:
tкрит (n-m-1;α/2) = (28;0.025) = 2.048
где m = 1 — количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим.
Пример 3 . Распределение 50 предприятий пищевой промышленности по степени автоматизации производства Х (%) и росту производительности труда Y (%) представлено в таблице. Необходимо:
1. Вычислить групповые средние i и j x y, построить эмпирические линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
б) вычислить коэффициент корреляции; на уровне значимости α= 0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными Х и Y;
в) используя соответствующее уравнение регрессии, оценить рост производительности труда при степени автоматизации производства 43%.
Скачать решение
Пример . По корреляционной таблице рассчитать ковариацию и коэффициент корреляции, построить прямые регрессии.
Пример 4 . Найти выборочное уравнение прямой Y регрессии Y на X по данной корреляционной таблице.
Решение находим с помощью калькулятора.
Скачать
Пример №4
Пример 5 . С целью анализа взаимного влияния прибыли предприятия и его издержек выборочно были проведены наблюдения за этими показателями в течение ряда месяцев: X — величина месячной прибыли в тыс. руб., Y — месячные издержки в процентах к объему продаж.
Результаты выборки сгруппированы и представлены в виде корреляционной таблицы, где указаны значения признаков X и Y и количество месяцев, за которые наблюдались соответствующие пары значений названных признаков.
Решение.
Пример №5
Пример №6
Пример №7
Пример 6 . Данные наблюдений над двумерной случайной величиной (X, Y) представлены в корреляционной таблице. Методом наименьших квадратов найти выборочное уравнение прямой регрессии Y на X. Построить график уравнения регрессии и показать точки (x;y)б рассчитанные по таблице данных.
Решение.
Скачать решение
Пример 7 . Дана корреляционная таблица для величин X и Y, X- срок службы колеса вагона в годах, а Y — усредненное значение износа по толщине обода колеса в миллиметрах. Определить коэффициент корреляции и уравнения регрессий.
X / Y | 0 | 2 | 7 | 12 | 17 | 22 | 27 | 32 | 37 | 42 |
0 | 3 | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 25 | 108 | 44 | 8 | 2 | 0 | 0 | 0 | 0 | 0 |
2 | 30 | 50 | 60 | 21 | 5 | 5 | 0 | 0 | 0 | 0 |
3 | 1 | 11 | 33 | 32 | 13 | 2 | 3 | 1 | 0 | 0 |
4 | 0 | 5 | 5 | 13 | 13 | 7 | 2 | 0 | 0 | 0 |
5 | 0 | 0 | 1 | 2 | 12 | 6 | 3 | 2 | 1 | 0 |
6 | 0 | 1 | 0 | 1 | 0 | 0 | 2 | 1 | 0 | 1 |
7 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 |
Решение.
Скачать решение
Пример 8 . По заданной корреляционной таблице определить групповые средние количественных признаков X и Y. Построить эмпирические и теоретические линии регрессии. Предполагая, что между переменными X и Y существует линейная зависимость:
- Вычислить выборочный коэффициент корреляции и проанализировать степень тесноты и направления связи между переменными.
- Определить линии регрессии и построить их графики.
Скачать
Видео:9 класс, 7 урок, Уравнение прямойСкачать
Элементы теории корреляции. Линейная корреляция
Мы ввели понятия функции регрессии Y на Х: φ(х) = М(Y|Х = х), аналогично можно ввести понятие функции регрессии Х на Y: f(х) = М(Х|Y = у). Уравнения: φ(х) = М(Y|х) и f(у) = М(Х|у) называются уравнениями регрессии, а их графики – линиями регрессии. Левые части, т.е. условные математические ожидания генеральной совокупности, могут быть неизвестны. В таком случае их оценивают соответствующими параметрами, найденными по выборке: φ * (х)= – условная средняя; f * (у) = у – условная средняя. Эти уравнения являются уравнениями регрессии, а их графики линиями регрессии.
Если обе линии регрессии Y на X и X на Y — прямые, то корреляцию называют линейной.
Выборочное уравнение прямой линии регрессии Y на X имеет вид:
где – условная средняя; – выборочные средние признаков X и Y; – выборочные средние квадратические отклонения; — выборочный коэффициент корреляции, причем
.
Выборочное уравнение прямой линии регрессии X на Y имеет вид
.
Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами, то для поиска линий регрессии целесообразно перейти к условным вариантам:
,
где С1 – «ложный нуль» вариант X (новое начало отсчета); в качестве ложного нуля выгодно принять варианту, которая расположена примерно в середине вариационного ряда (условимся принимать в качестве ложного нуля варианту, имеющую наибольшую частоту); h1 – шаг, т.е. разность между двумя соседними вариантами Х; С2 – «ложный нуль» вариант Y; h2 – шаг вариант Y.
В этом случае выборочный коэффициент корреляции
.
Величины могут быть найдены либо методом произведений (при большом числе данных), либо непосредственно по формулам:
Зная эти величины, можно определить входящие в уравнение регрессии величины по формулам:
для оценки силы линейной корреляционной связи служит выборочный коэффициент корреляции rB.
Методические рекомендации для выполнения пятого задания
и решение задания нулевого варианта
Задание 5.По заданной таблице 1:
а) найти выборочный коэффициент корреляции и проверить его значимость при α = 0.05;
б) найти уравнение выборочной линии регрессии;
в) построить график линии регрессии и сопоставить ее с графиком линии, построенной с помощью средних;
Решение.
а) Найдем выборочный коэффициент корреляции и проверим его значимость. Для этого составим сначала таблицу 2 по условным вариантам, приняв С1 = 13, h1 = 2, C2 = 4, h2 = 1.
V | U | |
-2 | -1 | nv |
-3 | ||
-2 | ||
-1 | ||
nu | n = 100 |
По таблице 2 найдем выборочные , ,σu, σv.
Cоставим таблицу 3.
V | U | |||
-2 | -1 | ΣnuvU | vU | |
-3 | -18 -27 | -1 -3 | -19 | |
-2 | -16 -16 | -12 -24 | -2 | -28 |
-1 | -7 -7 | -26 | -2 | -5 |
V=ΣnuvU | -43 | -34 | -24 | ΣvU=142 |
UV | ΣnV=142 |
По таблице 3 найдем выборочный коэффициент корреляции rB.
Для проверки значимости выборочного коэффициента корреляции выдвинем гипотезу Н0: rг = 0 и подберем критерий для ее проверки ;
Проверим гипотезу по этапам:
Этап 1. Нулевая гипотеза Н0: rг = 0, конкурирующая Н0: rг ≠ 0.
Этап 2. Зададимся уровнем значимости α = 0.05 (задан по условию).
Этап 3. Воспользуемся критерием и найдем его численное значение при n = 100 и rB = 0.75;
Этап 4. Найдем критическую область, которая является двусторонней, для чего воспользуемся таблицей и найдем tкр. = 1.98. Таким образом, критической областью является совокупность двух областей (- ∞; — 1.98) и (1.98; ∞).
Этап 5. Так как численное значение критерия принадлежит критической области, то выборочный коэффициент корреляции значим, что подтверждает факт корреляционной зависимости между Х и Y.
б) Найдем уравнение выборочной линии регрессии Y на Х в виде , для чего воспользуемся формулами:
Подставим найденные значения в искомое уравнение регрессии, получим: или .
в) Построим график линии регрессии и сопоставим ее с графиком линии, построенной с помощью средних, т.е. проверим согласованность, сравнивая средние, вычисленные: а) по условию; б) по корреляционной таблице.
x1 = 9
х2 = 11
х3 = 13
х4 = 15
х5 = 17
Для сравнения составим таблицу 4.
По уравн. | -0,04 | 1,78 | 3,6 | 5,42 | 7,24 |
По таблице | 1,47 | 2,3 | 3,35 | 4,55 | 5,25 |
Изобразим данные на графике.
Тексты вариантов контрольной работы
Вариант 1:
Задание 1. По заданной выборке генеральной совокупности, распределенной нормально, выполнить следующие задания:
1) составить статистический ряд частот и относительных частот;
2) построить графики статистических рядов (полигон частот и гистограмму относительных частот);
3) составит накопительную таблицу для эмпирической функции распределения;
4) вычислить числовые характеристики выборки: среднее выборочное, выборочную и исправленную дисперсию, выборочное среднее квадратическое отклонение методами произведений и сумм.
n = 200, начало первого интервала 59, длина интервала 2.
Задание 2. Из нормально распределенной генеральной совокупности осуществлена выборка (с первое задание). Найти доверительный интервал для генеральной средней по заданной доверительной вероятности γ = 0,95:
Видео:Математика без Ху!ни. Уравнения прямой. Часть 1. Уравнение с угловым коэффициентом.Скачать
Уравнение прямой линии регрессии x на y имеет вид
Запрошуємо усіх хто любить цікаві задачі та головоломки відвідати групу! Зараз діє акція — підтримай студента! Знижки на роботи + безкоштовні консультації.