Коэффициент корреляции уравнение регрессии шкала чеддока

Шкала Чеддока-Снедекора. Что это, коэффициент корреляции, оценка детерминации

Для оценки коэффициента линейной корреляции, ее множественного индекса или определения статистических зависимостей количественных показателей от качественных характеристик применяют шкалу Чеддока. Она условна, но широко используется в эконометрике, при построении сложных и многофакторных математических моделей.

Шкала Чеддока, как качественная статистическая характеристика в технико-экономических исследованиях успешно применяется в медицине, экономике, маркетинге и социологии.

На практике в медицине шкала Чеддока чаще всего применяется при расчёте математической статистики и вычисления вероятности событий. Например, при изучении общественного состояния здоровья населения или для углубленного изучения заболеваемости или смертности, в зависимости от возраста и пола, от какого-нибудь заболевания.

Видео:Расчет коэффициента корреляции в ExcelСкачать

Расчет коэффициента корреляции в Excel

Соотношение Чеддока

Базисным научным подходом служит убеждение в том, что ни одно событие не происходит случайно. Математические или статистические закономерности никогда не рассматривают изолированно, обособлено, вне зависимости от влияющих факторов. Любое событие априори считается результатом совместного воздействия множества сил или обстоятельств.

К примеру, на уровень продаж в среднестатистическом магазине влияют:

  • площадь торгового помещения;
  • уровень освещенности;
  • профессионализм персонала и менеджерского состава;
  • витринная экспозиция товара;
  • дополнительные услуги и сервис;
  • покупательная способность населения;
  • другие скрытые, неявные и неочевидные факторы.

Еще одним показательным примером служит количество детей в семье.

Оно зависит от:

  • продолжительности супружеской жизни;
  • религиозных взглядов родителей;
  • материального состояния;
  • социального статуса;
  • репродуктивного здоровья;
  • социально-культурных и этнических особенностей.

Шкала Чеддока (коэффициент корреляции определяет зависимости в точном числовом выражении) позволяет с математической достоверностью оценить уровня влияния каждого фактора в отдельности, степень их совместного воздействия на изучаемый показатель или событие. Коэффициент корреляции уравнение регрессии шкала чеддока

Соотношение результативных признаков дает возможность переводить любой числовой показатель или количественное значение в качественный параметр. Зависимости шкалы Чеддока-Снедекора приведены в таблице.

Корреляционный коэффициент0,1-0,30,4-0,50,6-0,70,8-0,90,91-0,99
Характеристика связиНезначительнаяУмереннаяОщутимаяВысокаяСильная

Математическое соотношение используют для построения одно- или многофакторных линейных моделей при статистическом анализе. Такие модели позволяют определить наличие взаимосвязи рассматриваемых переменных, характеристик, силу влияния или взаимосвязи.

Шкалу Чеддока используют для точного определения ковариационного момента в теории вероятностей, математической статистике, эконометрической сфере. Коэффициент позволяет установить линейную, обратную или квадратную зависимость случайных величин.

Способ обработки больших массивов статистических данных с точным определением тесноты прямой либо обратной связи различных параметров называют корреляционным анализом. Его невозможно выполнять без соотношения Чеддока-Снедекора.

Видео:Как вычислить линейный коэффициент корреляции в MS Excel и построить уравнение регрессии?Скачать

Как вычислить линейный коэффициент корреляции в MS Excel  и построить уравнение регрессии?

Коэффициенты корреляции зависимости от типов измерительных шкал

В сфере статистического анализа применяют специальные постоянные значения, которые позволяют точно установить взаимосвязь между переменными показателями, измеренными с помощью различных шкал.

Это своеобразное приведение к единому знаменателю. К переменным x и y, вычисляемым в дихотомической шкале, применяют коэффициент ассоциаций Пирсона. Если только одна из непостоянных величин дихотомическая (двоичная) используют точечное двухрядное корреляционное значение.

Виды шкал, в которых применяют соотношение Чеддока-Снедекора:

  • X-признаков. Представляет собой способ организации переменных величин в наборах данных, свойств, значений и характеристик для различных статистических наблюдений – метеорологических, медицинских, товарно-сырьевых.
  • Интервальная. Отображает разницу между значениями, которые можно рассчитать, но эти соотношения лишены статистического смысла. Интервальная шкала имеет сочетанные свойства номинальной и порядковой математической схемы. Ее используют для вычисления количественного изменения признака или объекта на заданном временном отрезке. Пример – измерение температуры морской воды. Утром она +19°С, к вечеру повышается до +24°С, то есть становится в 1,26 раз больше.
  • Ранговая. Используют для классификации признаков, свойств, событий или объектов по принципу «больше-меньше», «теплее-холоднее», «выше-ниже». При измерениях в такой шкале изучаемым объектам присваивают числовое значение в соответствии с выраженностью вычисляемого свойства. Его определяют с помощью соотношения Чеддока-Снедекора.
  • Номинальная. Содержит исключительно данные, которые не могут быть упорядочены. С ними не производят арифметические действия. Такую шкалу используют для сортировки массивов статистических данных или объектов по общему признаку. К значениям применяют бисерально-точечный коэффициент корреляции согласно соотношению Чеддока-Снедекора.

При обеих дихотомических переменных используют четырехполевую зависимость в соответствии со шкалой, по которой производились вычисления. Нелинейная взаимосвязь изучаемых объектов лишает смысла введение корреляционной зависимости.

Видео:Математика #1 | Корреляция и регрессияСкачать

Математика #1 | Корреляция и регрессия

Что такое Шкала Чеддока

Аналитическая группировка количественных данных, качественных характеристик или изучаемых свойств объектов позволяет построить график эмпирической связи между несколькими переменными.

Коэффициент корреляции уравнение регрессии шкала чеддокаШкала Чеддока-Снедекора

Шкала Чеддока коэффициент корреляции отображает в числовом выражении. Если он равен или больше 0,7313, влияние фактора либо взаимосвязь свойств считают высокой. Шкалу применяют при вычислении регрессивного (обратного) соотношения показателей.

Геометрический смысл корреляционного коэффициента демонстрирует различие в угле наклона и траектории осей x и y при графическом отображении зависимости. Линейное соотношение указывает на наличие прямой связи переменных или их взаимного влияния.

Оно принимает значение от -1 до +1. Первый показатель означает регрессивную связь, второй – прямую. Шкала Чеддока – это соотношение между случайными факторами или переменными величинами, позволяющее переводить качественные характеристики объектов в относительно точное числовое значение.

В сфере статистического анализа особый смысл имеет расчет множественного корреляционного коэффициента. Он отражает тесноту прямой или линейной связи основной переменной с несколькими влияющими факторами, рассматриваемыми в совокупности.

Множественный коэффициент корреляции, определяемый с помощью шкалы Чеддока-Снедекора, позволяет привести к единому знаменателю результативные признаки и факторные.

Для вычисления остаточной общей суммы квадратов погрешностей или отклонений применяют формулу ∑(yi-yx) 2 . Построение регрессионных математических моделей с вычислениями по шкале Чеддока актуально при создании прогностических систем.

В них учитывают только допустимые значения факторных признаков или независимых переменных. Формула Чеддока-Снедекора позволяет предсказать показатель Y при любом отклонении линии Х на графике взаимосвязи.

При прогнозировании среднегодового уровня продаж определенного товара или расчете экономических показателей предприятия за отчетный период можно вычислить соответствие переменных y и x на любом отрезке времени с графическим представлением зависимости.

Видео:Эконометрика Линейная регрессия и корреляцияСкачать

Эконометрика  Линейная регрессия и корреляция

Правила ввода данных

Применяют группировку значений по общим характеристикам или сортировку статистического массива по одному признаку в номинальной шкале. Правила ввода данных различаются в зависимости от выстраиваемой модели, используемых математической системы, способа обработки.

Для формульных, табличных и графических представлений принципы заполнения информацией используют разные. Правила группировки данных облегчают статистическую обработку.

При сортировании двоичных совокупностей числовые значения классифицируют для учета каждого значения одновременно по обоим интервалам. Их размещают на пересечении соответствующих строк и столбцов.

Правила техники группирования данных для использования в вычислениях по шкале Чеддока-Снедекора:

  1. Подобрать подходящее интервальное значение для каждой переменной.
  2. Нанести найденные показатели на соответствующие координатные оси графического отображения.
  3. Провести от каждой точки соединяющие и направляющие линии для создания рабочей координатной сетки.
  4. Поместить каждую пару связанных переменных величин в соответствующую клетку корреляционного поля, присвоив указывающую на свойства отметку.
  5. Суммировать значения в строках и столбцах для получения маргинальных вычислений.

В формульные и табличные корреляционные системы вводить значения проще, чем в графические. Нужно всего лишь подставить необходимый коэффициент из приведенной выше шкалы зависимостей.

Видео:Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессияСкачать

Корреляция: коэффициенты Пирсона и Спирмена, линейная регрессия

Показатели корреляции и детерминации

Соотношение Чеддока-Снедекора применяют при анализе массивов статистических данных, изучении практической значимости влияющих факторов или свойств объектов. Его используют построении синтезированных моделей для прогнозирования событийной вероятности. Коэффициент корреляции уравнение регрессии шкала чеддока

Шкала Чеддока позволяет дать качественную оценку тесноте связи или взаимного влияния переменных величин. Коэффициент бинарной корреляции имеет особое значение в регрессивных вычислениях степени обратного воздействия результативных признаков на предмет исследования.

В таких расчетах не обойтись без дополнительного показателя. В этом качестве в формулу вводят коэффициент детерминации, который всегда равен квадрату корреляционного показателя. Дополнительный параметр записывают в неизменном виде R 2 .

Показатель детерминации в математических моделях представляет собой долю дисперсии – диапазона возможного разброса цифровых значений случайной переменной относительно вычислительного ожидания.

Коэффициент детерминации получают из известной величины корреляционного показателя, подобранного по шкале Чеддока-Снедекора. Величину рассматривают в качестве универсальной формульной меры зависимостей одной случайной переменной от ряда прочих.

Частный случай показателя детерминации – отношение R 2 линейного, бинарного или множественного корреляционного коэффициента зависимого объекта к факторным величинам.

Такая формула справедлива исключительно для моделей с известным постоянным значением результативного признака. При вычислении двоичной обратной связи (регрессии) значение квадрата корреляционного показателя, называемого индексом детерминации, располагается в диапазоне от -1 до +1.

Для расчета парной регрессии с константой применяют формулу общего вида SStot=SSreg+SSres. По результатам вычислений делают вывод о силе связи или взаимного влияния изучаемых факторов.

Показатель детерминации демонстрирует цифровое значение доли вариации результативного признака объекта или события. При интерпретации величины R 2 коэффициента корреляции его представляют в процентном выражении.

К примеру, 0,847 2 = 0,7174 означает, что в 71,74% случаев при изменении факторного показателя результативный признак приобретает соответствующее значение. Уравнение отличает высокая точность при правильном подборе значений по шкале Чеддока-Снедекора. Коэффициент корреляции уравнение регрессии шкала чеддока

Оставшиеся 28,26% показателя детерминации приходятся на неучтенные в модели факторы. При отсутствии заметной статистической связи между корреляционными коэффициентами переменных для вычисления асимптотического распределения используют уравнение х 2 (К-1), где К – количество влияющих факторов.

Видео:Коэффициент корреляции. Статистическая значимостьСкачать

Коэффициент корреляции.  Статистическая значимость

Средняя ошибка аппроксимации

В социологических исследованиях, медицинской статистике, эконометрике значения силы взаимного влияния или степени устойчивости зависимостей часто рассчитывают с использованием замены объектов родственными и упрощенными.

Такой метод научного поиска называют аппроксимацией. Она позволяет изучать количественные характеристики, качественные свойства, факторные признаки с большей точностью и меньшим уровнем погрешности.

В теории чисел с помощью аппроксимации исследуют диофантовы приближения. В геометрии метод замены применяют при рассмотрении пересекающихся ломаных кривых. В эконометрической дисциплине распространены вычисления с применением средней ошибки аппроксимации.

Так называют диапазон отклонений расчетных величин зависимой переменной от фактического значения. Метод имеет особое значение в уравнениях линейной бинарной регрессии.

Качественные характеристики результирующего или влияющего фактора в разных математических моделях оценивают с помощью средней либо абсолютной ошибки аппроксимации.

Не превышающее 5-7% погрешности значение свидетельствует о правильном подборе соотношения уравнения с исходными данными. Если средняя ошибка аппроксимации выходит за пределы указанного диапазона, формулу не используют для статистических вычислений.

Шкала Чеддока (коэффициент корреляции, отклоняющийся менее, чем на 1% от показателя 1,00 гласит о стойкой функциональной связи объектов, событий или свойств) позволяет приблизить объем совокупности к фактическому значению результативного признака. Коэффициент корреляции уравнение регрессии шкала чеддока

Показатель всегда отличается от теоретической величины, рассчитанной с применением уравнения парной регрессии. В редких случаях ошибка аппроксимации изначально равна нулю. Допустимый предел погрешности составляет 8-10%.

Видео:Как вычислить линейный коэффициент корреляции по таблице? Корреляционное поле и прямая регрессииСкачать

Как вычислить линейный коэффициент корреляции по таблице? Корреляционное поле и прямая регрессии

Отрицательные значения

Любую вычисленную статистическую величину с коэффициентом корреляции подвергают математическому испытанию на достоверность. Совокупность наблюдений или массивов разнородных данных представляет собой определенную выборку, в которой есть погрешности.

Поэтому такие расчеты воспринимают не абсолютной истиной, а относительно точной оценкой влияющих факторов, качественных характеристик объектов, степени связи факторов.

Отрицательные значения при вычислениях с применением шкалы Чеддока типичны для регрессивных моделей, целью которых служит установление обратной связи между объектами исследования в точном цифровом выражении. Коэффициент корреляции в таких уравнениях может принимать значения от -1 до 0.

Видео:Коэффициент корреляции, уравнение прямой регрессии, элементы математической статистикиСкачать

Коэффициент корреляции, уравнение прямой регрессии, элементы математической статистики

Видео о шкале Чеддока-Снедекора

Видео:Множественный и частные коэффициенты корреляцииСкачать

Множественный и частные коэффициенты корреляции

Расчет коэффициента корреляции

Видео:Коэффициент корреляции Пирсона в ExcelСкачать

Коэффициент корреляции Пирсона в Excel

Методы расчета коэффициента корреляции

При изучении различных социально-экономических явлений выделяют функциональную связь и стохастическую зависимость. Функциональная связь — это такой вид связи, при которой некоторому взятому значению факторного показателя соответствует лишь одно значение результативного показателя. Функциональная связь проявляется во всех случаях исследования и для каждой определенной единицы анализируемой совокупности.

Размещено на www.rnz.ru

В том случае, когда причинная зависимость действует не в каждом конкретном случае, а в общем для всей наблюдаемой совокупности, среднем при значительном количестве наблюдений, то такая зависимость является стохастической. Частным случаем стохастической зависимости выступает корреляционная связь, при которой изменение средней величины результативного показателя вызвано изменением значений факторных показателей. Расчет степени тесноты и направления связи выступает значимой задачей исследования и количественной оценки взаимосвязи различных социально-экономических явлений. Определение степени тесноты связи между различными показателями требует определение уровня соотношения изменения результативного признака от изменения одного (в случае исследования парных зависимостей) либо вариации нескольких (в случае исследования множественных зависимостей) признаков-факторов. Для определения такого уровня используется коэффициент корреляции.

Линейный коэффициент корреляции был впервые введен в начале 90-х гг. XIX в. Пирсоном и показывает степень тесноты и направления связи между двумя коррелируемыми факторами в случае, если между ними имеется линейная зависимость. При интерпретации получаемого значения линейного коэффициента корреляции степень тесноты связи между признаками оценивается по шкале Чеддока, один из вариантов этой шкалы приведен в нижеследующей таблице:

Шкала Чеддока количественной оценки степени тесноты связи

Величина показателя тесноты связиХарактер связи
До |±0,3|Практически отсутствует
|±0,3|-|±0,5|Слабая
|±0,5|-|±0,7|Умеренная
|±0,7|-|±1,0|Сильная

При интерпретации значения коэффициента линейной корреляции по направлению связи выделяют прямую и обратную. В случае наличия прямой связи с повышением или снижением величины факторного признака происходит повышение или снижение показателей результативного признака, т.е. изменение фактора и результата происходит в одном направлении. Например, повышение величины прибыли способствует росту показателей рентабельности. При наличии обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с динамикой факторного признака. Например, с повышением производительности труда уменьшается себестоимость единицы выпускаемой продукции и т.п.

Видео:Множественный и частные коэффициенты корреляцииСкачать

Множественный и частные коэффициенты корреляции

Формула расчета коэффициента корреляции

В теории разработаны и на практике применяются различные модификации формул для расчета данного коэффициента. Общая формула для расчета коэффициента корреляции имеет следующий вид:

Коэффициент корреляции уравнение регрессии шкала чеддокаФормула расчета коэффициента корреляции

где r — линейный коэффициент корреляции.

Опираясь на математические свойства средней, общую формулу можно представить следующим образом, получив следующее выражение:

Коэффициент корреляции уравнение регрессии шкала чеддокаФормула расчета линейного коэффициента парной корреляции

Выполняя дальнейшие преобразование, можно получить следующие формулы вычисления коэффициента корреляции Пирсона:

Коэффициент корреляции уравнение регрессии шкала чеддокаФормула расчета коэффициента корреляции Пирсона

где n — число наблюдений.

Выполняя вычисление по итоговым данным для расчета показателя корреляции, его можно рассчитать с использованием следующих формул:

Коэффициент корреляции уравнение регрессии шкала чеддокаПирсон онлайн

Методом расчета показателя корреляции является вычисление данного показателя с использованием его взаимосвязи с дисперсиями факторного и результативного признаков по следующей формуле:

Коэффициент корреляции уравнение регрессии шкала чеддокаФормула расчета коэффициента корреляции через дисперсии

Последние три приведенные формулы используются для изучения взаимосвязи между признаками в совокупностях незначительной величины — до 30 наблюдений.

Также показатель тесноты связи можно определить на основе его взаимосвязи с показателями уравнения регрессии, используя следующее отношение:

Коэффициент корреляции уравнение регрессии шкала чеддокаФормула расчета коэффициента корреляции через показатели регрессии

где аi — коэффициент регрессии в уравнении связи;

σхi — среднее квадратическое отклонение соответствующего статистически существенного факторного признака.

Линейный коэффициент корреляции несет в себе важную информацию для успешного изучения социально-экономических явлений и процессов, распределение которых близко к нормальному. Теоретически является обоснованным, что условие rxy = 0 является необходимым и достаточным для того, чтобы факторный и результативный признаки x и y являлись независимыми. При указанном условии, когда показатель корреляции равен нулю, показатели регрессии также имеют нулевые значения, а прямые линии регрессии у по х и х по у являются взаимно перпендикулярными на графике (параллельными: одна прямая — оси х, а другая прямая — оси y).

В том случае, когда rxy = 1, то это означает, что все точки (х, у) расположены на прямой и зависимость между х и у относится к функциональным. При указанном условии прямые линии регрессии совпадают. Указанное положение действует также в случае исследования трех и более показателей, если они подчинены закону нормального распределения.

В целом значение линейного показателя связи находится в диапазоне от — 1 до 1, т.е.: -1

Видео:Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)Скачать

Простые показатели качества модели регрессии (R2, критерии Акаике и Шварца)

Пример расчета коэффициента корреляции

Приведем пример расчета коэффициента корреляции Пирсона для значений, приведенных в следующей таблице. Для этого используем следующие данные (пример условный):

Значение показателя XЗначение показателя Y
1,11,3
1,91,1
1,51,2
1,90,5
1,91,5
1,11,7
0,92
10,9
1,31,2
1,51,7

Количество наблюдений менее 30, поэтому в нашем примере для расчета парного коэффициента корреляции используем следующую формулу:

Коэффициент корреляции уравнение регрессии шкала чеддока

Для этого составим вспомогательную таблицу:

№ п/пXYxyx 2y 2
11,11,31,431,211,69
21,91,12,093,611,21
31,51,21,82,251,44
41,90,50,953,610,25
51,91,52,853,612,25
61,11,71,871,212,89
70,921,80,814
810,90,910,81
91,31,21,561,691,44
101,51,72,552,252,89
Итого14,113,117,821,2518,87

Методология вычисления: r = (17,8-14,1*13,1/10)/(√((21,25-14,1*14,1/10)*(18,87-13,1*13,1/10))) = -0,4389.

Полученное значение коэффициента корреляции Пирсона говорит о наличии обратной связи между X и Y. Величина коэффициента корреляции Пирсона показывает, что связь между X и Y слабая.

Видео:Коэффициент детерминации. Основы эконометрикиСкачать

Коэффициент детерминации. Основы эконометрики

Онлайн калькулятор расчета коэффициента корреляции

В заключении приводим небольшой онлайн калькулятор расчета коэффициента корреляции онлайн, используя который, Вы можете самостоятельно выполнить расчет значения коэффициента корреляции Пирсона и получить интерпретацию рассчитанного значения. При заполнении формы калькулятора внимательно соблюдайте размерность полей, что позволит выполнить расчет коэффициента корреляции онлайн быстро и точно. В форме онлайн калькулятора уже содержатся данные условного примера, чтобы пользователь мог посмотреть, как это работает. Для определения значения показателя по своим данным просто внесите их в соответствующие поля формы онлайн калькулятора и нажмите кнопку «Выполнить вычисления». При заполнении формы соблюдайте размерность показателей! Дробные числа записываются с точной, а не запятой!

Онлайн-калькулятор расчета коэффициента корреляции:

Видео:Коэффициент корреляции ПирсонаСкачать

Коэффициент корреляции Пирсона

Простейшая обработка данных. Линейная регрессия.

Лабораторная работа №1.

Простейшая обработка данных. Линейная регрессия.

Коэффициент корреляции. Его значимость

Цель: научиться находить коэффициент корреляции и определять его начимость; находить коэффициенты регрессии и строить уравнение регрессии.

Основные сведения

Парная регрессия – это уравнение связи двух переменных у и х:

где у – зависимая переменная (результат, отклик);

х – независимая, объясняющая переменная (фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: Коэффициент корреляции уравнение регрессии шкала чеддока.

Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических у x минимальна.

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно а и в:

Коэффициент корреляции уравнение регрессии шкала чеддока

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

Коэффициент корреляции уравнение регрессии шкала чеддока

Коэффициент корреляции уравнение регрессии шкала чеддока.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции r xy для линейной регрессии Коэффициент корреляции уравнение регрессии шкала чеддока

Теснота линейной связи между переменными может быть оценена на основании шкалы Чеддока:

Значение коэффициента корреляции при наличии:

Прямой связиОбратной связиСлабая0,1 – 0,3(– 0,3) – (– 0,1)Умеренная0,3 – 0,5(– 0,5) – (– 0,3)Заметная0,5 – 0,7(– 0,7) – (– 0,5)Высокая0,7 – 0,9(– 0,9) – (– 0,7)Весьма высокая0,9 – 1(– 1) – (– 0,9)

Положительное значение коэффициента корреляции говорит о положительной связи между х и у, когда с ростом одной из переменных другая тоже растет. Отрицательное значение коэффициента корреляции означает, с ростом одной из переменных другая убывает, с убыванием одной из переменной другая растет.

Оценку статистической значимости коэффициента корреляции проводят с помощью t-критерия Стьюдента. Выдвигают гипотезу Н0 о статистически незначимом отличии коэффициента от нуля. Оценка значимости коэффициента корреляции с помощью t-критерия Стьюдента проводится путем сопоставления его значения с величиной случайной ошибки:

Стандартная (случайная) ошибка коэффициента корреляции определяется по формуле:

Коэффициент корреляции уравнение регрессии шкала чеддока.

Сравнивая фактическое и табличное (критическое) значения t-статистики –tтабл. и tфакт. – принимает или отвергаем гипотезу Н0.

Если tтабл. tфакт , то гипотеза Н0 не отклоняется и признается случайная природа формирования коэффициента корреляции.

Порядок выполнения работы.

По заданной выборке исследовать зависимость результата у от фактора х. Для этого

1. Создать таблицу данных.

2. Найти средние значения Коэффициент корреляции уравнение регрессии шкала чеддока, выборочные дисперсии Коэффициент корреляции уравнение регрессии шкала чеддокаисправленные средние квадратические отклонения Коэффициент корреляции уравнение регрессии шкала чеддока.

3. Найти коэффициент корреляции и проверить его значимость.

4. Найти коэффициенты линейного уравнения регрессии.

5. Построить график прямой регрессии.

Пример выполнения лабораторной работы.

В табл. 1.1 приведены данные об объеме производства у (тыс.ед.) в зависимости от численности занятых х (тыс.чел.) некоторой фирмы.

x111315182022242527
y151721202833343229

1. В диапазоне В3:C11 подготовим исходные данные.

2. Вводим следующие формулы:

ЯчейкаФормулаПримечание
D3=B3*C3Копируем диапазон D3:D11
E3=B3*B3Копируем диапазон E3:E11
F3=C3*C3Копируем диапазон F3:F11
B12=СРЗНАЧ(B3:B11)Копируем диапазон B12:F12
A17=E12 – B12*B12Выборочная средняя фактора
B17=F12 – C12*C12Выборочная средняя результата
A20=СТАНДОТКЛОН(B3:B11)Исправленное среднее квадратическое отклонение фактора
B20=СТАНДОТКЛОН(С3:С11)Исправленное среднее квадратическое отклонение результата

Получим следующие результаты (см. рис. 1.1).

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.1. Результаты простейшей обработки данных

3. Для определения коэффициента корреляции воспользуемся формулой Коэффициент корреляции уравнение регрессии шкала чеддока. Для этого в ячейку Е16 вводим формулу

=( D 12- B 12* C 12)/КОРЕНЬ( A 17* B 17)

Коэффициент корреляции уравнение регрессии шкала чеддока

Из расчетов следует, что коэффициент корреляции r=0,97. Это свидетельствует о том, что связь между объемом выпуска продукции и численностью занятых весьма высокая и положительная.

4. Для проверки значимости коэффициента корреляции введем вспомогательные данные:

К16 9 число предприятий;

К17 0,05 уровень значимости.

5. Далее вводим следующие формулы:

H19=КОРЕНЬ((1-E16*E16)/(K16-2))Стандартная ошибка
H20=E16/H19t — статистика
H21=СТЬЮДРАСПОБР(K17;K16 – 2)Критическое значение t — статистики
H22=ЕСЛИ(ABS(H20)>H21; «Значим»; «Незначим»)Вывод

Таким образом, получим данные, представленные на рис 1.2.

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.2. Анализ значимости коэффициента корреляции

6. Для определения коэффициентов уравнения линейной регрессии на

Коэффициент корреляции уравнение регрессии шкала чеддока

следует в ячейки I3, I4 ввести соответственно следующие формулы:

=(D12-B12*C12)/A17;

=C12-I3*B12.

Значение коэффициента b=1,47 говорит о том, что при увеличении численности занятых на 1 тыс.чел. объем продукции увеличится на 1,74 тыс.ед.

Результаты расчетов приведены на рис.1.3.

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.3. Результаты расчетов

7. Для построения графика выделим диапазон В3:С11. Вызовем Мастер диаграмм. Чтобы ось отражала фактические данные, выберем тип диаграммы Точечная. После чего нажмем кнопку Готово. На построенной диаграмме выделим график функции, щелкнув по нему левой кнопкой мыши. Выделение обозначается светлыми маркерами на функции. Нажав правую кнопку мыши, выведем контекстно-зависимое меню, в котором выберем опцию Добавить линию тренда. В окне Линия тренда по вкладке Тип выберем тип функции Линейная, а во вкладке Параметры – установим флажок показывать уравнение на диаграмме. В результате на диаграмме появиться вид теоретической кривой – тренда и ее уравнение (рис.1.4).

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.4. Графики фактических данных и построенной регрессии

8. Вычисление параметров регрессии с помощью статистических функций Excel:

КОРРЕЛ(массив1;массив2) вычисляет коэффициент корреляции между двумя переменными; значения первой из них приведены в диапазоне массив1, значения второй – в диапазоне массив2;

НАКЛОН(известные_значения_y;известные_значения_x) служит для определения коэффициента b;

ОТРЕЗОК(известные_значения_y;известные_значения_x) служит для определения коэффициента a.

C27=КОРРЕЛ(B3:B11;C3:C11)Коэффициент корреляции
C28=НАКЛОН(С3:С11;B3:B11)Коэффициент b
C29=ОТРЕЗОК(C3:C11;B3:B11)Коэффициент a

Встроенная статистическая функция ЛИНЕЙН определяет параметры линейной регрессии. Порядок вычислений следующий:

1) выделите область пустых ячеек 5х2 (5 строк, 2 столбца) с целью вывода результатов регрессионной статистики (А27:В3);

2) в главном меню выберите Вставка/Функция;

3) в строке Категория (рис.1.5) выберите Статистические, в окне ФункцияЛИНЕЙН. Щелкните ОК.

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.5. Диалоговое окно «Мастер функций»

4) Заполните аргументы функции (рис.1.6.):

Известные_значения_у – диапазон, содержащий данные результативного признака;

Известные_значения_х – диапазон, содержащий данные факторов независимого признака;

Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член равен 0.

Статистика – логическое значение, которое указывает выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводится только оценки параметров уравнения. Далее ОК.

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис.1.6. Диалоговое окно ввода аргументов функции ЛИНЕЙН

5) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу F2, а затем – на комбинацию клавиш CTRL+SHIFT+ENTER. Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:

Значение коэффициента Коэффициент корреляции уравнение регрессии шкала чеддокаЗначение коэффициента Коэффициент корреляции уравнение регрессии шкала чеддока
Среднеквадратическое отклонение Коэффициент корреляции уравнение регрессии шкала чеддокаСреднеквадратическое отклонение Коэффициент корреляции уравнение регрессии шкала чеддока
Коэффициент детерминации Коэффициент корреляции уравнение регрессии шкала чеддокаСреднеквадратическое отклонение y
F — статистикаЧисло степеней свободы
Регрессионная сумма квадратовОстаточная сумма квадратов

Результаты регрессионного анализа представлены на рис.1.7.

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.7.Результаты регрессионного анализа

Индивидуальное задание к лабораторной работе №1

По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции ( y ,млн. руб.) от объема капиталовложений ( x , млн. руб.)

1

2

3

4

5

6

7

8

9

10

1 1

1 2

1 3

1 4

1 5

12345678910
x66587382818455678159
y133107145162163170104132159116
x72527374767954687364
y1218411911712912810211111298
x38282737462741392844
y69524663734867624767
x36284352515425375129
y104771171371431448210113277
x31233847464920324624
y38264045514934354224
x33172317362539201312
y4327322945357322224
x36284352515425375129
y856099117118125568611568
x17221071221147203
y26272219212620153013
x12418272629113265
y2110263334379213214
x26183342414415274119
y43285162636726436133
x66587382818455678159
y133107145162163170104132159116
x72527374767954687364
y1218411911712912810211111298
x38282737462741392844
y69524663734867624767
x36284352515425375129
y104771171371431448210113277
x31233847464920324624
y38264045514934354224

Лабораторная работа №2

Основные сведения

Оценку качества построенной модели дает коэффициент (индекс) детерминации Коэффициент корреляции уравнение регрессии шкала чеддока, а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Коэффициент корреляции уравнение регрессии шкала чеддока.

Допустимый предел значений средней ошибки аппроксимации – не более 8–10%.

Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной y от среднего значения Коэффициент корреляции уравнение регрессии шкала чеддокараскладывается на две части – «объясненную» и «необъясненную»:

Коэффициент корреляции уравнение регрессии шкала чеддока

где Коэффициент корреляции уравнение регрессии шкала чеддока– общая сумма квадратов отклонений; Коэффициент корреляции уравнение регрессии шкала чеддока– сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений); Коэффициент корреляции уравнение регрессии шкала чеддока– остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.

Коэффициент корреляции уравнение регрессии шкала чеддока

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F — критерия Фишера:

Коэффициент корреляции уравнение регрессии шкала чеддока

Фактическое значение F -критерия Фишера (1.9) сравнивается с табличным значением Коэффициент корреляции уравнение регрессии шкала чеддокапри уровне значимости α и степенях свободы k1 = m и k2 = nm — 1. При этом, если фактическое значение F -критерия больше табличного, то признается статистическая значимость уравнения в целом.

Для парной линейной регрессии m = 1, поэтому

Коэффициент корреляции уравнение регрессии шкала чеддока

Величина F -критерия связана с коэффициентом детерминации Коэффициент корреляции уравнение регрессии шкала чеддока, и ее можно рассчитать по следующей формуле:

Коэффициент корреляции уравнение регрессии шкала чеддока

В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: m b и m a .

Стандартная ошибка коэффициента регрессии определяется по формуле:

Коэффициент корреляции уравнение регрессии шкала чеддока

где Коэффициент корреляции уравнение регрессии шкала чеддока– остаточная дисперсия на одну степень свободы.

Величина стандартной ошибки совместно с t – распределением Стьюдента при n — 2 степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительного интервала.

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t -критерия Стьюдента: Коэффициент корреляции уравнение регрессии шкала чеддокакоторое затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы  (n — 2). Доверительный интервал для коэффициента регрессии определяется как Коэффициент корреляции уравнение регрессии шкала чеддока.

Стандартная ошибка параметра a определяется по формуле:

Коэффициент корреляции уравнение регрессии шкала чеддока

Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется t -критерий: Коэффициент корреляции уравнение регрессии шкала чеддока, его величина сравнивается с табличным значением при n — 2 степенях свободы. Доверительный интервал для коэффициента регрессии определяется как Коэффициент корреляции уравнение регрессии шкала чеддока.

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, т.к. он не может одновременно принимать и положительное, и отрицательное значения.

Пример выполнения лабораторной работы.

1. В диапазоне А2:C11 подготовим исходные данные.

2. Введем вспомогательные данные:

ЯчейкаФормулаПримечание
C169Число предприятий
C170,05Уровень значимости
C18=ОТРЕЗОК(C3:C11;B3:B11)Коэффициент a
C19=НАКЛОН(С3:С11;B3:B11)Коэффициент b
C20=СРЗНАЧ(B3:B11)Среднее значение фактора
C21=СРЗНАЧ(C3:C11)Среднее значение результата

Проверка значимости коэффициента b.

1) Для расчетов сумм квадратов отклонений введем формулы:

ЯчейкаФормулаПримечание
D3=$C$18+$C$19*B3Копируем диапазон D3:D11
E3=(C3 — D3)^2Копируем диапазон E3:E11
F3=(B3 — $C$20)^2Копируем диапазон F3:F11
E12=СУММ(E3:E11) Коэффициент корреляции уравнение регрессии шкала чеддока
F12=СУММ(F3:F11) Коэффициент корреляции уравнение регрессии шкала чеддока

2) Стандартная ошибка параметра b определяется по формуле:

Коэффициент корреляции уравнение регрессии шкала чеддока

поэтому введем в ячейку D24 формулу:

=(E12/((C16-2)*F12))^0,5.

3) В ячейке D25 рассчитана t-статистика параметра b как отношение величины этого параметра к его стандартной ошибке:

=C19/D24.

4) Критическое значение t-статистики определим в ячейке D26 с помощью функции СТЬЮДРАСПОБР, у которой первым аргументом является пороговая значимость или вероятность (в нашем случае примем ее равной 0,05), а вторым – число степеней свободы (n–2=9–2=7). Таким образом, формула, введенная в D26, должна иметь вид:

=СТЬЮДРАСПОБР($C$17;$C$16-2).

5) Для того чтобы автоматически был получен вывод о значимости параметра b построим в ячейке D27 формулу:

=ЕСЛИ(ABS(D25)>D26;»Значим»;»Незначим»).

6) Для расчета доверительного интервала определяем предельную ошибку в ячейке D28:

=D26*D24.

7) Нижняя граница доверительного интервала в ячейке D29:

=C19-D28.

8) Верхняя граница доверительного интервала в ячейке D30:

=C19+D28.

Таким образом, доверительный интервал параметра b имеет вид (1,12; 1,83).

Проверка значимости коэффициента a .

ЯчейкаФормулаПримечание
G3=B3*B3Копируем диапазон G3:G11
G12=СУММ(E3:E11) Коэффициент корреляции уравнение регрессии шкала чеддока
D33=В24*КОРЕНЬ(G12/C16) Коэффициент корреляции уравнение регрессии шкала чеддока
D34=C18/D33t – статистика параметра a
D35=СТЬЮДРАСПОБР($С$17;$C$16– 2)Критическое значение t — статистики
D36=ЕСЛИ(ABS(D34)>D35; «Значим»; «Незначим»)
D37= D35*D33Предельная ошибка
D38=C18-D37Нижняя граница доверительного интервала
D39=C18+D37Верхняя граница доверительного интервала

Лабораторная работа №3

Основные сведения

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.

Различают два класса нелинейных регрессий:

1. Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, например

– полиномы различных степеней – Коэффициент корреляции уравнение регрессии шкала чеддока

– равносторонняя гипербола – Коэффициент корреляции уравнение регрессии шкала чеддока

– полулогарифмическая функция – Коэффициент корреляции уравнение регрессии шкала чеддока

2. Регрессии, нелинейные по оцениваемым параметрам, например

– степенная – Коэффициент корреляции уравнение регрессии шкала чеддока

– показательная – Коэффициент корреляции уравнение регрессии шкала чеддока

– экспоненциальная – Коэффициент корреляции уравнение регрессии шкала чеддока.

Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных, а дальнейшая оценка параметров производится с помощью метода наименьших квадратов.

Несколько иначе обстоит дело с регрессиями нелинейными по оцениваемым параметрам, которые делятся на два типа: нелинейные модели внутренне линейные (приводятся к линейному виду с помощью соответствующих преобразований, например, логарифмированием) и нелинейные модели внутренне нелинейные (к линейному виду не приводятся).

К внутренне линейным моделям относятся, например, степенная функция Коэффициент корреляции уравнение регрессии шкала чеддока, показательная – Коэффициент корреляции уравнение регрессии шкала чеддока, экспоненциальная – Коэффициент корреляции уравнение регрессии шкала чеддока, обратная – Коэффициент корреляции уравнение регрессии шкала чеддока.

К внутренне нелинейным моделям можно, например, отнести следующие модели: Коэффициент корреляции уравнение регрессии шкала чеддока.

Приведем формулы для расчета параметров наиболее часто используемых типов уравнений регрессии (табл. 1.3):

Вид функции, yЛинеаризацияПараметры уравнения регрессииИскомое уравнение
Степенная Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока
Показательная Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока
Обратная Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока
Полулогарифмическая Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока
Гиперболическая Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока
Экспоненциальная Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока

В случае нелинейной зависимости тесноту связи между величинами оценивают по величине корреляционного отношения:

Коэффициент корреляции уравнение регрессии шкала чеддока

Интервал изменения корреляционного отношения Коэффициент корреляции уравнение регрессии шкала чеддока.

Оценку качества построенной модели дает индекс детерминации Коэффициент корреляции уравнение регрессии шкала чеддока.

Коэффициент детерминации Коэффициент корреляции уравнение регрессии шкала чеддока– квадрат индекса корреляции –

характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у.

Коэффициент корреляции уравнение регрессии шкала чеддока

Чем ближе коэффициент детерминации к 1, тем выше качество уравнения регрессии, тем в большей мере оно объясняет поведение отклика.

Порядок выполнения работы.

Используя данные лабораторной работы №1, построить линейную, степенную, показательную, экспоненциальную, полулогарифмическую, гиперболическую и обратную модели и с помощью коэффициента детерминации сравнить эти модели. Для чего необходимо:

1. Найти уравнение регрессии.

2. Найти общую сумму квадратов отклонений и остаточную сумму квадратов отклонений.

3. Найти коэффициент детерминации.

4. Найти параметры регрессии с помощью статистической функции ЛИНЕЙН.

Пример выполнения лабораторной работы.

Создадим новую рабочую книгу с семью листами.

Название листаНазначение
ЛинейнаяДля анализа линейной модели
СтепеннаяДля анализа степенной модели
ПоказательнаяДля анализа показательной модели
ОбратнаяДля анализа обратной модели
ПолулогарифмическаяДля анализа полулогарифмической модели
ГиперболическаяДля анализа гиперболической модели
ЭкспоненциальнаяДля анализа экспоненциальной модели

Будем использовать данные из лабораторной работы №1.

1. Лист Линейная оформим, как показано на рис.1.3:

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.3. Лист Линейная

На этом листе коэффициенты линейной регрессии определяются с помощью статистических функций (см. лабораторную работу №1).

Для расчета сумм, которые понадобятся при определении коэффициента детерминации (и при выполнении следующей лабораторной работы), введем формулы:

ЯчейкаФормулаПримечание
E3=$A$16+$B$16*B3Расчет теоретических значений результата Коэффициент корреляции уравнение регрессии шкала чеддока. Копируем диапазон E3:E11
F3=(C3–$C$12)^2Копируем диапазон F3:F11
G3=(C3–E3)^2Копируем диапазон G3:G11
H3=(E3-$C$12)^2Копируем диапазон H3:H11
F12=СУММ(F3:F11)Копируем диапазон F12:H12

Замечание. В приведенных формулах неоднократно используется абсолютная адресация, содержащая знак «$». Это необходимо для того, чтобы при копировании формул данный адрес не изменялся. Для того чтобы превратить относительный адрес А16 в абсолютный ($A$16), достаточно нажать клавишу F4 в то время, когда курсор находится на ячейке А16.

Для вычисления коэффициента детерминации в ячейку Н15 введем формулу:

=1-G12/F12.

2. Регрессия в виде степенной функции имеет вид: Коэффициент корреляции уравнение регрессии шкала чеддока.

Для нахождения параметров регрессии Коэффициент корреляции уравнение регрессии шкала чеддоканеобходимо провести ее линеаризацию:

Составляем вспомогательную таблицу для преобразованных данных (рис. 2.3):

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 2.3 Лист Степенная

ЯчейкаФормулаПримечание
D3=LN(C3)Y=ln y Копируем диапазон D3:D11
E3=LN(B3)X=ln x Копируем диапазон E3:E11
F3=D3*E3Копируем диапазон F3:F11
G3=E3^2Копируем диапазон G3:G11
D12=СРЗНАЧ(D3:D11)Копируем диапазон D12:G12

Для вычисления коэффициентов регрессии введем следующие формулы:

ЯчейкаФормулаПримечание
B16=(F12-E12*D12)/(G12-E12^2)b
A16=D12-B16*E12A

После потенцирования находим искомые коэффициенты регрессии:

ЯчейкаФормулаПримечание
A19=EXP(A16)a
B19= B16b

Тогда уравнение регрессии будет иметь вид: Коэффициент корреляции уравнение регрессии шкала чеддока.

Для расчета сумм введем формулы:

ЯчейкаФормулаПримечание
I3=$A$19*B3^$B$19Расчет теоретических значений результата Коэффициент корреляции уравнение регрессии шкала чеддока. Копируем диапазон I3:I11
J3=(C3–$C$12)^2Копируем диапазон J3:J11
K3=(C3–E3)^2Копируем диапазон K3:K11
L3=(E3-$C$12)^2Копируем диапазон L3:L11
J12=СУММ(J3:J11)Копируем диапазон J12:L12

Для вычисления коэффициента детерминации в ячейку L15 введем формулу:

=1-K12/J12.

Проведем расчеты параметров регрессии с помощью статистической функции ЛИНЕЙН.

Выделим диапазон А22:В26. введем формулу

=ЛИНЕЙН(D3:D11;E3:E11;1;1).

В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу F2, а затем – на комбинацию клавиш CTRL+SHIFT+ENTER.

3. Расчеты на остальных листах во многом повторяют расчеты, произведенные на листе Степенная, поэтому остальные листы лучше всего получить копированием листа Степенная.

Для этого необходимо:

· находясь на листе Степенная, выделить его полностью, щелкнув мышью на пересечении названий столбцов и строк; с помощью кнопки (Копировать) скопировать лист в Буфер обмена;

· перейти на следующий лист и выделив ячейку А1,щелкнуть мышью по кнопке (Вставить).

Получим следующие результаты (рис. 3.3-7.3):

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 3.3. Лист Показательная

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 4.3. Лист Обратная

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 5.3. Лист Полулогарифмическая

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 6.3. Лист Гиперболическая

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 7.3. Лист Экспоненциальная

Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одной таблице (табл. 2.1).

Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать показательной или экспоненциальной функции, для которых значение коэффициента детерминации наибольшее.

Название листаУравнение регрессииКоэффициент детерминации
Линейная Коэффициент корреляции уравнение регрессии шкала чеддока0,9335
Степенная Коэффициент корреляции уравнение регрессии шкала чеддока0,9283
Показательная Коэффициент корреляции уравнение регрессии шкала чеддока0,9353
Обратная Коэффициент корреляции уравнение регрессии шкала чеддока0,9145
Полулогарифмическая Коэффициент корреляции уравнение регрессии шкала чеддока0,9060
Гиперболическая Коэффициент корреляции уравнение регрессии шкала чеддока0,8528
Экспоненциальная Коэффициент корреляции уравнение регрессии шкала чеддока0,9353

Лабораторная работа №4

Основные сведения.

Пусть по заданной выборке объема n найдено выборочное уравнение линейной регрессии

С помощью этого уравнения можно прогнозировать значение результата у р при определенном прогнозном значении фактора х р.

Прогнозное значение у р определяется путем подстановки в уравнение регрессии у=а+bх соответствующего прогнозного значения х р.

Точное уравнение регрессии нам неизвестно. Поэтому мы не можем сделать точный прогноз. Можно только утверждать, что прогнозное значение результата у р при данном х р с вероятностью γ попадет в доверительный интервал γр. Вероятность γ называется уровнем надежности.

Ошибка прогноза составляет:

Коэффициент корреляции уравнение регрессии шкала чеддока,

где Коэффициент корреляции уравнение регрессии шкала чеддока Коэффициент корреляции уравнение регрессии шкала чеддока— стандартная ошибка регрессии (дисперсия ошибки или остаточная дисперсия).

Предельная ошибка прогноза, составит:

Коэффициент корреляции уравнение регрессии шкала чеддока.

Доверительный интервал прогноза:

Коэффициент корреляции уравнение регрессии шкала чеддока.

Точность прогноза можно оценить с помощью относительной ошибки прогноза:

Коэффициент корреляции уравнение регрессии шкала чеддока

Порядок выполнения работы.

Используя данные к лабораторной работе №1 при х р=20:

1. найти уравнение регрессии;

2. рассчитать доверительный интервал прогноза при значениях уровня надежности 80%, 90%, 95%;

3. найти относительную ошибку прогноза;

4. построить графики линии регрессии с доверительными границами.

Пример выполнения лабораторной работы.

Расчеты для каждого из уровней надежности производить на отдельных листах, которые назовем , соответственно: 80%, 90%, 95%.

I. Лист 80%.

5. В диапазоне А2:C11 подготовим исходные данные.

6. В ячейку В12 запишем значение хр=15,5, для которого необходимо спрогнозировать значение результата ур.

7. Вводим следующие формулы:

Коэффициент корреляции уравнение регрессии шкала чеддока

8. Для графического представления полученных результатов:

· Вводим следующие формулы:

Коэффициент корреляции уравнение регрессии шкала чеддока

Таким образом получим данные, представленные на рис. 1.4.

· Выделим одновременно диапазоны В2:С11, E2:E11, H2:I11 (поскольку эти диапазоны несмежные, при этом должна быть нажата клавиша Ctrl);

· Вызовем Мастер диаграмм. Чтобы ось отражала фактические данные, выберем тип диаграммы Точечная;

· Для добавления на диаграмму прогнозируемых значений в Мастере диаграмм на шаге 2 перейдем на вкладку Ряд (рис. 2.4). Щелкнем по кнопке Добавить и введем с помощью левой кнопки мыши: Имя − Прогноз, Значения Х – В12, Значения Y – С29. Щелкнув по кнопке Готово, получим диаграмму, представленную на рисунке 3.4.

Отформатируем диаграмму. Для этого щелкнем дважды по фону и выберем заливку прозрачная, затем щелкнем дважды по линии регрессии и выберем тип линии, цвет и толщину, а переключатель маркера поставим в положение отсутствует. Аналогичным образом форматируются линии, представляющие границы доверительных интервалов, и точки, отображающие прогнозируемые значения. В итоге получим диаграмму, представленную на рис. 4.4.

II. Лист 90% и 95%.

Чтобы получить расчеты для уровней надежности 90% и 95%, достаточно скопировать лист 80% на листы 90% и 95% и ввести на них в ячейку С21 соответственно значения 0,9 и 0,95. При этом диаграммы, полученные при таком копировании, следует удалить и построить заново на основе расчетов, полученных на листах 90% и 95% (рис. 5.4 и 6.4).

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 1.4. Прогнозирование на основании линейной модели при уровне

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 2.4. Шаг 2 Мастера диаграмм

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 3.4. Диаграмма, построена с помощью Мастера

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 4.4. Итоговый вид диаграммы при уровне надежности 80%

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 5.4. Прогнозирование на основании линейной модели при уровне

Коэффициент корреляции уравнение регрессии шкала чеддока

Рис. 6.4. Прогнозирование на основании линейной модели при уровне

Сравним относительные погрешности прогнозов при различных уровнях надежности, для х р=15,5:

Коэффициент корреляции уравнение регрессии шкала чеддока

Повышение уровня надежности с 80% до 95% снижает точность прогноза в 19,6/11,7≈1,68 раза.

Лабораторная работа №1.

Простейшая обработка данных. Линейная регрессия.

Коэффициент корреляции уравнение регрессии шкала чеддока

Последнее изменение этой страницы: 2019-04-20; Просмотров: 718; Нарушение авторского права страницы

🎥 Видео

Корреляционно-регрессионный анализ многомерных данных в ExcelСкачать

Корреляционно-регрессионный анализ многомерных данных в Excel

Коэффициенты корреляции в ExcelСкачать

Коэффициенты корреляции в Excel

Интерпретация коэффициента при логарифмировании в уравнениях регрессииСкачать

Интерпретация коэффициента при логарифмировании в уравнениях регрессии

Коэффициент корреляции. Дискретное распределениеСкачать

Коэффициент корреляции. Дискретное распределение

Коэффициент корреляции: заблуждение и неочевидные выводыСкачать

Коэффициент корреляции: заблуждение и неочевидные выводы

Парная регрессия: линейная зависимостьСкачать

Парная регрессия: линейная зависимость
Поделиться или сохранить к себе: