Как установить адекватность уравнения регрессии при отсутствии параллельных опытов
Обновлено
Поделиться
Глава 10. Проверка адекватности модели.
Читайте также:
III-яя глава: Режим, применяемый к почетным консульским должностным лицам и консульским учреждениям, возглавляемым такими должностными лицами.
В каком случае проводится внеочередная проверка знаний работников?
Виды ошибок при составлении бухгалтерской отчетности, выявляемых аудиторскими проверками
Вторая глава
ВЫБОР И ПРОВЕРКА СЕЧЕНИЙ ВЫСОКОВОЛЬТНЫХ КАБЕЛЕЙ ПИТАЮЩЕЙ И РАСПРЕДЕЛИТЕЛЬНОЙ СЕТИ МИКРОРАЙОНА (ОБЪЕКТА)
Глава 1
Глава 1
Глава 1
Глава 1
Глава 1
Уравнение регрессии, полученное после вычисления коэффициентов, подвергают статистической обработке. При этом осуществляют проверку:
· адекватности математической модели;
· значимости коэффициентов регрессии.
Чтобы проверить адекватность модели по опытным данным, достаточно оценить отклонение предсказанных по уравнению регрессии значений отклика от результатов наблюдения y в одних и тех же i-х точках факторного пространства. Разность между опытным значением отклика и значением, найденным по уравнению регрессии, принято называть остатком, сумму квадратов остатков – остаточной суммой квадратов.
Рассеяние результатов наблюдения вблизи линии уравнения регрессии, оценивающего истинную функцию отклика, можно охарактеризовать с помощью остаточной дисперсии:
(10.1)
где d – число коэффициентов регрессии. Остаточная дисперсия определяется числом степеней свободы
Если остаточная дисперсия незначимо отличается от дисперсии воспроизводимости эксперимента , то уравнение регрессии адекватно описывает опытные данные. Адекватность уравнения регрессии указывает на то, что его точность соответствует точности эксперимента и, следовательно, уравнение, обладающее более высокой точностью получить нельзя.
Если остаточная дисперсия значительно ниже дисперсии воспроизводимости, то это указывает на включение в уравнение регрессии членов, не несущих информации о влиянии факторов на отклик системы, или на неправильное применение формул регрессионного анализа.
В отдельных случаях, когда параллельные опыты ставятся только в части экспериментальных точек, найденная по этим данным дисперсия не характеризует воспроизводимости во всей области изменения факторов. Тогда ситуация , то вычисляют дисперсионное отношение
. (10.3)
Если вычисленное значение меньше табличного значения Fкр критерия Фишера, найденного для соответствующих степеней свободы
при заданном уровне значимости (обычно задают равным 5%), то гипотезу об адекватности не отвергают. В противном случае гипотезу отвергают, и математическое описание признается неадекватным.
Универсальным измерителем степени статистической связи между y и факторами x1, x2, …, xn, является коэффициент детерминации Кд, который определяется соотношением
, (10.5)
где – остаточная дисперсии; – дисперсия воспроизводимости эксперимента.
Коэффициент детерминации лежит в интервале [0,1]. Нулевое значение коэффициента детерминации соответствует полному отсутствию какой-либо связи между y и факторами x1, x1, …, xr. Значение коэффициента равное 1 соответствует случаю чисто функциональной зависимости между y и факторами, когда значение y может быть в точности (детерминированно) восстановлено по значениям x1, x1, …, xn, с помощью формулы y=f(x1, x1, …, xr).
Численное значение коэффициента детерминации Кд отражает долю общей вариации функции отклика y, объясненную функцией регрессии. Например, если коэффициент детерминации равен 0,769, то это означает, что 76,9% изменения величины отклика может быть объяснено регрессией. Таким образом, чем больше Кд, тем лучше модель аппроксимирует Y.
В моделях линейной регрессии в качестве измерителя степени статистической связи между y и факторами x1, x2, …, xn, используется множественный коэффициент корреляции R. Он определяется как обычный парный коэффициент корреляции между y и линейной функции регрессии по x1, x1, …, xr, т.е.
В этом случае коэффициент детерминации равен квадрату множественного коэффициента корреляции, т.е. Кд = R 2 .
Проверка значимости коэффициентов регрессии. Оценки дисперсий коэффициентов регрессии bi вычисляются по формуле
,
где – остаточная дисперсия, cii – i-й диагональный элемент матрицы .
Проверку значимости коэффициентов регрессии производят с помощью критерия Стьюдента, эмпирическое значение которого
. (10.6)
Если найденное значение параметра tэ превышает значение t для числа степеней свободы n = n (m–1) при заданном уровне значимости p (обычно 5 %) (Приложение 1), то коэффициент признают значимым. В противном случае коэффициент принимается равным нулю с вероятностью ошибки p.
Факторы, имеющие большие значения tэ оказывают более существенное влияние на отклик системы. Если коэффициент не значим, то соответствующий фактор можно исключить из уравнения регрессии. Эту процедуру необходимо проводить с большой осторожностью. При наличии значительной корреляции между коэффициентами регрессии возможны существенные изменения в величинах остальных коэффициентов. Поэтому исключение членов из уравнения должно сопровождаться повторным вычислением коэффициентов регрессии и повторной проверкой адекватности уравнения регрессии.
Можно построить доверительный интервал
здесь t – табличное значение коэффициента Стьюдента; s<bj> – среднеквадратичная ошибка коэффициента регрессии.
По умолчанию доверительные интервалы строятся с 95% вероятностью .
Анализ остатков. Остаточная дисперсия является усредненной оценкой точности математической модели. Поэтому дисперсионное отношение также есть усредненная оценка качества уравнения регрессии. Исследователя часто интересует не только усредненная характеристика, но и отклонения (остатки) в отдельных точках, анализ которых может дать дополнительную информацию о процессе. Анализ остатков проводят визуально посредством нанесения их на график. Если модель адекватно описывает экспериментальные данные и не содержит никаких нарушений, то остатки случайно распределены в пределах доверительного интервала, представляющего собой горизонтальную полосу с центром на оси абсцисс.
Наиболее часто встречаются следующие нарушения распределения остатков.
1. Если остатки находятся внутри расширяющейся полосы, это указывает на отсутствие постоянства дисперсии; если полоса не горизонтальна, это дает основание для введения в модель дополнительной независимой переменной.
2. Наличие выбросов, т.е. отдельных остатков, превосходящих доверительный интервал по абсолютной величине. Существование выбросов может быть связано с нарушением режима проведения эксперимента в данной точке. В этом случае необходима постановка дополнительных экспериментов в точках выбросов. Если эта причина не подтверждается, то наличие выбросов может быть связано с несоответствием вида математической модели действительной форме поверхности отклика.
Дата добавления: 2014-11-13 ; просмотров: 72 ; Нарушение авторских прав
Видео:Критерий Фишера для проверки адекватности построенной регрессииСкачать
Проверка адекватности регрессионной модели
Регрессионная модель, построенная по результатам эксперимента, позволяет рассчитать значения отклика в разных точках области варьирования факторов. Для этого в уравнение регрессии подставляют соответствующие значения варьируемых факторов. Проверка адекватности математической модели дает возможность экспериментатору ответить на вопрос: будет ли построенная модель предсказывать значения выходной величины с той же точностью, что и результаты эксперимента?
Пусть N — число опытов экспериментального плана или число серий параллельных опытов, если опыты дублируются; р — число оцениваемых коэффициентов регрессии математической модели. Проверка адекватности возможна только при N > р, т.е. если план эксперимента является ненасыщенным. Для проверки адекватности модели необходимо знать оценку дисперсии воспроизводимости я 2 , которую можно вычислить в зависимости от методики дублирования опытов по одной из формул, приведенных в п. 5.6.1.
Порядок проверки адекватности модели следующий:
1. Определяют сумму квадратов, характеризующую адекватность модели 5ал. При равномерном дублировании ее рассчитывают по формуле
Здесь п — число дублированных опытов в каждой серии; у. — среднее
значение результатов эксперимента в /-й серии дублированных опытов, у=1, 2, N; у, — значение выходной величины, рассчитанное по уравнению регрессии дляу’-го основного опыта.
В случае неравномерного дублирования
где rij — число дублированных опытов в j-й серии.
При отсутствии дублирования опытов
2. Вычисляют число степеней свободы /ад дисперсии адекватности. При любой методике дублирования опытов оно равно
3. Вычисляют дисперсию адекватности
4. С помощью F-критерия Фишера проверяют однородность дисперсии адекватности 5ад и дисперсии воспроизводимости s 2 . При этом (см. п. 4.6) вычисляют
которое сравнивают с табличным значением F-критерия FTa6n, найденным при выбранном уровне значимости q для чисел степеней свободы в числителе и fy в знаменателе (см. табл. 2 приложения). Если Fpac4 (3 — 5).
Для экспериментов с дублированными опытами формула (5.52) остается в силе, а выражения для дисперсий s], и s*CT примут следующий вид:
значение отклика в м дублированном опыте j-й серии; N — число серий дублированных опытов;
Поскольку результаты корреляционно-регрессионного анализа, полученные на базе ограниченного числа экспериментальных данных, являются случайными величинами, необходимо оценить их достоверность, определить доверительные интервалы, в которых находятся их истинные значения.
Для этого производится комплекс операций.
1. Оценка достоверности коэффициентов корреляции.
2. Оценка значимости коэффициентов регрессии.
3. Оценка адекватности уравнения регрессии.
Рассмотрим последовательность проведения операций.
1. При любом объеме выборки и многомерном нормальном распределении рассматриваемых факторов вычисляется статистика имеющая распределение Стьюдента с f=n-2 степенями свободы.
, (16.1)
где r — коэффициент корреляции.
Для проверки нулевой гипотезы Н0 (согласно которой коэффициент корреляции генеральной совокупности равен нулю) находят по таблицам, при фиксированном уровне значимости a и числе степеней свободы f=n-2, критическое значение , удовлетворяющее условию
Если наблюдаемое значение , то нулевую гипотезу об отсутствии линейной зависимости между переменными x и y следует отвергнуть. Такой метод часто применяют при малом объеме выборок.
При числе наблюдений n>50 надежность коэффициента корреляции можно оценить по его среднему квадратическому отклонению
(16.2)
и нормированному отклонению
(16.3)
Достоверность коэффициента корреляции считается доказанной с вероятностью 0,997, если tr³3, с вероятностью 0,990 при tr³2,58; с вероятностью 0,95 при tr³1,96. Если n достаточно велико, а r близко к 0,5, то границы доверительного интервала для коэффициента корреляции генеральной совокупности r
(16.4)
Значение tкр устанавливается по таблице функции Лапласа для выбранной вероятности. Если левая и правая части неравенства имеют одинаковый знак, то r имеет достоверный знак и является значимым.
Соотношения (16.1)-(16.4) справедливы и при оценке достоверности коэффициента множественной корреляции и корреляционных отношений.
2. Проверку значимости коэффициентов регрессии можно производить двумя способами: сравнением абсолютного значения коэффициента с доверительным интервалом и с помощью t-критерия Стьюдента.
В первом случае доверительный интервал для коэффициента bi вычисляют по формуле
где tT — табличное значение критерия Стьюдента при уровне значимости и числе степеней свободы, для которых определялось , — среднеквадратичное отклонение bi. Коэффициент значим, если его абсолютное значение больше доверительно интервала.
При проверке значимости коэффициентов вторым способом вычисляют
,
и сравнивают его с критическим значением этого критерия tкр. Коэффициент значим, если tр>tкр для принятого уровня значимости и числа степеней свободы, при которых определялось .
Методика определения зависит от способа получения уравнения регрессии. В случае применения планирования эксперимента:
,
где — дисперсия воспроизводимости эксперимента, n— число параллельных опытов в каждой точке матрицы при равномерном дублировании опытов (при отсутствии дублирования n=1), N— общее число опытов в матрице плана.
При равномерном дублировании опытов во всех строках матрицы плана число параллельных опытов одинаково. Для каждой строки этой матрицы вычисляют дисперсию Sj результатов по данным n параллельных опытов
,
где yju-значение функции отклика в j-й строке для u-ого опыта.
Если результатов опытов однородны, то дисперсия воспроизводимости эксперимента
, (16.5)
где N-число опытов или число строк матрицы плана.
При отсутствии дублирования опытов для определения дисперсии воспроизводимости эксперимента выполняют n0 параллельных опытов при средних уровнях всех независимых факторов. По результатам этих опытов вычисляют
, (16.6)
где yu – значение функции отклика в u-ом параллельном опыте.
При равномерном дублировании опытов число степеней свободы для расчета и, следовательно находится как f=N(n-1), при отсутствии дублирования опытов f=n0-1.
3. В зависимости о наличии сведений о дисперсии воспроизводимости эксперимента проверку адекватности уравнения регрессии можно производить по двум схемам.
Схема I, состоящая из трех этапов применяется при отсутствии оценки дисперсии воспроизводимости, что характерно для пассивного эксперимента.
А) Вычисляется дисперсия относительно среднего значения параметра оптимизации:
.
Б) Рассчитывается дисперсия, характеризующая отклонение экспериментальных значений величин от найденных по уравнению регрессии. Если порядок уравнения заранее неизвестен, то в случае многофакторного пространства имеет смысл начинать с уравнения первого порядка.
, (16.7)
где — значение параметра оптимизации, вычисленное по уравнению регрессии для условий i-го опыта; f=N-g – число степеней свободы, g – число коэффициентов регрессии.
В) Вычисляется опытное значение отношения дисперсий
,
которое затем сравнивают с критическим Fкр(f1, f2). Если F0£Fкр, пользоваться уравнением регрессии первого порядка не имеет смысла, так как в изученном интервале изменения уровней факторов оно описывает исследуемую систему не лучше, чем уравнение нулевого порядка. Затем составляют уравнение второго порядка, рассчитывают и . Далее проверяют значимость этого отношения по критерию Фишера. Процедуру повторяют до тех пор, пока не будет выполнено условие Fr³Fкр(fr,fr+1).
Схема II применяется, если известна дисперсия воспроизводимости эксперимента.
Для оценки адекватности модели, вначале рассчитывают дисперсию адекватности по формуле (16.7), а затем вычисляют опытное значение критерия Фишера.
.
Дата добавления: 2015-11-06 ; просмотров: 1338 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ