Статистический анализ регрессионной модели, Интерпретация результатов эксперимента - Основы научных исследований

После проведения регрессионного анализа получается модель объекта исследований в виде некоторой функции. В простейшем случае линейной регрессии она имеет вид

.

В общем случае не все коэффициенты регрессии АI в этой модели значимы, т. к. при выборе факторов обычно нет полной информации о степени влияния каждого на отклик и поэтому приходится вводить в эксперимент и те факторы, которые при данной точности исследования могут оказаться не существенными. Эти факторы теперь можно отсеять Проверкой значимости коэффициентов регрессии.

Регрессионный анализ всегда дает не нулевые величины коэффициентов регрессии даже у заведомо не значимых факторов. Это происходит из-за влияния случайных помех или наличия корреляции между факторами. Но обычно коэффициенты регрессии при таких факторах малы. Поэтому нужно проверить, достаточно ли они малы для того, чтобы можно было считать их отличие от нуля результатом вышеуказанных причин. Для отсеивания не значимых АI С некоторой вероятностью р Используется T-критерий Стьюдента. Если

(16.9)

То данный коэффициент регрессии значим. Здесь, а - дисперсия i-го коэффициента регрессии

(16.10)

Где XIj - j-е значение i-го фактора. Этот критерий является односторонним.

Статистическая незначимость интерпретируется как отсутствие влияния данного фактора на отклик в исследованном интервале его изменения.

Если эксперимент активный и его план соответствует т. н. условию ортогональности, то незначимые коэффициенты регрессии просто удаляются из модели без пересчета остающихся. Если это условие не выполняется, что обычно и бывает в пассивных экспериментах, то отсеивание не значимых факторов следует начинать с того, у которого величина T - критерия минимальна. Этот фактор удаляется из матрицы экспериментальных данных и регрессионный анализ проводится повторно. В полученной регрессионной модели снова находят фактор с минимальным t-критерием и повторяют вышеописанную процедуру до тех пор, пока в модели не останутся только значимые факторы.

Причины не значимости того или иного коэффициента регрессии могут быть принципиально различными. Данный фактор может действительно не влиять на отклик. Но незначимость может быть следствием и того, что его влияние не проявилось на фоне сильных помех. Поэтому процедуру отсеивания не автоматизируют, оставляя возможность анализа аргументов в пользу сохранения некоторых незначимых факторов в модели.

Проверка адекватности модели производится для того, чтобы выяснить, правильно ли выбран вид функции регрессии. При этом используется принцип сопоставления с "шумом". Проверке подвергается обычно модель со всеми значимыми АI. Она возможна, если:

    1. С помощью дублирования опытов получена оценка дисперсии эксперимента. 2 Выполнено условие N > D+1, где D - число коэффициентов регрессии в модели. Если N ? D+1, то проверять адекватность нет смысла, поскольку поверхность откликов, соответствующая регрессии, будет проходить точно через все экспериментальные точки.

Идея проверки адекватности состоит в том, что сопоставляются дисперсия неадекватности и оценка дисперсии эксперимента. При равномерном дублировании опытов

, (16.11)

Где - расчетное по уравнению регрессии значение отклика в і-том опыте.

При неравномерном дублировании

, (16.12)

Где - среднее экспериментальное значение отклика в і-том опыте.

Если модель не адекватна, то будет оценивать и некоторую дополнительную компоненту рассеивания, обусловленную погрешностью аппроксимации

Т. о. если не случайным образом больше, то модель неадекватна. Следовательно, нужно проверить гипотезу

Для проверки используется критерий Фишера

, (16.13)

Где Н1- число степеней свободы дисперсии не адекватности

Н1 = MN - (D+1);

Н2- число степеней свободы дисперсии эксперимента

Н2 = N(M-1).

Этот критерий является односторонним.

Проверка работоспособности модели Необходима вследствие того, что даже адекватная модель со всеми значимыми коэффициентами регрессии может оказаться практически бесполезной из-за своей низкой точности. Производится по Коэффициенту детерминации

(16.14)

Где - значение отклика в i-том опыте по регрессионной модели;

- среднее значение отклика в эксперименте.

По определению может изменяться от 0 до 1. Если =0, то тогда изменение отклика полностью обусловлено случайными причинами, а влияния факторов эксперимента нет. Если = 1, то нет влияния случайных причин и линия регрессии проходит точно через все экспериментальные точки. Чем ближе к 1, тем модель лучше. Критическое значение определяется из того условия, что ошибка предсказания отклика по уравнению регрессии должна быть в 2 раза меньше, чем по. Отсюда следует условие работоспособности: .

Далее следует Расчет коэффициента корреляции модели (см. п. 13.1).В случае МРА рассчитывается множественный коэффициент корреляции R (см. п. 13.2). Если R ? 0,9, то это значит, что модель полна и учитывает все существенно влияющие на отклик факторы. Если R< 0,87- Модель не полна и следует эксперимент повторить, введя в него ранее не учтенные факторы.

Определение точности регрессионной модели Производится так же, как и точности эксперимента, но вместо дисперсии эксперимента используется дисперсия неадекватости.

Абсолютная погрешность определения отклика по регрессионной модели:

Где - значение критерия Стьюдента при уровне значимости Б и числе степеней свободы при равномерном дублировании.

Следует учитывать, что этот критерий двухсторонний и поэтому Б = 0,5q, где Q = 1-Р.

Относительная погрешность определения отклика по регрессионной модели равна

,

Где = среднее значение отклика по регрессионной модели.

Интерпретация результатов эксперимента

Интерпретация (истолкование) результатов эксперимента необходима для понимания механизма исследуемого явления, создания его теории или включения в существующую теорию, что позволит получать новую информацию, выходящую за рамки проведенного исследования. Осуществляется посредством эрудиции исследователя эвристическими методами и является процессом не формализуемым. Однако для облегчения интерпретации рекомендуется представлять полученные в результате эксперимента данные в наглядной форме - в виде графиков.

Для однофакторных экспериментов это не представляет трудностей. Однако и при наличии более, чем одного фактора, также возможна графическая интерпретация. Например, зависимость отклика У от двух факторов Х1 и Х2 Можно представить в виде (рис.16.1):

графическая интерпретация эксперимента

Рисунок 16.1 Графическая интерпретация эксперимента

Т. о. на плоскости видно одновременно влияние обоих факторов. Можно также представить такое влияние и в пространстве, построив т. н. поверхность отклика (рис. 16.2):

Рисунок 16.2 Поверхность отклика

Похожие статьи




Статистический анализ регрессионной модели, Интерпретация результатов эксперимента - Основы научных исследований

Предыдущая | Следующая