Слайд 1Применение метода наименьших квадратов для определения параметров линейной функции нескольких
переменных
Лекция №11
Слайд 2Постановка задачи
Предполагается, что вещественная переменная y линейно зависит от нескольких
вещественных переменных x. Пусть p - число переменных x.Надо
оценить параметры линейной зависимости по наблюдениям x и y.
Каждое наблюдение содержит (p+1) значение: p значений x и одно значение y:
(xi,1 , xi,2 , …, xi,p , yi), i – номер наблюдения.
Всего имеется n наблюдений: i=1, 2, …, n.
Каждое наблюдение можно представить как точку (p+1)-мерного пространства.
Слайд 3Постановка задачи
Обычно предполагают следующую модель (уравнение) формирования y:
y=b0+b1x1+b2x2+…+bpxp+ε, (1)
где b1, b2,
…, bp – коэффициенты линейной зависимости,
b0– сдвиг
линейной зависимости,
ε – случайная величина, включающая в себя все, что влияет на y, кроме x1, x2, …, xp.
Часто ε называют возмущением.
Иногда предполагается, что ε – это погрешность измерения y.
x1, x2, …, xp принято назвать входными или независимыми переменными, или факторами.
y принято назвать выходной или зависимой переменной, или откликом.
Рассмотрение уравнения (1), конечно, связано с предположением, что переменные x оказывают на y большее влияние, чем ε, то есть чем все остальные воздействия.
Слайд 5Метод наименьших квадратов (МНК)
Оценка отклика в i-м наблюдении равна:
Разность между
откликом и его оценкой обозначается ei и называется остатком:
Qe –
сумма квадратов остатков или остаточная сумма:
(3)
(2)
Слайд 6МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Параметры зависимости y(x) определяются из условия минимума остаточной
суммы:
МНК также называется методом подгонки (из-за простоты идеи)
Слайд 7Метод наименьших квадратов (МНК)
Запишем выражение (3) для остаточной суммы в
матричном виде.
Введем обозначения:
Тогда:
Слайд 8Метод наименьших квадратов (МНК)
Запишем соотношение (2) для каждого наблюдения:
Обозначим:
Тогда:
Матрица X
состоит из n строк и (p+1) столбцов. Первый столбец состоит
из единиц. Это как бы наблюдения несуществующего, «фиктивного» фактора, введенного для того, чтобы не заниматься отдельно оценкой b0.
Слайд 10Метод наименьших квадратов (МНК)
Из необходимого условия минимума остаточной суммы в
результате не очень сложных алгебраических преобразований можно получить:
Если квадратная
матрица XX является неособенной, то получаем формулу для оценок параметров зависимости y(x):
Эта формула является обобщением формулы (4) из лекции 9
Слайд 11Остаточная сумма Qe характеризует отклонение (разброс, рассеяние) наблюдений относительно линейного
пространства, задаваемого соотношением:
Остаточная сумма Qe характеризует разброс (рассеяние, изменение) наблюдений
y за счет возмущений (воздействий, отличных от х).
Чем меньше остаточная сумма, тем значимей зависимость y(x1,x2, …,xp).
НО если ВСЕ коэффициенты b1, b2, …, bp равны (или близки к) 0, то y не зависит (мало зависит) от факторов даже если возмущений нет.
Нужен другой (дополнительный) критерий качества.
Оценка качества (значимости) зависимости
y(x1,x2, …,xp)
Слайд 12QR- регрессионная сумма квадратов.
Оценка качества (значимости) зависимости
y(x1,x2, …,xp)
Слайд 13Чем меньше остаточная сумма Qe, тем выше значимость зависимости y(x1,x2,
…,xp).
Чем больше регрессионная сумма QR, тем выше значимость зависимости y(x1,x2,
…,xp).
Чем больше отношение QR/Qe, тем выше значимость зависимости y(x1,x2, …,xp). Отношение QR/Qe –хороший критерий значимости:
Отношение безразмерно, не зависит от единиц измерений y.
Отношение учитывает и влияние на y фактора x, и влияние на y возмущений.
Оценка качества (значимости) зависимости
y(x1,x2, …,xp)
Слайд 14Если F>f(; p;n-p-1), то линейную зависимость y(x) следует считать значимой.
Это строгий критерий, доказанный в математической статистике.
Критическое (пороговое) значение f(;
p;n-p-1) – это квантиль распределения Фишера, который выбирается из специальных таблиц или определяется с помощью встроенных функций вычислительной среды.
Здесь >0 - это вероятность ошибки: принять зависимость y(x) значимой при условии, что это неверно.
При р=1 получаем формулы из лекции 9.
.
Критерий Фишера проверки значимости зависимости y(x1,x2, …,xp)
Статистика Фишера:
Чем больше F, тем значимей зависимость y(x)
Слайд 15Полная (общая, дисперсионная) сумма наблюдений отклика:
Q характеризует полный разброс (рассеяние,
изменение) отклика относительно его среднего значения.
При не очень ограничительных условиях
выполняется равенство:
Q=QR+Qe.
Таким образом, полное изменение y складывается из его изменения за счет изменения х и изменения за счет возмущений.
Обратите внимание, что Q не зависит от b0, b1, …, bp, а зависит только от наблюдений отклика. Таким образом, минимизируя Qe, мы одновременно максимизируем QR, поскольку их сумма остается постоянной.
Слайд 16Зависимость y(x1,x2, …,xp) можно считать значимой при:
QR>Qe
В этом случае изменение
y более, чем на 50%, обусловлено изменением х.
Оценка качества
(значимости) зависимости y(x)
Слайд 17Оценка качества (значимости) зависимости y(x)
Коэффициент детерминации:
Коэффициент детерминации показывает, какая часть
изменения y объясняется изменением x.
При QR>Qe R2>0,5.
Таким образом, условие
R2>0,5
может быть
использовано как критерий значимости зависимости y(x1,x2, …,xp).
Слайд 18Свойства коэффициента детерминации:
0R21.
Чем ближе R2 к единице, тем лучше регрессия
аппроксимирует
наблюдения.
Если R2=1, то наблюдения лежат на
линии регрессии.
Если R2=0, то изменение зависимой переменной полностью
обусловлены неучтенными в модели факторами, и линия
регрессии параллельна оси ОХ.
Оценка качества (значимости) зависимости
y(x1,x2, …,xp)
Слайд 19Оценка значимости каждого фактора
Критерии:
Фишера:F>f(; p;n-p-1)
QR>Qe
R2>0,5
Предназначены для проверки значимости соотношения (5)
в целом, то есть оценивания общего влияния на y всех
факторов.
Существует также задача проверки значимости каждого фактора. Это нужно, например, для того, чтобы определить, какие факторы можно исключить из модели, тем самым упростив модель.
Слайд 20Оценка значимости каждого фактора
Значимость фактора xj равносильна значимости коэффициента bj.
Коэффициент bj незначим, если
bj =0
В этом случае xj
не влияет на y.
j=1, …, p.
Слайд 21Критерий Стьюдента проверки значимости фактора
Проверяется статистическая гипотеза H0 о незначимости
bj:
bj =0.
Вычисляется статистика Стьюдента Т:
где
- стандартное отклонение bj.
Гипотеза H0 отклоняется (коэффициент bj и фактор xj считаются значимыми) при выполнении неравенства:
|T|>t(α, n-p-1),
где t(α, n-p-1) - критическое (пороговое) значение статистики Стьюдента, это квантиль распределения Стьюдента, который выбирается из специальных таблиц или определяется с помощью встроенных функций вычислительной среды. Здесь >0 - это вероятность ошибки: принять зависимость y(x) значимой при условии, что это неверно.
Слайд 22Связь критериев Фишера и Стьюдента при р=1
Если p=1 (фактор x
один), то можно доказать, что
F=T2
f(α,1, n-2)=t2(α, n-2).
Таким образом, критерий Фишера и критерий Стьюдента дают одинаковые результаты.
Если фактор х один, то его значимость эквивалентна значимости линейной зависимости y(x).