Разделы презентаций


Применение метода наименьших квадратов для определения параметров линейной

Содержание

Постановка задачиПредполагается, что вещественная переменная y линейно зависит от нескольких вещественных переменных x. Пусть p - число переменных x.Надо оценить параметры линейной зависимости по наблюдениям x и y.Каждое наблюдение содержит

Слайды и текст этой презентации

Слайд 1Применение метода наименьших квадратов для определения параметров линейной функции нескольких

переменных
Лекция №11

Применение метода наименьших квадратов для определения параметров линейной функции нескольких переменных Лекция №11

Слайд 2Постановка задачи
Предполагается, что вещественная переменная y линейно зависит от нескольких

вещественных переменных x. Пусть p - число переменных x.Надо

оценить параметры линейной зависимости по наблюдениям x и y.
Каждое наблюдение содержит (p+1) значение: p значений x и одно значение y:
(xi,1 , xi,2 , …, xi,p , yi), i – номер наблюдения.
Всего имеется n наблюдений: i=1, 2, …, n.
Каждое наблюдение можно представить как точку (p+1)-мерного пространства.
Постановка задачиПредполагается, что вещественная переменная y линейно зависит от нескольких вещественных переменных x. Пусть p -

Слайд 3Постановка задачи
Обычно предполагают следующую модель (уравнение) формирования y:
y=b0+b1x1+b2x2+…+bpxp+ε, (1)
где b1, b2,

…, bp – коэффициенты линейной зависимости,
b0– сдвиг

линейной зависимости,
ε – случайная величина, включающая в себя все, что влияет на y, кроме x1, x2, …, xp.
Часто ε называют возмущением.
Иногда предполагается, что ε – это погрешность измерения y.
x1, x2, …, xp принято назвать входными или независимыми переменными, или факторами.
y принято назвать выходной или зависимой переменной, или откликом.

Рассмотрение уравнения (1), конечно, связано с предположением, что переменные x оказывают на y большее влияние, чем ε, то есть чем все остальные воздействия.


Постановка задачиОбычно предполагают следующую модель (уравнение) формирования y:y=b0+b1x1+b2x2+…+bpxp+ε,		(1)где b1, b2, …, bp – коэффициенты линейной зависимости,

Слайд 4Постановка задачи

Постановка задачи

Слайд 5Метод наименьших квадратов (МНК)
Оценка отклика в i-м наблюдении равна:
Разность между

откликом и его оценкой обозначается ei и называется остатком:
Qe –

сумма квадратов остатков или остаточная сумма:

(3)

(2)

Метод наименьших квадратов (МНК)Оценка отклика в i-м наблюдении равна:Разность между откликом и его оценкой обозначается ei и

Слайд 6МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Параметры зависимости y(x) определяются из условия минимума остаточной

суммы:
МНК также называется методом подгонки (из-за простоты идеи)

МЕТОД НАИМЕНЬШИХ КВАДРАТОВПараметры зависимости y(x) определяются из условия минимума остаточной суммы:МНК также называется методом подгонки (из-за простоты

Слайд 7Метод наименьших квадратов (МНК)
Запишем выражение (3) для остаточной суммы в

матричном виде.
Введем обозначения:
Тогда:

Метод наименьших квадратов (МНК)Запишем выражение (3) для остаточной суммы в матричном виде. Введем обозначения:Тогда:

Слайд 8Метод наименьших квадратов (МНК)
Запишем соотношение (2) для каждого наблюдения:
Обозначим:
Тогда:
Матрица X

состоит из n строк и (p+1) столбцов. Первый столбец состоит

из единиц. Это как бы наблюдения несуществующего, «фиктивного» фактора, введенного для того, чтобы не заниматься отдельно оценкой b0.
Метод наименьших квадратов (МНК)Запишем соотношение (2) для каждого наблюдения:Обозначим:Тогда:Матрица X состоит из n строк и (p+1) столбцов.

Слайд 9МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

Слайд 10Метод наименьших квадратов (МНК)
Из необходимого условия минимума остаточной суммы в

результате не очень сложных алгебраических преобразований можно получить:
Если квадратная

матрица XX является неособенной, то получаем формулу для оценок параметров зависимости y(x):

Эта формула является обобщением формулы (4) из лекции 9

Метод наименьших квадратов (МНК)Из необходимого условия минимума остаточной суммы в результате не очень сложных алгебраических преобразований можно

Слайд 11Остаточная сумма Qe характеризует отклонение (разброс, рассеяние) наблюдений относительно линейного

пространства, задаваемого соотношением:


Остаточная сумма Qe характеризует разброс (рассеяние, изменение) наблюдений

y за счет возмущений (воздействий, отличных от х).
Чем меньше остаточная сумма, тем значимей зависимость y(x1,x2, …,xp).
НО если ВСЕ коэффициенты b1, b2, …, bp равны (или близки к) 0, то y не зависит (мало зависит) от факторов даже если возмущений нет.
Нужен другой (дополнительный) критерий качества.

Оценка качества (значимости) зависимости y(x1,x2, …,xp)

Остаточная сумма Qe характеризует отклонение (разброс, рассеяние) наблюдений относительно линейного пространства, задаваемого соотношением:Остаточная сумма Qe характеризует разброс

Слайд 12QR- регрессионная сумма квадратов.
Оценка качества (значимости) зависимости y(x1,x2, …,xp)

QR- регрессионная сумма квадратов.Оценка качества (значимости) зависимости  y(x1,x2, …,xp)

Слайд 13Чем меньше остаточная сумма Qe, тем выше значимость зависимости y(x1,x2,

…,xp).
Чем больше регрессионная сумма QR, тем выше значимость зависимости y(x1,x2,

…,xp).
Чем больше отношение QR/Qe, тем выше значимость зависимости y(x1,x2, …,xp). Отношение QR/Qe –хороший критерий значимости:
Отношение безразмерно, не зависит от единиц измерений y.
Отношение учитывает и влияние на y фактора x, и влияние на y возмущений.

Оценка качества (значимости) зависимости y(x1,x2, …,xp)

Чем меньше остаточная сумма Qe, тем выше значимость зависимости y(x1,x2, …,xp).Чем больше регрессионная сумма QR, тем выше

Слайд 14Если F>f(; p;n-p-1), то линейную зависимость y(x) следует считать значимой.


Это строгий критерий, доказанный в математической статистике.
Критическое (пороговое) значение f(;

p;n-p-1) – это квантиль распределения Фишера, который выбирается из специальных таблиц или определяется с помощью встроенных функций вычислительной среды.
Здесь >0 - это вероятность ошибки: принять зависимость y(x) значимой при условии, что это неверно.
При р=1 получаем формулы из лекции 9.
.

Критерий Фишера проверки значимости зависимости y(x1,x2, …,xp)

Статистика Фишера:

Чем больше F, тем значимей зависимость y(x)

Если F>f(; p;n-p-1), то линейную зависимость y(x) следует считать значимой. Это строгий критерий, доказанный в математической статистике.Критическое

Слайд 15Полная (общая, дисперсионная) сумма наблюдений отклика:
Q характеризует полный разброс (рассеяние,

изменение) отклика относительно его среднего значения.
При не очень ограничительных условиях

выполняется равенство:
Q=QR+Qe.
Таким образом, полное изменение y складывается из его изменения за счет изменения х и изменения за счет возмущений.

Обратите внимание, что Q не зависит от b0, b1, …, bp, а зависит только от наблюдений отклика. Таким образом, минимизируя Qe, мы одновременно максимизируем QR, поскольку их сумма остается постоянной.
Полная (общая, дисперсионная) сумма наблюдений отклика:Q характеризует полный разброс (рассеяние, изменение) отклика относительно его среднего значения.При не

Слайд 16Зависимость y(x1,x2, …,xp) можно считать значимой при:
QR>Qe
В этом случае изменение

y более, чем на 50%, обусловлено изменением х.

Оценка качества

(значимости) зависимости y(x)
Зависимость y(x1,x2, …,xp) можно считать значимой при:QR>QeВ этом случае изменение y более, чем на 50%, обусловлено изменением

Слайд 17Оценка качества (значимости) зависимости y(x)
Коэффициент детерминации:
Коэффициент детерминации показывает, какая часть

изменения y объясняется изменением x.
При QR>Qe R2>0,5.
Таким образом, условие
R2>0,5
может быть

использовано как критерий значимости зависимости y(x1,x2, …,xp).
Оценка качества (значимости) зависимости y(x)Коэффициент детерминации:Коэффициент детерминации показывает, какая часть изменения y объясняется изменением x.При QR>Qe R2>0,5.Таким

Слайд 18Свойства коэффициента детерминации:
0R21.
Чем ближе R2 к единице, тем лучше регрессия

аппроксимирует наблюдения.
Если R2=1, то наблюдения лежат на

линии регрессии.
Если R2=0, то изменение зависимой переменной полностью обусловлены неучтенными в модели факторами, и линия регрессии параллельна оси ОХ.

Оценка качества (значимости) зависимости y(x1,x2, …,xp)

Свойства коэффициента детерминации:0R21.Чем ближе R2 к единице, тем лучше регрессия аппроксимирует    наблюдения. Если R2=1,

Слайд 19Оценка значимости каждого фактора
Критерии:
Фишера:F>f(; p;n-p-1)
QR>Qe
R2>0,5
Предназначены для проверки значимости соотношения (5)

в целом, то есть оценивания общего влияния на y всех

факторов.

Существует также задача проверки значимости каждого фактора. Это нужно, например, для того, чтобы определить, какие факторы можно исключить из модели, тем самым упростив модель.
Оценка значимости каждого фактораКритерии:Фишера:F>f(; p;n-p-1)QR>QeR2>0,5Предназначены для проверки значимости соотношения (5) в целом, то есть оценивания общего влияния

Слайд 20Оценка значимости каждого фактора
Значимость фактора xj равносильна значимости коэффициента bj.

Коэффициент bj незначим, если bj =0
В этом случае xj

не влияет на y.
j=1, …, p.
Оценка значимости каждого фактораЗначимость фактора xj равносильна значимости коэффициента bj. Коэффициент bj незначим, если  			 bj

Слайд 21Критерий Стьюдента проверки значимости фактора
Проверяется статистическая гипотеза H0 о незначимости

bj:
bj =0.
Вычисляется статистика Стьюдента Т:

где

- стандартное отклонение bj.
Гипотеза H0 отклоняется (коэффициент bj и фактор xj считаются значимыми) при выполнении неравенства:
|T|>t(α, n-p-1),
где t(α, n-p-1) - критическое (пороговое) значение статистики Стьюдента, это квантиль распределения Стьюдента, который выбирается из специальных таблиц или определяется с помощью встроенных функций вычислительной среды. Здесь >0 - это вероятность ошибки: принять зависимость y(x) значимой при условии, что это неверно.
Критерий Стьюдента проверки значимости фактораПроверяется статистическая гипотеза H0 о незначимости bj:			bj =0.Вычисляется статистика Стьюдента Т:

Слайд 22Связь критериев Фишера и Стьюдента при р=1
Если p=1 (фактор x

один), то можно доказать, что

F=T2
f(α,1, n-2)=t2(α, n-2).
Таким образом, критерий Фишера и критерий Стьюдента дают одинаковые результаты.
Если фактор х один, то его значимость эквивалентна значимости линейной зависимости y(x).



Связь критериев Фишера и Стьюдента при р=1Если p=1 (фактор x один), то можно доказать, что

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика