Слайд 1ОБРАБОТКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ И ЭКСПЕРИМЕНТОВ
Слайд 2Цель
Целью данной главы является ознакомление исследователя с основными методами
статистической обработки данных, а также с некоторыми приемами современной прикладной
математики.
Слайд 3Схема экспериментального исследования и типы обработки результатов
Слайд 4Дана упрощенная схема экспериментального исследования
Слайд 5Обозначая через вектор входа, будем в дальнейшем представлять
его массивом х = х[n0, nf], представленным в виде матрицы,
где
n0 — число опытов;
nf — число факторов;
— вектор выхода, чаще всего представляемый в виде единичного вектора
a — вектор помех (погрешностей).
На том же рисунке указаны обратные связи, которые следует иметь в виду в любом измерительном процессе, хотя их влияние зависит от конкретных условий.
Слайд 6Например, ясно, что влияние измерительного прибора-термометра на температуру жидкости в
большом баке несравнимо мало в сравнении с таким же влиянием
на ее температуру, если жидкость находится в стакане.
Перед тем, как приступить к эксперименту, исследователь должен уметь ответить на следующие вопросы:
что мерить?
чем мерить?
где мерить?
какова точность измерений?
что делать с результатами измерений?
Слайд 7Например , измерение температуры термометром или измерение скорости через длину
отрезка и времени его прохождения. Ясно, что методы определения погрешностей
в этих случаях различные. Это обстоятельство еще осложняется и тем, что измерения могут производиться приборами с различной точностью (неравноточные измерения).
Слайд 8Погрешности или ошибки в первом приближении
классифицируются следующим образом:
1. Грубые, или промахи. Они относительно легко определяются
по их отклонению от среднего значения на основании "правила 3σ".
2. Систематические, учитывающие тарировку измерительного прибора.
3. Случайные, являющиеся следствием многих мелки факторов. Часто они подчиняются закону нормального распределения (закону Гаусса), хотя в каждом конкретном случае требуется проверка.
Слайд 9Типы обработки результатов измерений
Слайд 10Задачи обработки опытных данных условно можно разбить на две группы:
1. Определяется значение одной величины х. Для этого производится ряд
опытов, в результате которых измеряю значения этой неизвестной величины.
2.Определяется связь между зависимой переменной у и одним или несколькими вектор-факторами х. Эта связь может быть качественной и количественной.
Слайд 11 Определение значений одной величины
Слайд 12Пример
В табл. 1 приведены результаты измерения некоторой величины.
Требуется определить доверительные интервалы в зависимости от значения принятой вероятности
( Р=0,95 и Р=О,99) и числа степеней свободы (f = n0-1).
Слайд 13Производим вычисления
х = 172,6/16 = 10,76;
Слайд 14По таблицам Стьюдента-Фишера находим,
что при f = 15 и
Р = 0,95 t = 1,753 и при f =
15 и Р = 0,99 t = 2,947, а доверительные интервалы [10,76-0,12; 10,76+0,12] и [10,76-0,20;10,76+0,20] соответствующим образом накроют истинное значение измеряемой величины х с вероятностями Р = 0,95 и Р = 0,99 соответственно.
Слайд 15Рассмотрим обратную задачу.
Пусть даны доверительные интервалы Д=±10% и Р=0,95.
Требуется таким образом определить выборочную среднюю , чтобы генеральная
средняя величина попадала в интервал х ± Д. При этом желательно произвести минимальное число опытов.
Слайд 16Составим с этой целью таблицу 2, заполняя ее строки, начиная
а второй, по приведенным выше формулам. Далее, по числу степеней
свободы f = n0 -1 и значению t находим вероятность Р (по таблице Стьюдента).
Таблица 2
Слайд 17 Из данных таблицы 2 видно, что Р вначале
колеблется, а при n0=6 его значение стабилизируется, достигая значения Р
= 0,95. Два последующих опыта подтверждают полученный вывод.
Слайд 18 В тех случаях, когда х меняется в больших пределах
строят гистограмму и определяют числовые моменты более высокого порядка, по
которым судят о типе распределения случайной величины х.
Слайд 20Качественные исследования - анализ влияния некоторых факторов на выходную величину
тогда, когда эти факторы нельзя представить численно.
Количественные исследования имеют
место тогда, когда результаты наблюдения или опытов могут быть представлены в виде зависимости y=f (х1, х2,…, хnf).
Слайд 21Рассмотрим сущность МНК на примере линейной функции у = а0+а1х,
для которой заданы наборы значений фактора хi и соответствующие уi.
Требуется
найти значение коэффициентов многочлена а0 и а1, таким образом, чтобы сумма квадратов невязок (отклонений) Δ = уi –yai была минимальной.
Слайд 22Для этого следует минимизировать величину
Слайд 23необходимо выполнить условия
или
Слайд 24После дифференцирования и упрощения выражений получим систему уравнений
Слайд 25Статистическая проверка гипотез.
Критерии оценки качества аппроксимации
Слайд 26Статистическая проверка гипотез
Рассмотрим этот метод на примере однофакторного дисперсионного анализа.
Пусть имеется ряд значений случайной величины, которая изменяется
за счет влияния какого-то признака при следующих обозначениях:
n0 — общее число наблюдений;
nq — число групп, т.е. число значений признака;
nj— число значений в каждой группе;
— общее среднее значение;
— групповое среднее.
Слайд 27Сумму квадратов результатов наблюдений SCt можно представить в виде суммы
квадратов SCi внутри каждой группы вокруг группового среднего
и суммы квадратов
этих средних величин вокруг общего среднего значения
Слайд 28Эти выражения можно представить в другом виде
Слайд 29Для вычисления на компьютере:
где SCe — доля общей
суммы квадратов, объясняемая гипотезой и возникающая из-за изменения признака; SCi
— сумма квадратов, характеризующая неучтенные факторы и другие причины.
Слайд 30Суммы квадратов сопоставляются с учетом степеней свободы.
Оценки дисперсии равны
соответственно
В тех случаях, когда SCe ≈ SCt, ошибок нет
и аппроксимация "точная". Если же признак не влияет на значение случайной величины, то , т.е. это величины одного порядка.
Слайд 31Общий случай
Дано: генеральная совокупность и две выборки объема n1
и n2. Мы хотим проверить гипотезу H0 – являются ли
две эти выборки частями одной генеральной совокупности или же верна альтернативная гипотеза H1 о том, что они не принадлежат одной генеральной совокупности.
Слайд 32Общий случай
- дисперсия
- выборочные дисперсии 1 и 2
и
В
математической статистике рассматриваются случайные величины
и
, которые распределены по закону
соответственно с
и
степенями свободы
Вводится критерий F (Фишера), определяемый соотношением:
Слайд 33Оценка адекватности аппроксимации эмпирического выражения
Как известно, при линейной аппроксимации у=а0+а1х
для оценки ее качества используют коэффициент корреляции
или r = a1Sx/Sy.
Слайд 34Существуют и более эффективные критерии оценки аппроксимации.
Например, выдвигая гипотезу
Н0 о той что ошибка аппроксимации Sa и ошибка эксперимента
Sе величины одного порядка, т.е. взяты из одной генеральной совокупности, а также учитывая, что
Слайд 35а величина Se определяется из опыта, где nk число коэффициентов
аппроксимирующего выражения, для принята гипотезы или отказа от нее применяют
F-критерий Фишера
Слайд 36Второй критерий базируется на использовании выражении
характеризующего относительное уменьшение неопределенности при
аппроксимации статистических данных эмпирческой формулой.
Слайд 37Величина критерия І2 находится в диапазоне 0÷1 и чем ближе
к единице это значение, тем меньше разногласие между статистическими данными
и аппроксимацией. На практике используют критерии
в котором поправка ft / fi = (n0-1) / (n0-nk) указывает на то, что имеем дело с небольшим числом степеней свободы. Благодаря этому оценка становится несмешанной.
Слайд 38Отметим, что дисперсия аппроксимации
при малых fi=n0-nk может стать больше,
чем , и тогда его величина
определяется алгоритмически:
Слайд 39Применение относительной ошибки для оценки аппроксимации
Часто возникает вопрос о
целесообразности многократного повторения опытов для нахождения экспериментальной дисперсии. В этой
связи может возникнуть вопрос о том, не лучше ли дополнительные опыты проводить, равномерно распределяя их по экспериментальному полю? Таким образом, иногда можно еще получить данные об экстремальных областях по зависимому параметру.
Слайд 40Применение относительной ошибки для оценки аппроксимации
Обозначим через V∞ (%)
допустимую вариацию или относительную ошибку (2, 3 или 8%). При
обработке данных находим относительную ошибку данного эксперимента или наблюдения по формуле
V=Sa/Ycp·100%,
где дисперсия аппроксимации
а величины уi и yai выражают соответственно опытные и расчетные значения зависимой величины.
Слайд 41
При числе степеней свободы f = n0-nk → ∞,
т.е. исходя из предположения, что символ ∞ является результатом
многочисленных ранее проводимых опытных исследований, имеем
V∞= S∞ / Ycp,
Слайд 42Для удобства пользования зависимость F=V2/V2∞ можно представить графически.
Слайд 43На рисунке приведен график критерия Фишера, где по
оси абсцисс f1=fa откладывается число степеней свободы числителя аппроксимации,
а по оси ординат — вариация аппроксимации V(%).
Кривые V(%) соответствуют верхнему пределу области V ≤ √FtV∞ , в которой гипотеза принимается.
Слайд 44
Математическое обеспечение для обработки результатов наблюдений и экспериментов
Слайд 45В пределах настоящего курса не ставилась цель показать все множество
формул, процедур и программ современной прикладной математики для обработки результатов
экспериментов. Ограничимся некоторыми программами, которые на практике оказались очень эффективными для решения широкого класса задач.
Для качественного анализа предлагается небольшая программа "ДИСПЕРСИЯ", в которой решается задача дисперсионного анализа при одном признаке. Программы ТОЛИНОМ", "МИНИ", "ФКВ" и "ФИЛЬТР" служат для обработки числовых данных, а программа "УРАВНЕНИЕ" - для решения уравнений.
Слайд 46Программа "ПОЛИНОМ"
Программа "Полином" предназначена для получения статистических
(регрессионных) зависимостей ya=F(х1,...,ХHF) величины уа ряда независимых величин-факторов, Эта
зависимость чаще всего имеет вид многочлена
где искомые коэффициенты аij (входящие линейно) определяются по методу наименьших квадратов.
Слайд 47Программа может быть использована и для нелинейных случаев при соответствующей
линеаризации.
Особенность программы заключается в том, что вид многочлена (количество и
тип членов) задается пользователем путем введения матрицы индексов MI.
Работа программы определяется четырьмя исходными параметрами:
числом факторов - nf≥0
числом опытов (или наблюдений) – no>0
числом определяемых коэффициентов - nk≥1
числом индексов в каждом члене полинома - ni≥1
Слайд 48Программа "Мини"
Программа предназначена для поиска минимума функции любого типа:
линейной или нелинейной, с ограничениями или без. В программу "МИНИ"
включена подпрограмма "ГРАДИЕНТ", которая позволяет решать простые случаи поиска экстремума (минимума).
Слайд 49Подпрограмма "Шаг"
Эта подпрограмма является основным элементом детерминированного метода, в
котором происходит поиск локального минимума функции φ .
Слайд 50"ФКВ" - программа фильтрации исходных данных, корреляции между независимыми факторами
и оценки их влияния
Часто при обработке наблюдений или экспериментальных
результатов необходимо провести фильтрацию исхоных данных - элементов массива факторов x (no, nf) зависимой величины у (nо). Фильтрация данных обозначает определение грубых ошибок или промахов, которые не следует учитывать при дальнейшей обработке.
Слайд 51Иногда при проведении наблюдений или при неправильно спланированном эксперименте имеет
место сильная корреляция между "независимыми факторами. Не учет этой корреляции
может привести к получению плохо обусловленной матрицы при использовании программы "ПОЛИНОМ" и искаженным выводам при любом методе обработки.
Слайд 52Наконец, часто бывает полезным оценивать влияние независимых переменных х (no
, nf ) на зависимую у (nо) до подробной их
обработки. Такую оценку можно осуществить при помощи дисперсионного анализа.
Таким образом, программа "ФКВ" позволяет решать задачи дисперсионного анализа и состоит из трех основных частей.
Слайд 53Программа «Дисперсия»
Дисперсионный анализ служит для оценки влияния на какой-то процесс
факторов, которые не могут быть представлены числами.
Слайд 54Например, если требуется оценить точность измерения одной и той же
величины различными аппаратами А, В, С,… и т.д., тогда
SC=SCt+SCe,
т.е.
общая сумма квадратов отклонений равна внутригрупповой сумме квадратов сложенной с межгрупповой суммой квадратов отклонений между расчетными значениями и опытными
При помощи этой программы определяются эти суммы и критерии Фишера F
Слайд 55Программа "УРАВНЕНИЕ"
Эта программа служит для решения линейных или нелинейных
уравнений методом половинного деления. Предлагаемый вариант построен по следующей схеме.
Даны пределы области, где имеются один или более корней уравнения. Начиная с нижнего предела с заданным шагом решается уравнение на примере
y=1/x + LOC(x)-2=O.
Слайд 56Если знак двух последующих значений у одинаковый, ход действия продолжается
еще на одни шаг. Если знак меняется, программа переходит к
подпрограмме, где происходит деление шага пополам и дальнеший ход производится согласно операторам 300-400. Операция деления интервала заканчивается тогда, когда абсолютное значение величины у становится меньше допустимой ошибки.
Решаемое уравнение вводится в оператор в форме DEF FNY = f(x)
Слайд 57Программа "Фильтр"
Эта программа предназначена для решения следующей задачи. Дана запись
некоторой величины у (например, траектория элемента машины в движении). Выписываем
ряд значений у через равные интервалы. Этот выбор значения у назовем экспериментальными точками. Из-за вибрации ряд у имеет скачки и неровности, что требует сглаживания данных.
Слайд 58После сглаживания вычислить скорость и ускорения, необходимые для расчета усилий,
действующих на данный элемент машины. Программа имеет два варианта сглаживания
по методу наименьших квадратов.