Разделы презентаций


Описательная статистика

Содержание

Неверно организованный эксперимент не спасет никакой статистический анализ.

Слайды и текст этой презентации

Слайд 1Описательная статистика
И.И.Косаговская

Описательная статистикаИ.И.Косаговская

Слайд 2
Неверно организованный эксперимент не спасет никакой статистический анализ.

Неверно организованный эксперимент не спасет никакой статистический анализ.

Слайд 3 Что представляет из себя исследователь,закончивший сбор материала?

Что представляет из себя исследователь,закончивший сбор материала?

Слайд 4Какой представляется исследователю обработка результатов?

Какой представляется исследователю обработка результатов?

Слайд 5Основные этапы статистического анализа
- Описание полученного массива данных
- Анализ данных

и проверка различных гипотез

Основные этапы статистического анализа- Описание полученного массива данных- Анализ данных и проверка  различных гипотез

Слайд 6Описание полученного массива данных Descriptive Statistics
Прежде чем приступать к

описанию признака, определите его тип.


Описание полученного массива данных  Descriptive Statistics Прежде чем приступать к описанию признака, определите его тип.

Слайд 7ВНИМАНИЕ !
От типа признака зависит выбор статистического пути его описания

(обобщения)

ВНИМАНИЕ !От типа признака зависит выбор статистического пути его описания (обобщения)

Слайд 8
Признаки, или переменные (variables), могут принимать различные конкретные значения (values).

Признаки, или переменные (variables), могут принимать различные конкретные значения (values).

Слайд 9Типы признаков ( виды шкал)
Качественные, категориальные
(qualititative, сategorical)
Номинальные (Nominal) (частный

случай : бинарные, дихотомические (Binary – dichotomous)
Порядковые, ординальные, ранжируемые (Ordinal)
Количественные,

интервальные (quantitative, numerical, interval)
Дискретные (Discrete)
Непрерывные (Continuous)

Типы признаков ( виды шкал)Качественные, категориальные 	(qualititative, сategorical)Номинальные (Nominal) (частный случай : бинарные, дихотомические (Binary – dichotomous)Порядковые,

Слайд 10Описательная статистика
- занимается представлением и описанием данных и включает:
Методы представления

данных (таблицы, гистограммы и т.д.)
Описание массива данных

Описательная статистика- занимается представлением и описанием данных и включает:Методы представления данных (таблицы, гистограммы и т.д.)Описание массива данных

Слайд 11Описание массива данных
Номинальные и порядковые (ординальные) признаки описываются (обобщаются) путем

расчета доли (пропорции, относительной частоты)


Описание массива данных	Номинальные и порядковые (ординальные) признаки описываются (обобщаются) путем расчета доли (пропорции, относительной частоты)

Слайд 12Описание массива данных
Единственный способ описать качественные признаки заключается в расчете

доли от общего числа объектов (или пропорции), которая приходится на

то или иное значение.
Описание массива данныхЕдинственный способ описать качественные признаки заключается в расчете доли от общего числа объектов (или пропорции),

Слайд 13где n1 и n2 – численности групп (имеющих и не

имеющих изучаемый признак), а n=n1+n2 – численность всей совокупности.

Доля

может быть выражена в процентах:
где n1 и n2 – численности групп (имеющих и не имеющих изучаемый признак), а  n=n1+n2 –

Слайд 14Описание массива данных
Эти величины чаще всего используются для характеристики структуры

изучаемой совокупности или оценки частоты изучаемого явления в популяции.
Масштабирующим

коэффициентом может быть
100 (%), 1000 (‰), 10 000 ( ), 100 000 ( ).



Описание массива данныхЭти величины чаще всего используются для характеристики структуры изучаемой совокупности или оценки частоты изучаемого явления

Слайд 15Пример
Был выделен 21 кишечный паразит при обследовании детей:
Giardia lamblia
Entamoeba

histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris lumbricoides
Enterobius vermicularis
Giardia lamblia

Giardia lamblia
Entamoeba histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris

lumbricoides
Enterobius vermicularis
Giardia lamblia

Giardia lamblia
Entamoeba histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris lumbricoides
Enterobius vermicularis
Giardia lamblia

ПримерБыл выделен 21 кишечный паразит при обследовании детей: Giardia lambliaEntamoeba histolyticaAscaris lumbricoidesEnterobius vermicularisAscaris lumbricoidesEnterobius vermicularisGiardia lambliaGiardia lambliaEntamoeba

Слайд 16Пример Визуальное упорядочивание
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris

lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Entamoeba

histolytica
Entamoeba histolytica
Entamoeba histolytica

Пример  Визуальное упорядочиваниеGiardia lambliaGiardia lambliaGiardia lambliaGiardia lambliaGiardia lambliaGiardia lambliaAscaris lumbricoidesAscaris lumbricoidesAscaris lumbricoidesAscaris lumbricoidesAscaris lumbricoidesAscaris lumbricoidesEnterobius vermicularisEnterobius

Слайд 17Пример
Частотное распределение

ПримерЧастотное распределение

Слайд 18Пример
Распределение относительных частот (долей, пропорций)

ПримерРаспределение относительных частот (долей, пропорций)

Слайд 19Описание массива данных
Описание (обобщение) количественного признака:

1. Оценка центральной тенденции

2. Оценка

разнообразия (разброса, рассеяния).

Описание массива данныхОписание (обобщение) количественного признака:1. Оценка центральной тенденции2. Оценка разнообразия (разброса, рассеяния).

Слайд 20

ВНИМАНИЕ !
От вида распределения зависит выбор статистического пути описания (обобщения)

и анализа количественного признака

ВНИМАНИЕ !				От вида распределения зависит выбор статистического пути описания (обобщения) и анализа количественного признака

Слайд 21Вид распределения
Под видом распределения случайной величины понимают соответствие, устанавливаемое между

всеми возможными числовыми значениями случайной величины и вероятностями их появления

в совокупности.

Вид распределения	Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными числовыми значениями случайной величины и

Слайд 22Вид распределения
Вид (закон) распределения может быть представлен:
- аналитической зависимостью в

виде формулы;
- в виде графического изображения;
- в виде таблицы

Вид распределения	Вид (закон) распределения может быть представлен:		- аналитической зависимостью в виде формулы;	- в виде графического изображения;	- в

Слайд 23Виды распределения
Нормальное (гауссово, симметричное, колоколообразное) распределение (normal, Gaussian distribution)– описывает

совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов

(по сравнению с общей суммой факторов), число которых неограничено велико.
Встречается в природе наиболее часто, за что и получило название «нормального».
Характеризует распределение непрерывных случайных величин.

Виды распределения	Нормальное (гауссово, симметричное, колоколообразное) распределение (normal, Gaussian distribution)– описывает совместное воздействие на изучаемое явление небольшого числа

Слайд 24Кривая нормального распределения

Значение признака
Число больных

Кривая нормального распределенияЗначение признакаЧисло больных

Слайд 25
Биномиальное (Бернулли) распределение (binomial, Bernoulli distribution) – описывает распределение частоты

события, обладающего постоянной вероятностью появления при многократных испытаниях.
При большом

числе испытаний стремиться к нормальному.
Биномиальное (Бернулли) распределение (binomial, Bernoulli distribution) – описывает распределение частоты события, обладающего постоянной вероятностью появления при многократных

Слайд 26Биномиальное распределение

Биномиальное распределение

Слайд 27
Крайним вариантом биномиального распределения является альтернативное распределение, при котором вся

совокупность распределяется на две части (две альтернативы).
Биномиальное распределение характеризует

распределение дискретных случайных величин.

Крайним вариантом биномиального распределения является альтернативное распределение, при котором вся совокупность распределяется на две части (две альтернативы).

Слайд 28
Распределение Пуассона – описывает события, при которых с возрастанием значения

случайной величины, вероятность появления ее в совокупности резко уменьшается.
Распределение

Пуассона характерно для редких событий и может рассматриваться также как крайний вариант биномиального. Характеризует распределение дискретных случайных величин.

Распределение Пуассона – описывает события, при которых с возрастанием значения случайной величины, вероятность появления ее в совокупности

Слайд 30
Вид распределения
нормальное
отличное от
нормального
Параметрическая
статистика
Непараметрическая статистика

Вид распределениянормальноеотличное от нормальногоПараметрическаястатистикаНепараметрическая статистика

Слайд 31
Непараметрические методы:
не требуют предварительного знания вида распределения;
не требуют предварительного расчета

параметров распределения(средних величин, стандартного отклонения и др.);
позволяют сравнивать совокупности с

номинальными и порядковыми признаками;
просты в применении.

Непараметрические методы:не требуют предварительного знания вида распределения;не требуют предварительного расчета параметров распределения(средних величин, стандартного отклонения и др.);позволяют

Слайд 32
Отрицательные стороны непараметрических методов:
обладают меньшей мощностью, чем параметрические;
имеют существенные ограничения

в применении по числу наблюдений

Отрицательные стороны непараметрических методов:обладают меньшей мощностью, чем параметрические;имеют существенные ограничения в применении по числу наблюдений

Слайд 33
Вариационный ряд (frequency table)- ранжированный ряд распределения по величине какого-либо

признака.
Этот признак носит название варьирующего, а его отдельные числовые

значения называются вариантами и обозначаются через "х".
Число, показывающее, сколько раз данная варианта встречается в вариационном ряду, называется частотой и обозначается через "р"



Вариационный ряд (frequency table)- ранжированный ряд распределения по величине какого-либо признака. 	Этот признак носит название варьирующего, а

Слайд 34
Результаты измерения частоты пульса у некурящих студентов-медиков в возрасте 20

лет:
68,58,65,55,70,62,60,65,70,58,62,58,62,60,60,65,62,55,
62,58,60,70,62,65,60,68,65,62,68,65,60,62,60,68,65,60,
62,60,65,62,68
Построим вариационный ряд:


Результаты измерения частоты пульса у некурящих студентов-медиков в возрасте 20 лет:	68,58,65,55,70,62,60,65,70,58,62,58,62,60,60,65,62,55,	62,58,60,70,62,65,60,68,65,62,68,65,60,62,60,68,65,60,	62,60,65,62,68	Построим вариационный ряд:

Слайд 35

Вариационный ряд можно разбивать на отдельные части, которые называются

квантилями (quantile).

Название квантилей Число частей, на которые разбивается ряд
Медиана 2
Терциль 3
Квартиль 4
Дециль 10
Процентиль 100
 

Вариационный ряд можно разбивать на отдельные части, которые называются квантилями (quantile). 	Название квантилей 	Число частей, на

Слайд 36Виды вариационных рядов:
В зависимости от вида случайной величины :
дискретный
непрерывный

В

зависимости от группировки вариант:
несгруппированный
сгруппированный (интервальный)

В зависимости от частоты,

с которой каждая варианта встречается в вариационном ряду:
 простой ( р =1);
взвешенный ( р >1).



Виды вариационных рядов:	В зависимости от вида случайной величины :дискретныйнепрерывный 	В зависимости от группировки вариант: несгруппированный сгруппированный (интервальный)	В

Слайд 37ХАРАКТЕРИСТИКИ (МЕРЫ) ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Показатели, характеризующие центральную тенденцию (central tendency) :
средние

величины, медиана, мода

ХАРАКТЕРИСТИКИ (МЕРЫ) ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ	Показатели, характеризующие центральную тенденцию (central tendency) :	средние величины, медиана, мода

Слайд 38ХАРАКТЕРИСТИКИ РАЗБРОСА (РАЗНООБРАЗИЯ)
Показатели, характеризующие разнообразие (рассеяние, вариацию, разброс) (spread) признака:


размах, стандартное отклонение, дисперсия, интерквартильный интервал, коэффициент вариации

ХАРАКТЕРИСТИКИ РАЗБРОСА (РАЗНООБРАЗИЯ)	Показатели, характеризующие разнообразие (рассеяние, вариацию, разброс) (spread) признака: 	размах, стандартное отклонение, дисперсия, интерквартильный интервал, коэффициент

Слайд 39
Выбор характеристик центральной тенденции и разнообразия признака прежде всего зависит

от вида распределения.

Выбор характеристик центральной тенденции и разнообразия признака прежде всего зависит от вида распределения.

Слайд 40
Вид распределения


оценка центральной тенденции
средняя


арифметическая, мода, медиана

мода, медиана
нормальное
отличное от
нормального

Вид распределенияоценка    центральной    тенденциисредняя арифметическая, мода, медианамода, медиананормальноеотличное от нормального

Слайд 41Средняя величина - обобщающий коэффициент, который характеризует наиболее типичный размер

определенного признака в целом для совокупности или для отдельных ее

частей.
Средняя величина - обобщающий коэффициент, который характеризует наиболее типичный размер определенного признака в целом для совокупности или

Слайд 42Расчет средних величин имеет смысл только для качественно однородной совокупности,

в связи с этим в одной совокупности может быть столько

средних, на сколько однородных групп она может быть разбита.

Расчет средних величин имеет смысл только для качественно однородной совокупности, в связи с этим в одной совокупности

Слайд 43Виды средних величин
Средняя арифметическая(mean) - применяется, если варианты возрастают

(убывают) в арифметической прогрессии.





х - средняя арифметическая;
xi - варианта;
р -

частота встречаемости варианты;
n - число наблюдений
Виды средних величин 	Средняя арифметическая(mean) - применяется, если варианты возрастают (убывают) в арифметической прогрессии.х - средняя арифметическая;xi

Слайд 44 Средняя геометрическая - вычисляется, если варианты возрастают (убывают) в

геометрической прогрессии


На практике используют логарифмированную формулу:
Виды средних величин

Средняя геометрическая - вычисляется, если варианты возрастают (убывают) в геометрической прогрессии На практике используют логарифмированную формулу:

Слайд 45Структурные средние
Мода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду

варианта
Мода используется:
при малом числе наблюдений, когда велико влияние

состава совокупности на среднюю ;
для характеристики центральной тенденции при ассиметричных распределениях, когда велико влияние на среднюю крайних вариант;

Структурные средниеМода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду  варианта 	Мода используется:при малом числе наблюдений,

Слайд 46Структурные средние
Медиана (Me)(median) - варианта, которая делит вариационный ряд на

две равные части.
При нечетном количестве значений медиана всегда будет совпадать

с одним из измеренных значений. При четном количестве медиана будет средним арифметическим двух соседних значений.
Медиана используется:
при необходимости знать, какая часть вариант лежит выше и ниже срединного значения ;
для характеристики центральной тенденции при ассиметричных распределениях .


Структурные средниеМедиана (Me)(median) - варианта, которая делит вариационный ряд на две равные части.При нечетном количестве значений медиана

Слайд 47Пример
Mean = 62,7 уд.в мин.
Moda = 62 уд.в мин.
Median

= 62 уд.в мин.

ПримерMean = 62,7 уд.в мин. Moda = 62 уд.в мин.Median = 62 уд.в мин.

Слайд 49Средняя может вводить в заблуждение
Group 1 data: 1,1,1,2,3,3,5,8,20
Mean: 4.9

Median: 3 Mode: 1
Group 2 data: 1,1,1,2,3,3,5,8,10
Mean: 3.8

Median: 3 Mode: 1
Когда объем совокупности небольшой, единичные значения, резко отличающиеся по своей величине от остальных, оказывают большое влияние на размер средней, при этом практически не влияя на моду и медиану.
В этом случае мода и медиана более информативны, чем средняя.
Средняя может вводить в заблуждениеGroup 1 data: 1,1,1,2,3,3,5,8,20Mean: 4.9  Median: 3  Mode: 1Group 2 data:

Слайд 50Характеристики разнообразия вариационного ряда
Размах вариации (амплитуда) (range)

А = Хmах –

Xmin

А = 70 – 55 = 15 (уд.в мин.)

Характеристики разнообразия вариационного ряда	Размах вариации (амплитуда) (range)				А = Хmах – Xmin				А = 70 – 55 = 15

Слайд 51Характеристики разнообразия (разброса)
  Стандартное отклонение (среднее квадратическое отклонение) (standard deviation,

SD)


δ (SD)=

Характеристики разнообразия (разброса)  Стандартное отклонение (среднее квадратическое отклонение) (standard deviation, SD) δ (SD)=

Слайд 52Правило трех сигм

68.3 % всех вариант отклоняются от средней
не

более, чем на 1σ;
95.4% вариант находятся в пределах

± 2σ;
99.7% вариант находятся в пределах ± 3σ



Правило трех сигм68.3 % всех вариант отклоняются от средней 	не более, чем на 1σ;95.4% вариант находятся в

Слайд 54Наиболее распространенные ошибки: средняя арифметическая используется для характеристики признаков с

«анормальным» распределением или для порядковых признаков
Уровень глюкозы 8,2 ±

7,5 ммоль/л

Выраженность боли: 2,5 ± 1,2 балла
(1 – слабая, 2 – средняя, 3 – сильная)



Наиболее распространенные ошибки: средняя арифметическая используется для характеристики признаков с «анормальным» распределением или для порядковых признаков Уровень

Слайд 55
Возраст больных составлял от 18 до 68 лет (средний возраст

- 22,8±4,2 года).
3 сигмы=12,6 ; 10,2 ↔ 35,4
Сроки поступления

больных составили от 1 до 9 дней (в среднем 2,2±1,4 дня).
3 сигмы=4,2; -2 ↔ 6,4
Возраст больных составлял от 18 до 68 лет (средний возраст - 22,8±4,2 года). 	3 сигмы=12,6 ; 	10,2

Слайд 56Характеристики разнообразия (разброса)
Дисперсия (варианса) (variance)






Характеристики разнообразия (разброса) Дисперсия (варианса) (variance)

Слайд 57Характеристики разнообразия (разброса)
Коэффициент вариации (variation coefficient) 

· 100 %

Характеристики разнообразия (разброса)Коэффициент вариации (variation coefficient)  ·  100 %

Слайд 58Характеристики разнообразия (разброса)
Вариационный ряд
- считается однородным при Cv

% ,
- обладающим средней вариабельностью (разнообразием) при Сv =10-15%

- обладающим значительной вариабельностью
при Cv >15% .

Характеристики разнообразия (разброса)	Вариационный ряд - считается однородным при Cv 15% .

Слайд 59Характеристики разнообразия (разброса)
Коэффициент вариации используется при сравнении вариационных рядов, имеющих

различную размерность,
или одной размерности, но обладающими резкими различиями в

своих значениях, затрудняющими их сопоставление.
Характеристики разнообразия (разброса)Коэффициент вариации используется при сравнении вариационных рядов, имеющих различную размерность, 	или одной размерности, но обладающими

Слайд 60Характеристики разнообразия (разброса)
Интерквартильный интервал (inter-quartile range, IQR)

Характеристики разнообразия (разброса)Интерквартильный интервал (inter-quartile range, IQR)

Слайд 61Характеристики разнообразия вариационного ряда
Вариационный ряд разбивают на четыре интервала, получая,

соответственно, 25%, 50% и 75% квантили;
25% и 75% квантили

называют также нижним (low quartile) и верхним квартилями(high quartile).
50% квантиль – это медиана.
Внутри интерквартильного интервала (между 25% и 75% квантилями) лежат 50% наиболее типичных (близких к центральному) значений.

Характеристики разнообразия вариационного рядаВариационный ряд разбивают на четыре интервала, получая, соответственно, 25%, 50% и 75% квантили; 25%

Слайд 62Interquartile range (IQR) = Q3 – Q1 = 175 –

132 = 43

Outlier Test: 1.5 × IQR = 1.5 ×

43 = 64.5
Q1 – 1.5 × IQR = 135 – 64.5 = 70.5
Q3 + 1.5 × IQR = 175 + 64.5 = 239.5
Interquartile range (IQR) = Q3 – Q1 = 175 – 132 = 43Outlier Test: 1.5 × IQR

Слайд 63Первый квартиль (Q1) — это точка на шкале измеренных значений,

ниже (левее) которой располагаются 25 % измеренных значений.
Второй квартиль

(Q2) — это точка, ниже (левее) которой располагаются 50 % измеренных значений.
Второй квартиль также называется медианой.
Третий квартиль (Q3) — это точка на шкале измеренных значений, ниже (левее) которой располагаются 75 % значений.
Первый квартиль (Q1) — это точка на шкале измеренных значений, ниже (левее) которой располагаются 25 % измеренных

Слайд 64Пример
Group 1 data: 1,1,1,2,3,3,5,8,20
Mean: 4.9 Median: 3
Group 2

data: 1,1,1,3,3,3,5,8,10
Mean: 3.8 Median: 3
SDs: group 1: 6.1 group 2:

3.2
Interquartile range: 1,5

Пример Group 1 data: 1,1,1,2,3,3,5,8,20Mean: 4.9  Median: 3Group 2 data: 1,1,1,3,3,3,5,8,10Mean: 3.8  Median: 3SDs: group

Слайд 65Вид распределения

Оценка разнообразия (разброса)
стандартное


отклонение
SD
нормальное
отличное от
нормального
интерквартильный интервал
IQR

Вид распределения  Оценка   разнообразия   (разброса)стандартное отклонениеSDнормальноеотличное от нормальногоинтерквартильный интервалIQR

Слайд 66В случае нормального распределения вариационный ряд описывается средней величиной и

стандартным отклонением.

В случае нормального распределения вариационный ряд описывается средней величиной и стандартным отклонением.

Слайд 67Если распределение неизвестно или оно отлично от нормального центральную тенденцию

и разброс можно описать с помощью медианы, нижнего и верхнего

квартиля (интерквартильным интервалом).

Если распределение неизвестно или оно отлично от нормального центральную тенденцию и разброс можно описать с помощью медианы,

Слайд 68Проверка нормальности распределения
По соотношению средней арифметической, моды и медианы:
при

нормальном распределении, которое обладает симметричностью:


правило "двух третей" Юла:


Проверка нормальности распределения	По соотношению средней арифметической, моды и медианы: при нормальном распределении, которое обладает симметричностью:правило

Слайд 69Проверка нормальности распределения
если распределение симметрично:
Me = Mo
если распределение

обладает правосторонней асимметрией: Me > Mo
если распределение имеет левостороннюю асимметрию:

Me < Mo

Проверка нормальности распределения если распределение симметрично: 		Me = Moесли распределение обладает правосторонней асимметрией: Me > Moесли распределение

Слайд 70Проверка нормальности распределения
По коэффициенту асимметрии (skewness):


если распределение симметрично:

= 0
при правосторонней асимметрии: > 0
при

левосторонней асимметрии: < 0








Проверка нормальности распределенияПо коэффициенту асимметрии (skewness):если распределение симметрично:    = 0при правосторонней асимметрии:

Слайд 72Проверка нормальности распределения
Kurtosis (Коэффициент эксцесса):
Коэффициент указывает, является ли распределение

пологим (при большом значении коэффициента) или островершинным. Коэффициент вариации равен

нулю, если наблюдения подчиняются нормальному распределению.
Если коэффициент вариации значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть.

Проверка нормальности распределения	Kurtosis (Коэффициент эксцесса): Коэффициент указывает, является ли распределение пологим (при большом значении коэффициента) или островершинным.

Слайд 73Вершина более крутая, чем для нормального распределения: эксцесс положительный, имеются

длинные хвосты распределения; Вершина положе: эксцесс отрицательный, имеются короткие хвосты распределения.

Вершина более крутая, чем для нормального распределения: эксцесс положительный, имеются длинные хвосты распределения; Вершина положе: эксцесс отрицательный,

Слайд 74Проверка нормальности распределения
Если Ме занимает срединное положение между 25-м и

75-м процентилем, то распределение близко к нормальному.

Проверка нормальности распределенияЕсли Ме занимает срединное положение между 25-м и 75-м процентилем, то распределение близко к нормальному.

Слайд 75Проверка нормальности распределения
Тесты на нормальность:
Шапиро-Вилка (Shapiro-Wilk)
Колмогорова-Смирнова (Kolmogorov-Smirnov)
Крамера-вон Майса (Kramer-von Mises)
Андерсона-Дарлинга

(Anderson-Darling)

Проверка нормальности распределенияТесты на нормальность:Шапиро-Вилка (Shapiro-Wilk)Колмогорова-Смирнова (Kolmogorov-Smirnov)Крамера-вон Майса (Kramer-von Mises)Андерсона-Дарлинга (Anderson-Darling)

Слайд 76Способы "нормализующего преобразования" (transformation to normality) данных :

- гармоническое преобразование:

1 /х;
- извлечение квадратного корня;
- логарифмирование (дает наиболее точное

приближение): log xi
Способы

Слайд 77Успешность преобразования данных оценивают по коэффициенту асимметрии: чем ближе он

к 0, тем ближе экспериментальное распределение к нормальному.

Успешность преобразования данных оценивают по коэффициенту асимметрии: чем ближе он к 0, тем ближе экспериментальное распределение к

Слайд 78Стандартная ошибка средней
S.E. mean :
Мера точности выборочной средней (точечная

оценка параметра)
стандартная ошибка позволяет задать доверительный интервал для среднего значения.




Стандартная ошибка средней	S.E. mean : Мера точности выборочной средней (точечная оценка параметра)стандартная ошибка позволяет задать доверительный интервал

Слайд 79Центральная предельная теорема
Для бесконечного числа независимых случайных выборок одинакового объема,

извлеченных из генеральной совокупности, выборочное распределение любой линейной комбинации выборочных

средних будет стремиться к нормальному при объеме выборки, стремящейся к бесконечности.
Центральная предельная теорема	Для бесконечного числа независимых случайных выборок одинакового объема, извлеченных из генеральной совокупности, выборочное распределение любой

Слайд 81Доверительный интервал
Диапазон значений, построенный по выборке, который с определенной степенью

доверительности содержит истинное значение числового параметра генеральной совокупности.
Это мера точности

оцениваемого параметра.
В диапазоне удвоенной стандартной ошибки по обе стороны от среднего значения ( ± 2m) с вероятностью примерно
95 % находится среднее значение генеральной совокупности.
С вероятностью примерно 99 % оно лежит в диапазоне утроенной стандартной ошибки ( ± 3m).

Доверительный интервалДиапазон значений, построенный по выборке, который с определенной степенью доверительности содержит истинное значение числового параметра генеральной

Слайд 82Пример
Пусть исследуемой величиной является количество обратившихся в клинику пациентов в

год за последние 5 лет.
В среднем их количество равно

500, а 95% -доверительный интервал – (350, 900). Это означает, что с вероятностью 95%,
в течение года в клинику обратятся не менее 350 и не более 900 человек.
Используемое сокращение:
ДИ 95 % (CI 95%) – это доверительный интервал с уровнем доверия 95%.

Пример	Пусть исследуемой величиной является количество обратившихся в клинику пациентов в год за последние 5 лет. 	В среднем

Слайд 84
В описаниях результатов медико-биологических экспериментов часто используют одно из двух

представлений результатов.
Первое – в виде « x ±SD », где

x – среднее,
а SD – стандартное отклонение .
Второе представление результатов – в виде « x ± m », где
m – стандартная ошибка среднего (Standard Error of Mean)
В каждом конкретном случае, необходимо оговаривать, какое
из представлений результатов используется, так как запись «одно число плюс/минус другое» может толковаться неоднозначно.

В описаниях результатов медико-биологических экспериментов часто используют одно из двух представлений результатов.Первое – в виде « x

Слайд 85Бальная оценка
Порядковая шкала (шкала рангов) – шкала, относительно зна-
чений которой

уже нельзя говорить ни о том, во сколько раз
измеряемая величина

больше (меньше) другой, ни на сколько
она больше (меньше).
Такая шкала только упорядочивает объекты, приписывая им те
или иные баллы (результатом измерений является нестрогое
упорядочение объектов).
Бальная оценкаПорядковая шкала (шкала рангов) – шкала, относительно зна-чений которой уже нельзя говорить ни о том, во

Слайд 86Бальная оценка
Например, так построена шкала твердости минералов Мооса:
взят набор 10

эталонных минералов для определения
относительной твердости методом царапанья. За 1 принят
тальк,

за 2 – гипс, за 3 – кальцит и так далее до 10 – алмаз.
Любому минералу соответственно однозначно может быть
приписана определенная твердость. Если исследуемый
минерал, допустим, царапает кварц (7), но не царапает топаз (8),то
соответственно его твердость будет равна 7.
Аналогично построены шкалы силы ветра Бофорта и
землетрясений Рихтера.
Бальная оценкаНапример, так построена шкала твердости минералов Мооса:взят набор 10 эталонных минералов для определенияотносительной твердости методом царапанья.

Слайд 87Бальная оценка
Шкалы порядка широко используются в педагогике, психологии, медицине и

других науках, не столь точных, как, скажем, физика и химия.

В частности, повсеместно распространенная шкала школьных отметок в баллах (пятибалльная, двенадцатибалльная и т.д.) может быть отнесена к шкале порядка.

Бальная оценкаШкалы порядка широко используются в педагогике, психологии, медицине и других науках, не столь точных, как, скажем,

Слайд 88Бальная оценка
В медикобиологических исследованиях шкалы порядка встречаются сплошь и рядом

и подчас весьма искусно замаскированы.
Например, для анализа свертывания крови

используется тромботест: 0 – отсутствии свертывания в течение времени теста (а через минуту?), 1 –«слабые нити», 2 – желеподобный сгусток, 3 – сгусток, легко деформируемый, 4 – плотный, упругий, 5 – плотный, занимающий весь объем и т.п.
Понятно, что интервалы между этими плохо отличимыми и очень субъективными позициями произвольны. В этом случае фраза «Тромботест у исследуемых животных повы-
шался в среднем с 3,3 до 3,7» выглядит абсурдной.
Бальная оценкаВ медикобиологических исследованиях шкалы порядка встречаются сплошь и рядом и подчас весьма искусно замаскированы. Например, для

Слайд 89Бальная оценка
Например, можно для оценки степени регенерации суставного хряща после

его повреждения применять 100-балльную шкалу. Но она слишком детальна, и

ее можно
перестроить в пятибалльную («1» – от «1» до»10»; «2» – от «10» до «30» и т.д.), или двухбалльную (например, положительная оценка – все, что выше 70 баллов, отрицательная – 70 и меньше).
Возникает проблема – какие преобразования можно приме-
нять к тем или иным типам исходных данных. Другими словами, переход от какой шкалы к какой является корректным. Эта проблема в теории измерений получила название проблемы адекватности.
Бальная оценкаНапример, можно для оценки степени регенерации суставного хряща после его повреждения применять 100-балльную шкалу. Но она

Слайд 90Бальная оценка
Общий вывод – всегда возможен переход от более мощной

шкалы к менее мощной, но не наоборот (например, на основании

оценок, полученных в шкале отношений, можно
строить балльные оценки в порядковой шкале, но не наоборот).
Бальная оценкаОбщий вывод – всегда возможен переход от более мощной шкалы к менее мощной, но не наоборот

Слайд 91Бальная оценка
В порядковой шкале ничего нельзя сказать о равномерности или

неравномерности интервалов между соседними значениями оценок.
Мы не вправе, к

примеру, сказать о том, что регенерация хряща, оцененная на «50», настолько же отличается от регенерации, оцененной на «40», как и процессы, оцененные на «90» и «80».
И поэтому совершенно некорректно использование подобных шкал даже в качестве дополнительных аргументов для обоснования эффективности новых методов воздействия на болезнь, поскольку усреднение предполагает сложение значений величины, а операция суммы для порядковых шкал не может быть корректно определена. Соответственно не могут быть определены и все остальные арифметические и алгебраические действия.
Бальная оценкаВ порядковой шкале ничего нельзя сказать о равномерности или неравномерности интервалов между соседними значениями оценок. Мы

Слайд 92Бальная оценка
Поэтому, например, утверждение о том, что регенерация хряща в

группе животных с применением нового высокоточного малоинвазивного метода хирургического лечения

в среднем на 5,5 баллов выше, чем в группе контрольных животных, будет неправомочным, некорректным.
Тем более при использовании балльных оценок некорректны (даже абсурдны) утверждения типа: «эффективность экспериментальной методики в 1,6 раза выше контрольной».
Бальная оценкаПоэтому, например, утверждение о том, что регенерация хряща в группе животных с применением нового высокоточного малоинвазивного

Слайд 93Бальная оценка
Таким образом, операция вычисления среднего арифметического не является корректной

в порядковой шкале.
Шкалу балльных оценок, также как и другие шкалы

порядка, можно использовать в экспериментальных исследованиях, но в этом случае необходимо применять адекватные методы обработки данных, не вычисляя «среднего балла».
Корректной характеристикой набора балльных оценок является медиана (такое значение оценки, справа и слева от которого расположено одинаковое число
оценок в их упорядоченной совокупности).
Бальная оценкаТаким образом, операция вычисления среднего арифметического не является корректной в порядковой шкале.Шкалу балльных оценок, также как

Слайд 94Бальная оценка
Еще раз повторим – не следует складывать, вычитать, умножать

или делить баллы
друг на друга, да и на чтобы то

ни было – все это абсолютно бессмысленные операции.
В порядковой шкале для усреднения используют медиану
Бальная оценкаЕще раз повторим – не следует складывать, вычитать, умножать или делить баллыдруг на друга, да и

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика