Слайд 1Тема 11.9. Інтервальні оцінки параметрів розподілу
Задача про інтервальне оцінювання
параметрів розподілу;
розподіл “хі-квадрат” і розподіл Стьюдента випадкової величини;
інтревальна оцінка математичного
сподівання нормально розподіленої випадкової величини;
інтервальні оцінки дисперсії і середнього квадратичного відхилення нормально розподіленої випадкової величини.
Слайд 21. Задача про інтервальне оцінювання параметрів розподілу.
Кожна точкова оцінка
параметрів розподілу є одне з можливих значень випадкової величини
, яка формується на основі
вибірки (спостережень над випадковою величиною Х).
Якщо обсяг вибірки досить великий, то точкова оцінка параметра розподілу є досить близькою до його точного значення. Якщо ж обсяг вибірки невеликий, то між точковою оцінкою і точним значенням параметра розподілу можуть бути значні розбіжності.
Слайд 3У зв’язку з цим виникає питання про надійність точкової оцінки
параметра , тобто про можливе відхилення точкової
оцінки від істинного значення параметра або про оцінку абсолютної величини різниці .
Точкова оцінка параметра є тим точнішою, чим менша величина різниці . Якщо б вдалося встановити, що , то число >0 характеризувало б точність точкової оцінки для параметра . Однак, статистичні методи не дозволяють категорично стверджувати, що бо є випадкова величина. Можна лише говорити про ймовірність , з якою ця нерівність виконується.
Слайд 4Визначення. Надійністю (довірчою ймовірністю) точкової оцінки параметра
розподілу називають ймовірність , з якою виконується нерівність
, тобто
(11.9.1)
На практиці надійність оцінки задається наперед, причому число вибирають близьким до одиниці: =0,9; =0,99; =0,999.
Умову (11.9.1) перетворимо до рівносильного вигляду:
(11.9.1)
Слайд 5 Визначення. Інтервал
для якого виконується рівність (11.9.1),
називається надійним (довірчим) інтервалом, а його межі
і - надійними (довірчими) межами для параметра розподілу .
Іншими словами, надійний інтервал для параметра розподілу , є інтервал , який з ймовірністю “накриває” точне значення цього параметра.
Зрозуміло, що завжди бажано, щоб для заданої близької до одиниці ймовірності довжина надійного інтервала була, по можливості, найменшою. Однак, практично завжди є така альтернатива: збільшення надійності приводить до збільшення надійного інтервалу і навпаки.
Слайд 6 Загальний спосіб, за допомогою якого знаходять надійний інтервал, полягає в
тому, що розв’язують рівняння (11.9.1) і визначають з нього число
. А для цього потрібно обчислити ймовірність
. Останнє обчислення можна зробити, коли відомий закон розподілу точкової оцінки (статистики) або пов’язаної з нею іншої випадкової величини, бо при цьому можна використати відомі формули з теорії ймовірностей:
або
де F(x) – функція розподілу і f(x) –густина розподілу випадкової величини
Слайд 7 Для розв’язання рівняння (11.9.1) або обчислення ймовірності
поряд з розглянутими розподілами випадкових величин (пуассонівський, нормальний, показниковий) застосовуються ще розподіли “хі-квадрат” і Стьюдента, які найчастіше використовуються в математичній статистиці.
Слайд 82. Розподіл -“хі-квадрат”.
Нехай
- незалежні і
нормально розподілені випадкові величини, причому їх математичні сподівання і середньоквадратичні відхилення для будь-якого i=1, 2,…, n. Розглянемо випадкову величину , що визначається рівністю
(11.9.2)
Слайд 9Випадкова величина розподілена за законом, який характеризується
густиною
(11.9.3)
де An – деяка стала величина, що залежить від параметра
(точний вигляд An опустимо і використовувати її не будемо). Описаний закон розподілу, що характеризується густиною (11.9.3) в теорії ймовірностей і статистиці називають законом “хі-квадрат”. Розподіл “хі-квадрат” залежить від одного
параметра n і при наближається до нормального закону розподілу. Основні числові характеристики, які пов’язані з випадковою величиною “хі-квадрат” і мають практичне використання, є табульовані (див. “Додаток 5”).
Слайд 103.Розподіл Стьюдента
Розподіл Стьюдента також має важливі застосування і він
пов’язаний з випадковою величиною наступного вигляду. Нехай Z – нормально
розподілена величина, причому M(Z)=0, (Z)=1, а V – незалежна від Z випадкова величина, яка розподілена за законом “хі-квадрат”. Тоді випадкова величина
(11.9.4)
розподілена за законом Стьюдента, який характеризується густиною:
(11.9.5)
де Bn – деяка стала величина, що залежить від параметра
(вигляд Bn опускаємо і використовувати її не будемо).
Слайд 11Розподіл Стьюдента також залежить від одного параметра n і при
наближається до
нормального розподілу. Основні числові характеристики, що пов’язані з розподілом Стьюдента і мають практичне використання, є табульовані (див. “Додаток 6”).
Слайд 124. Інтервальне оцінювання математичного сподівання нормально розподіленої величини.
Нехай випадкова
величина Х нормально розподілена, тобто характеризується густиною
(11.9.6)
в якій параметри а і можуть бути невідомі. При інтервальному оцінюванні математичного сподівання нормально розподіленої випадкової величини Х розглядають два випадки: а) коли середньоквадратичне відхилення відоме; б) коли середньоквадратичне відхилення невідоме.
Слайд 13 Розглянемо ці випадки окремо, хоча методика інтервального оцінювання математичного сподівання
М(Х)=а є подібною.
А. Середньоквадратичне відхилення відоме. Нехай
спостереження над випадковою величиною Х (вибірка), на підставі якої необхідно знайти надійний інтервал для невідомого параметра а. Розглядаючи результати вибірки як незалежні однаково розподілені випадкові величини , запишемо випадкову величину
Оскільки величини однаково розподілені, тобто M(Xi)=M=const, то, використовуючи властивості математичного сподівання, одержимо:
Слайд 14
Враховуючи, що кожна з величин
має
такий же розподіл як величина Х, то
Далі, розглянемо випадкову величину
(11.9.7)
розподіл якої нормальний і
Слайд 15 Звідси випливає, що значення випадкової величини Т розсіяні в околі
її значення Т=0, тобто існує таке число t>0, що –t
Тепер знайдемо таке число t, що
Оскільки
де - інтегральна функція Лапласа, яка має вигляд
(11.9.8)
Для знаходження t маємо рівняння
(11.9.9)
За таблицею значень функції знайдемо розв’язок
з рівняння (11.9.9).
Слайд 16В результаті одержуємо рівність
яка стверджує, що значення
випадкової величини
з ймовірністю задовольняє нерівність
Слайд 17 ВИСНОВОК: якщо випадкова величина Х (ознака генеральної сукупності) нормально розподілена
і її середньоквадратичне відхилення відоме, то з надійністю
її математичне сподівання М(Х)=а задовольняє нерівність
(11.9.10)
де - вибіркове середнє, n – обсяг вибірки,
- розв’язок рівняння (11.9.9), що
визначається за таблицею “Додатку 2”.
Іншими словами, інтервал “накриває” математичне сподівання М(Х)=а з надійністю , тобто є надійним інтервалом для математичного сподівання М(Х)=а.
Слайд 18Б. Середньо квадратичне відхилення невідоме.
В цьому випадку інтервальне
оцінювання математичного сподівання M(X)=a випадкової величини Х (ознаки генеральної сукупності)
грунтується на тому, що випадкова величина
(11.9.11)
де - виправлене середньоквадратичне відхилення, має розподіл Стьюдента, що характеризується густиною (11.9.8). Аналогічно, як в випадку випадкової величини (11.9.7), надійний інтервал для математичного сподівання М(Х) визначається рівністю
Слайд 19 яка перетворюється до вигляду
де -
густина розподілу Стьюдента
Оскільки функція парна, то
і для обчислення t маємо рівняння
(11.9.12)
з якого знаходимо . Значення що визначаються рівнянням (11.9.12), знайдемо за таблицею.
Слайд 20В результаті, для і
випадкової величини (11.9.11) маємо рівність
з якої знаходимо, що
значення випадкової величини задовольняє нерівність
Слайд 21 ВИСНОВОК: якщо випадкова величина Х (ознака генеральної
сукупності) розподілена за нормальним законом і її середньоквадратичне відхилення
невідоме, то з надійністю її математичне сподівання М(Х)=а задовольняє нерівність
(11.9.13)
де - вибіркове середнє,
- виправлене середньоквадратичне відхилення n – обсяг вибірки,
- розв’язок рівняння (11.9.12), який знаходимо за таблицею за даними значеннями n і .
Слайд 22Приклад 11.9.1. Відомо, що випадкова величина Х – відсоткове відношення
ринкової і номінальної цін на акції на фондовому ринку нормально
розподілена і середньоквадратичне відхилення (Х)=1,9. Результати спостережень дали такі результати:
98,2; 100,2; 98,1; 96,2; 99,8; 101,2; 99,2; 104,1; 102,6; 103,8; 101,2; 99,4; 106,1; 102,6; 100,6; 98,8; 98,2; 101,1; 100,6; 99,8.
Оцінити невідоме математичне сподівання випадкової величини Х за допомогою довірчого інтервалу з надійністю =0,95.
Слайд 23Розв’язання. Обсяг вибірки n=20. Обчислимо вибіркове середнє значення випадкової величини
Х:
(98,2+100,2+98,1+96,2+99,8+101,2+99,2+104,1+
+102,6+103,8+101,2+99,4+106,1+102,6+100,6+98,8+98,2++101,1+100,6+99,8)= 2011,8=100,6.
За таблицею “Додатку 2” за даною надійністю =0,95 знаходимо розв’язок рівняння
і одержуємо, що . Далі, за формулою (11.9.10) маємо:
Отже, з надійністю 0,95 невідомий параметр а “накривається” довірчим інтервалом (99,7; 101,43).
Слайд 24Приклад 11.9.2.
Відомо, що зріст 15-річної дитини є випадковою величиною
Х з нормальним розподілом ймовірностей, причому середнє квадратичне відхилення =8
см. Скільки треба виконати спостережень, щоб знайти інтервал завширшки 6 см, який з ймовірністю 0,99 “накриває” невідоме математичне сподівання досліджуваної випадкової величини?
Слайд 25 Розв’язання. Інтервал
, де
, “накриває” невідоме математичне сподівання М(Х). Звідси випливає, що обсяг спостережень .
Оскільки 2=6 =3, =8 і , то
Отже, при даних в задачі умовах треба виконати 48 спостережень, щоб інтервал завширшки 6 см “накривав” математичне сподівання зросту навмання вибраної 15-ти річної дитини.
Слайд 26Приклад 11.9.3. За спостереженнями випадкова величина Х – прибуток фермерів
(в тис. грн.) характеризується таким інтервальним статистичним розподілом
Припускаючи, що випадкова величина Х має нормальний закон розподілу ймовірностей, знайти інтервальну оцінку невідомого математичного сподівання М(Х)=а, з надійністю .
Слайд 27Розв’язання. В даному випадку середнє квадратичне відхилення невідоме, тому
для інтервальної оцінки параметра а використаємо формулу (11.9.13). Для цього
обчислимо:
1. вибіркове середнє:
2.виправлене середньоквадратичне відхилення:
Слайд 28 3. за даними n=30 і =0,999 з
таблиці “Додатку 3” знаходимо
Тепер за формулою (11.9.13) маємо, що
Отже, на підставі одержаних вибіркових спостережень середній прибуток одного фермера “накриває” інтервал (6,94; 10,06) з ймовірністю 0,999.
Слайд 295. Інтервальне оцінювання дисперсії і середнього квадратичного відхилення нормально розподіленої
випадкової величини.
Знайдемо тепер інтервальну оцінку для невідомих дисперсії і середнього
квадратичного відхилення нормально розподіленої випадкової величини Х. Оскільки дисперсія D(X)=D, середнє квадратичне відхилення (Х)= зв’язані співвідношенням D(X)=2(Х), то достатньо оцінити (Х). Для цього необхідно визначити число з рівняння :
Слайд 30 де - задана надійність і
- виправлене вибіркове середнє квадратичне відхилення.
Маємо ланцюжок рівносильних нерівностей:
Приймемо
і одержимо нерівність:
Тепер достатньо знайти число q. Для цього введемо випадкову величину “хі-квадрат”, можливі значення якої
У випадку, коли 0
(11.9.14)
де R(t,n) – густина розподілу випадкової величини “хі-квадрат”. Очевидно
бо нерівності в дужках є рівносильні.
Слайд 32Тому маємо рівність:
(11.9.15)
В результаті для знаходження q маємо рівняння
(11.9.16)
розв’язки
якого є табульовані
у таблиці “Додатку 4”, з якої їх визначаємо за даними значеннями n і .
Слайд 33 ВИСНОВОК: якщо випадкова величина Х (ознака генеральної сукупності)
нормально розподілена і q
відхилення випадкової величини Х задовольняє нерівність
(11.9.17)
де - виправлене вибіркове середнє квадратичне відхилення,
- розв’язок рівняння (11.9.16), який за даними значеннями n і знайдемо з таблиці “Додатку 4”.
Зауваження. Якщо q>1, то нерівність
випливає з нерівності .
Слайд 34В цьому випадку рівності (11.9.14) і (11.9.15) набувають вигляду:
і для
знаходження q маємо рівняння
(11.9.18)
Слайд 35 ВИСНОВОК: якщо випадкова величина Х нормально розподілена і
q>1, то з надійністю середнє квадратичне відхилення випадкової
величини Х задовольняє нерівність
(11.9.19)
де - виправлене вибіркове середнє квадратичне,
- розв’язок рівняння (11.9.18), який також можемо знайти за даними значеннями n і з “Додатку 4”.
Слайд 36Приклад 11.9.4. За даними вибірки задачі 11.9.1 знайти довірчий інтервал
для нормально розподіленої величини Х – відсоткового відношення ринкової і
номінальної вартості цін на акції на фондовому ринку з надійністю =0,95.
Розв’язання. Щоб знайти інтервальну оцінку для описаної випадкової величини Х, запишемо варіаційний ряд для варіант цієї величини та їх частоти:
Слайд 37 Вибіркове середнє арифметичне
обчислене в задачі 11.9.1. Обчислимо виправлене вибіркове середнє
квадратичне відхилення
Слайд 38 За таблицями “Додатку 4” при значеннях n=20
i =0,95 знаходимо, що q=0,37. Довірчий інтервал для середньоквадратичного відхилення
визначається нерівністю:
Отже, середнє квадратичне відхилення відсоткового відношення ринкової і номінальної цін акцій на фондовому ринку за даними задачі 11.9.1 з ймовірністю 0,95 “накриває” інтервал (1,49; 3,25).
Слайд 39 Приклад 11.9.5. За спостереженнями над випадковою величиною Х
– прибутком фермерів (в тис. грн.), які наведені в задачі
11.9.3, знайти довірчий інтервал для середнього квадратичного відхилення з надійністю =0,999.
Розв’язання. В задачі 11.9.3 було обчислене виправлене вибіркове середнє квадратичне відхилення . За відомими значеннями n=30 і =0,999 з таблиці “Додатку 4” знаходимо
За формулою (11.9.17) маємо, що
Досить великий довірчий інтервал для пояснюється вимогою високої надійності. Якщо, наприклад, надійність =0,95, то
Слайд 40
тобто довжина довірчого інтервалу зменшується більше ніж у 2
рази.
Приклад 11.9.6. За даними обласного статистичного управління урожайність цукрових буряків
в області розподіляється нормально. За вибіркою n=10 знайдено виправлене вибіркове середнє квадратичне відхилення випадкової величини Х – урожайності цукрових буряків з 1 га. Знайти інтервал довір’я, що “накриває” генеральне середнє квадратичне відхилення випадкової величини Х в генеральній сукупності з надійністю =0,95.
Слайд 41Розв’язання. За даними значень n=10 і =0,95 з таблиці “Додатку
4” знаходимо .
Оскільки , то для знаходження вказаного інтервалу довір’я використовуємо нерівність (11.9.19):
Отже, інтервал (0; 0,33) з надійністю =0,95 “накриває” середнє квадратичне відхилення урожайності цукрових буряків з 1 га в генеральній сукупності.