Кездейсоқ шамалар параметрлерін статистикалық бағалау. Гипотезаларды тексеру Статистикалық гипотеза (statistical hypothesys) — ол деректердің бақыланатын сұрыптау негізінде жататын ықтималдықтардың таралуы туралы белгілі бір болжам.
Статистикалық гипотеза тексеру (testing statistical hypotheses) — ол қарастырылатын статистикалық гипотеза деректердің бақыланатын сұрыптамасына қайшылық болу-болмау туралы шешім қабылдау үрдісі. Статистикалық тест немесе статистикалық критерий — ол бойынша статистикалық гипотеза қабылданатын немесе қабылданбайтың қатаң математикалық ереже.
Статистикалық гипотеза сұрыптаудың негізінде тұжырымдалатын кездейсоқ шаманың таралу заңы немесе сол заңдың параметрлері туралы кейбір болжам
Салыстырылатын сипаттамалар арасында айырмашылық жоқ, ал бақыланатын ауытқулар олардың негізінде салыстыру жүргізілетін сұрыптаулардағы кездейсоқ тербелістермен ғана түсіндіріледі деп тұжырымдайтын гипотеза нөльдік (негізгі) гипотеза деп аталады, оны Н0 деп белгілейді. Негізгі мен қатар оған баламалы (бәсекелес, қарсы) гипотезаны Н1 қарастырады. Егер нөльдік гипотеза қабылданбаса, онда баламалы гипотеза орын алады.
Гипотезаны тексеру барысында нәтижелердің төрт нұсқасы болуы мүмкін, кесте 5.1.
Кесте 5.1
Нәтижелердің төрт нұсқасы
Гипотеза Н0
Решение
Вероятность
Примечание
Верна
Принимается
1–
Доверительная вероятность
Отвергается
Вероятность ошибки первого рода
Неверна
Принимается
Вероятность ошибки второго рода
Отвергается
1–
Мощность критерия
Мысалы, параметрдің кейбір ығыспаған бағасы көлемі n сұрыптама бойынша есептелген және ол бағаның таралу тығыздығы f() болған жағдайды қарастырайық, сурет 5.1.
Сурет 5.1 – Гипотезаны қабылдау және қабылдамау аумақтары
Бағаланатын параметрдің ақихат мәні Т-ға тең дейік. Егер =Т теңдігі туралы Н0 гипотезасын қарастыратын болсақ, онда осы гипотезаны қабылдамау үшін мен Т арасындағы айырмашылық қаншалықты үлкен болуы тиіс. Бұл сұраққа жауапты параметрдің сұрыптамалық таралуының негізінде мен Т арасындағы белгілі бір берілген айырмашылыққа қол жеткізу ықтималдығын қарастырып, статистикалық мағынада беруге болады.
параметрінің аралықтың төменгі және жоғарғы шектерінен шығу ықтималдығының мәндерін бірдей деп болжау жөн. Ондай жорамал көп жағдайларда сенімді аралықты минимизациялауға, яғни тексеру критерийдің қуатын жоғарылатуға мүмкіндік береді. параметрі шекаралары 1– /2 және /2 болатын аралықтан шығып кетуінің қосынды ықтималдығы шаманы құрайды. Бұл шаманы аралықтан шығып кету ықтималдығы өте төмен болатындай етіп таңдау керек. Егер параметрдің бағасы берілген аралыққа түссе, онда бұл жағдайда тексерілетін гипотезаға күмән болу негізі жоқ, сондықтан =Т теңдігі туралы гипотезаны қабылдау керек. Бырақ, егер сұрыптауды алғаннан кейін баға орнатылған шекаралардан шығатын болса, онда бұл жағдайда Н0 гипотезадан бас тартуға маңызды негіз бар. Сондықтан, бірінші текті қатені жіберу ықтималдығы -ға тең (критерийдің мағыналық деңгейіне тең).
Егер, мысалы, параметрдің ақихат мәні шынында Т+d тең деп болжамдасақ, онда =Т теңдігі туралы Н0 гипотезаға сәйкес параметр бағасы гипотезаны қабылдау аумағына түсетін ықтималдығы -ны құрайды, сурет 5.2.
Сурет 5.2 – Аумақтардың таралуы
мағыналық деңгейін азайтып, сұрыптаудың берілген көлемінде бірінші текті қатені жіберу ықтималдығын азайтуға болады. Бырақ бұл кезде екінші текті қатенің ықтималдығы өседі (критерийдің қуаты азаяды). Ұқсама пікірлерді параметрдің ақихат мәні Т – d тең болған жағдай үшін де жасауға болады.
Екі ықтималдықты да азайтудың жалғыз тәсілі сұрыптау көлемін арттыру (параметр бағасының таралу тығыздығы бұл кезде "енсіздеу" болады). Күдікті аумақты таңдауда Нейман – Пирсон ережесіне сүйенеді: егер гипотеза дұрыс болса күдікті аумақты ықтималдығы аз болатындай етіп, және кері жағдайда үлкен болатындай етіп таңдау керек. Бырақ -ның нақтылы мәнін таңдау салыстырмалы түрде еркін. Пайдаланатын мәндер 0,001 ден 0,2 дейін аралықта жатады. Қолмен есептеулерді жеңілдету мақсатында -ның типті мәндері және критерийді құрудың түрлі тәсілдері үшін 1– /2 және /2 шекаралары бар аралықтар кестелері құрылған.
Тексерілетін гипотезаның мағынасына және сипаттама бағасының оның теориялық мәнінен айырмашылық өлшемдеріне тәуелді түрлі критерийлерді пайдаланады. Таралу заңдары туралы туралы гипотезаларды тексеру үшін еңжиі пайдаланылатын критерийлердің қатарына хи-квадрат Пирсон, Колмогоров, Мизес, Вилкоксон критерийлері, ал параметрлердің мәндері туралы Фишер, Стьюдент критерийлері жатады.
Таралу параметрлерін статистикалық бағалау әдісін пайдаланудың практикалық әдістемесін қарастырайық. Кездейсоқ шама (КШ) таралуының негізгі параметрлерінің толық орнықты (дәлелді) және ығыспаған бағаларын (математикалық күтім MX және дисперсия σХ2) келесі формулалар бойынша алуға болады:
(5.5)
(5.6)
мұнда: n – сұрыптау көлемі.
Кездейсоқ X және Y шамалар арасындағы корреляция коэффициенттін келесі формула бойынша анықтайды:
(5.7)
(5.5) - (5.6) бағаларды көлемі шектелген сұрыптама бойынша анықтайтын болғандан олардың статистикалық шынайлығы және дәлділігі туралы сұрақ туындылайды.
Бізді қызықтыратын параметр бағасын θ деп белгілейік. Онда бағаның шынайлығы мен дәлділігін анықтау есебі параметрдің белгісіз ақихат мәні осы аралықта жатады деп 1-α (мұнда: α – жеткілікті түрде аз, 0.1, 0.05, 0.01,… тең шама) ықтималдықпен тұжырымдауға болатындай етіп, θ параметрді қамтитын (θ1, θ2) аралықты анықтауға келтіріледі. (θ1, θ2) аралықты сенімді аралық деп, ал 1-α ықтималдықты сенімді ықтималдық деп атайды.
Х шама ықтималдық тығыздығы:
(5.8)
болатын таралудың қалыпты заңына ие болатын жағдайды қарастырайық.
1- α ықтималдықпен Mx-ты қамтитын математикалық күтім үшін сенімді аралықты келесі шарттан табады:
оны келесі түрде бейнелеуге болады:
(5.9)
v = n - 1 еркіндік дәрежелері бар Стьюденттің t-таралуына ие болатын келесі параметрді енгізейік:
(5.10)
онда (5.9) теңдік келесі түрде қайта жазылады:
(5.11)
мұнда: t(a, v)-ны Стьюденттің таралу кестесі бойынша α ықтималдық пен v=n-1 еркіндік дәрежелерінде анықтайды. 1-α сенімді ықтималдыққа сәйкес болатын Mx үшін сенімді аралық келесідей:
(5.12)
Дисперсия үшін сенімді аралықты анықтау үшін келесі теңдкті қанағаттандыратын және аралықтың шекараларын анықтау керек:
(5.13)
Қалыпты таралған Х үшін еркіндік дәрежелері v=n-1 болатын шаманың таралу заңы белгілі:
(5.14)
мұнда: - сұрыптамалық дисперсия, - сұрыптамалық дисперсияның ақихат мәні.
шартында, (5.14) -ті (5.13)-ке қойғаннан кейін:
.
шаманы Пирсонның таралу кестесі бойынша 1-α/2 ықтималдықта және v=n-1 еркіндік дәрежелер санында, ал шаманы α/2 ықтималдықта және v=n-1 еркіндік дәрежелер санында анықтайды.
Сондықтан, 1-α сенімді ықтималдыққа сәйкес дисперсия үшін сенімді аралық:
(5.14)