Бірнеше тестілеу Жоғарыда айтқанымыздай, статистикада «Деректерді ұзақ қинасаң, ерте ме, кеш пе мойындайды»


Еркіндік дәрежелеріне арналған негізгі идеялар



бет3/5
Дата03.08.2023
өлшемі201,18 Kb.
#105011
1   2   3   4   5
Еркіндік дәрежелеріне арналған негізгі идеялар

  • Еркіндік дәрежелерінің саны (D. f.) тексеру статистикасын стандарттау мақсатында есептеулердің құрамына кіреді, нәтижесінде оларды анықтамалық үлестірулермен (t - үлестіру, F - үлестіру және т. б.) салыстыруға болады.

  • Еркіндік дәрежелері ұғымы регрессияны орындау кезінде (мультиколлинеарлықты болдырмау үшін) 1 n − индикаторлық немесе жалған айнымалылардағы категориялық айнымалыларды факторизациялаудың негізінде жатыр.

ANOVA
A / B тестінің орнына біз көптеген топтарды салыстырдық делік, айталық, A-B-C-D, олардың әрқайсысында сандық деректер бар. Топтар арасындағы статистикалық маңызды айырмашылықты тексеруді жүзеге асыратын статистикалық процедура дисперсиялық талдау немесе ANOVA деп аталады (ағылш. analysis of variance).
Негізгі терминдер:
Жұптық салыстыру (pairwise comparison) көптеген топтардың екі тобы арасындағы гипотезаны (мысалы, орташа мәндер туралы) тексеру.
Әмбебап тест (omnibus test) көптеген топтардың орташа мәндері арасындағы жалпы дисперсия гипотезасын бір рет тексеру.
Синонимдер: omnibus тесті, omnibus критерийі.
Дисперсияның ыдырауы (variance декомпозициясы) жеке мәнге ықпал ететін компоненттерді бөлектеу (мысалы, жалпы орташа мәннен, опция үшін орташа мәннен және дәл қатенің қалдығынан).
F-статистика (F-statistic) кездейсоқ модельде күткеннен жоғары топтық орташа айырмашылықтардың дәрежесін өлшейтін стандартталған статистика.
SS "квадраттардың қосындысы" кез-келген орташа мәннен ауытқуды білдіреді.
Кестеде. 3.3 төрт веб-беттің жабысқақтығын (stickiness, яғни келушілердің назарын аудару дәрежесі) бетте өткізілген секундтар санында көрсетеді. Веб-сайтқа кірушілердің әрқайсысы бір-бірінен алшақтап кетуі үшін төрт бет кездейсоқ ретпен өшіріледі. Әр бетке және кестеге барлығы 5 келуші бар. 3.3 әрбір баған тәуелсіз деректерді білдіреді. 1-беттің бірінші келушісі 2 - беттің бірінші келушісімен ешқандай байланысы жоқ. Айта кетейік, мұндай веб-тестте біз классикалық рандомизацияланған іріктеу жоспарын толығымен жүзеге асыра алмаймыз, онда әрбір келуші белгілі бір көптеген популяциялардан белгілі бір тәртіппен таңдалады. Біз келушілерді келген кезде қабылдауымыз керек. Келушілер sis - тәуліктің уақытына, аптаның уақытына, жылдың уақытына, Интернеттің күйіне, олар қолданатын құрылғының сипатына және т.б. байланысты тақырыптық түрде ерекшеленуі мүмкін.

Кесте 3.3. Төрт веб-бетке жабысқақтық (секундпен)



Енді қиын міндет туындайды (сурет. 3.6). Біз тек екі топты салыстырған кезде, бәрі қарапайым болды: біз әр топтың орташа мәндерінің арасындағы айырмашылықты қарастырдық. Төрт орта жағдайда топтар арасында алты мүмкін салыстыру бар:

  • 1 бет және 2 бет;

  • 1 бет және 3 бет;

  • 1 бет және 4 бет;



3.6. - сурет. Төрт топқа арналған қорап диаграммалары беттер арасында айтарлықтай сәйкессіздіктерді көрсетеді

Мұндай жұптық салыстыруларды неғұрлым көп жасасақ, кездейсоқ мүмкіндікке алданып қалу мүмкіндігі соғұрлым жоғары болады (бөлімді қараңыз. Осы тараудың басында "бірнеше тестілеу"). Біз жасай алатын жеке беттер арасындағы барлық мүмкін салыстырулар туралы алаңдамай, "барлық беттер бірдей жабысқақтыққа ие бола ала ма және бұл беттер арасындағы айырмашылықтар олардың арасындағы шектеудің кездейсоқ сипатынан туындауы мүмкін бе" деген сұраққа жауап беретін бір ғана әмбебап тестті орындауға болады сеанс уақыттарының жалпы жиынтығы?"Бұл сұраққа жауап беру үшін ANOVA процедурасы қолданылады. Оны қолданудың негізгі принциптерін келесі қайта іріктеу процедурасынан көруге болады (мұнда A-B-C-D-веб-беттердің жабысқақтық сынағы үшін берілген): 1. Барлық деректерді бір қорапта біріктіріңіз. 2. Әрқайсысы бес мәннен тұратын төрт қайталанатын үлгіні араластырыңыз және алыңыз. 3. Төрт топтың әрқайсысының орташа мәнін жазыңыз. 4. Төрт топтың орташа мәндерінің арасында дисперсияны жазыңыз. 5. 2-4 қадамдарды бірнеше рет қайталаңыз (айталық, 1000). Қайта тексерілген дисперсия жағдайлардың қанша үлесін бақыланатын дисперсиядан асып түсті? Бұл p мәні.
Ауыстыру сынағының бұл түрі А-ға қарағанда біршама күрделі тест туралы бөлім. "Осы тараудың басында "ауыстыру тесті". Бақытымызға орай, бұл жағдайда lm Perm бағдарламалық жасақтамасында ауыстыру тестін есептейтін avr функциясы бар:
> library(lmPerm)
> summary(aovp(Time ~ Page, data=four_sessions))
[1] "Settings: unique SS "
Component 1 :
Df R Sum Sq R Mean Sq Iter Pr(Prob)
Page 3 831.4 277.13 3104 0.09278 .
Residuals 16 1618.4 101.15
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Pr(Prob) - де берілген P мәні 0,09278. Iter бағанында ауыстыру тестінде талап етілетін қайталанулар саны көрсетіледі. Басқа бағандар дәстүрлі ANOVA кестесіне сәйкес келеді және төменде сипатталған.


Достарыңызбен бөлісу:
1   2   3   4   5




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет