Бірнеше тестілеу Жоғарыда айтқанымыздай, статистикада «Деректерді ұзақ қинасаң, ерте ме, кеш пе мойындайды»


Бірнеше тестілеудің негізгі идеялары



бет2/5
Дата03.08.2023
өлшемі201,18 Kb.
#105011
1   2   3   4   5
Бірнеше тестілеудің негізгі идеялары

  • Зерттеу жұмысындағы немесе терең талдау жобасындағы көптік - деректер үшін (бірнеше салыстыру, көптеген айнымалылар, көптеген модельдер және т.б.) кездейсоқ мүмкіндіктің арқасында маңызды нәрсе туралы қорытынды жасау қаупін арттырады.

  • Бірнеше статистикалық салыстырулармен байланысты жағдайлар үшін (яғни, маңыздылығын бірнеше рет тексеру) статистикалық түзету процедуралары бар.

  • Деректерді терең талдау жағдайында таңбаланған нәтиже айнымалылары бар бақылау үлгісін пайдалану тауарлық емес нәтижелердің алдын алады.


Бостандық дәрежелері
Құжаттамада және көптеген статистикалық гипотезаларды тексеруге арналған параметрлерде "еркіндік дәрежелеріне"сілтемелерді көруге болады. Бұл тұжырымдама таңдамалы деректерден есептелген статистикаға қолданылады және еркін өзгеруі мүмкін мәндер санына жатады. Мысалы, егер 10 мәннен алынған үлгінің орташа мәні белгілі болса, сонымен қатар 9 мән белгілі болса, онда 10-шы мән де белгілі. Тек 9 мән еркін өзгеруі мүмкін.
Негізгі терминдер:
n немесе үлгі өлшемі (үлгі өлшемі)
Деректердің бақылаулар саны (жолдар немесе жазбалар).
d. f.еркіндік дәрежелері.
Еркіндік дәрежелерінің саны көптеген статистикалық тексерулердің кірісі болып табылады. Мысалы, еркіндік дәрежесі-дисперсия мен стандартты ауытқуды есептеу кезінде пайда болған 1 n-бөлгішке берілген атау. Бұл ұғымның маңыздылығы неде? Популяцияға қатысты дисперсияны бағалау үшін үлгіні пайдаланған кезде, Сіз N бөлгіште пайдалансаңыз, сәл төмен қарай жылжитын бағамен аяқтайсыз. Егер сіз 1 n-бөлгіште қолдансаңыз, онда бағалау бұл орын ауыстырудан бос болады.
Дәстүрлі Статистика курсының немесе тиісті әдістемелік материалдың айтарлықтай үлесі әртүрлі стандартты гипотеза тексерулеріне жұмсалады(t-Статистика, F-статистика және т. б. негізделген тексерулер). Таңдамалы Статистика дәстүрлі статистикалық пішіндерде пайдалану үшін стандартталған кезде, еркіндік дәрежелері стандартталған деректеріңіздің сәйкес тірек үлестіріміне (t үлестірімі, F үлестірімі және т.б.) сәйкес келуін қамтамасыз етуге арналған стандарттау есептеулерінің бөлігі болып табылады. Еркіндік дәрежелері деректер ғылымы үшін шынымен маңызды ма? Дәл емес. Кем дегенде маңыздылығын тексеру контекстінде. Бір жағынан, ресми жүздік тексерулер деректер ғылымында өте үнемді қолданылады. Бірге дос-гой, деректер мөлшері әдетте соншалықты үлкен, сондықтан деректерді талдаушы үшін, мысалы, N немесе 1 n-бөлгіші бар-жоғы сирек маңызды рөл атқарады .
Дегенмен, еркіндік дәрежелері сәйкес келетін бір контекст бар: регрессияда факторизацияланған айнымалыларды қолдану (логистикалық регрессияны қоса). Егер қатаң саятшылықтар болса, регрессиялық Алгоритмдер тоқтайды-дәл болжамды айнымалылар. Бұл көбінесе категориялық айнымалылар екілік индикаторларға (жалған айнымалылар) факторизацияланған кезде пайда болады. Аптаның бір күнін алайық. Аптаның 7 күн болғанына қарамастан, аптаның күнін көрсеткен кезде тек 6 еркіндік дәрежесі болады. Мысалы, сіз аптаның күні сенбіге сәйкес келмейтінін білсеңіз, онда бұл күн жексенбі болуы керек екеніне сенімдісіз. Сондықтан дүйсенбі-сенбі индикаторларын қосу мультиколлинеарлық қатеге байланысты регрессия үшін сәтсіздікке себеп болады дегенді білдіреді.


Достарыңызбен бөлісу:
1   2   3   4   5




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет