Сонымен гистограмманың ауданы барлық салыстырмалы жиіліктерінің
қосындысына тең, яғни 1-ге
Бақылау сұрақтары
1. Бас және таңдаулы жиынтықтар.
2. Полигон.
3. Гистограмма
Үлестірім параметрлерінің статистикалық бағасы. Бас және таңдаулы орталар.
Бас және таңдаулы дисперсиялар
Әдетте ҥлестірудің кӛп сипаттамалары болады, ал бҧл статистикалық
зерттеулерді ӛте қиындатады. Сондықтан берілген статистикалық жиынтықтың
негізгі қасиеттерін кеңейтілген тҥрде кӛрсететін сан жағынан аз сипаттамаларды
(параметрлерді) анықтап алу мҥлдем қажет. Мҧндай параметрлер
ықтиярымызда болғанда, біз тек эмпирикалық ҥлестіруді сипаттап қана
қоймастан, оның теориялық ҥлестіруге қатысын да анықтай аламыз.
Эмпирикалық үлестірулердің аса маңызды кӛңіл аударатын сипаттамаларына
(параметрлеріне) әр түрлі орталар (арифметикалық орта, гармоникалық орта, медиана
мода, квартильдер, децильдер т.т), сондай-ақ түрлі ауытқу (шашырау) ӛлшеуіштерді
(құлаш, абсолютті ауытқу, орташа квадраттық ауытқу, дисперсия, вариация
коэффициенті т.т.) жатады. Осы аталған параметрлердің басым кӛпшілігінің
атауларымен ықтималдықтар теориясынан таныспыз. Сондықтан ықтималдықтар
теориясында қарастырылған параметрлерді (сипаттамаларды) теориялық деп атаймыз
131
да, ал тәжірибеден алынған сәйкес параматрлерді эмпирикалық немесе тәжрибелік
немесе статистикалық параметр дейтін боламыз.
Теориялық және тәжірибелік параметрлердің құрылымы мен қасиеттері және
сандық есептеулері бір-бірімен ұқсас екенін байқау қиын емес. Сондықтан
тәжірибелік параметрлерді шолу ретінде қарастырып, есеп шығаруға пайдаланамыз,
бұлардың теориялық параметрлерге қаншалықты жинақтауын бағалаймыз және әр
түрлі гипотезаларды (болжамдарды) тексерудегі алып тұрғын орынын баяндаймыз.
Арифметикалық орта. Арифметикалық ортаны есептеу формулалары. Әр түрлі
оталардың ішінде статистикада ең кең қолданылатыны – осы арифметикалық орта.
Бұл басқаларына қарағанда мағынасы жағынан да және есептелу тәсілі жағынан да
қарапайым. Арифметикалық ортамен ықтималдықтар теориясында сан рет кездесіп
отырдық. Оның үстіне мұның қасиеттері математикалық күтім қасиеттеріндей
болғандықтан анықтама беріп, қасиеттерін дәлелдеусіз келтірумен қанағаттанамыз.
Белгінің (Х) арифметикалық ортасы
x
деп варианталардың сандық
қосындысының сол варианталардың жалпы санына қатынасын айтады, яғни
n
i
i
x
n
X
1
1
(1)
Басым кӛпшілік жағдайда белгінің дискретті ҥлестіруі 3 кесте тҥрінде
келтірілген вариациялық қатармен беріледі.
3 кесте
х
1
x
2
x
...
k
x
i
n
1
n
2
n
...
k
n
n
Мұнда
k
,...,
,
i
x
i
2
1
-варианталар (белгі мәндері),
k
,...,
,
i
n
i
2
1
- варианталар
салмағы (жиілігі),
k
i
i
n
n
1
. Бұл жағдайда топтастырылған варианталар үшін (1)
формуласы былай жазылады:
n
i
i
i
x
n
n
X
1
1
(2)
Ал
n
n
f
i
i
болуын ескерсек, онда
n
i
i
i
x
f
X
1
(3)
Келешекте (2) және (3) формулалары мен ӛрнектелген арифметикалық
ортаны топтастырылған немесе салмақтық арифметикалық орта деп атаймыз.
Арифметикалық ортаның қасиеттері.
132
1 қасиет. Тұрақтының арифметикалық ортасы сол тұрақтыға тең, яғни
const
C
x
...
x
x
k
2
1
болса, онда
n
i
n
i
i
C
C
n
x
n
x
1
1
1
1
.
2 қасиет. Варианталардың арфиметикалық ортадан ауытқулардың қосындысы
нӛлге тең, яғни
0
1
n
i
i
x
x
,
0
1
n
i
i
i
x
x
n
.
3 қасиет. Егер белгінің әрбір мәнін тұрақты А-ға ӛсірсек (кемітсек), онда
арифметикалық орта да сол тұрақтығы ӛседі (кемиді) яғни
a
x
a
x
n
n
x
i
n
i
i
1
1
.
4 қасиет. Егер белгінің әрбір мәнін тұрақты С-ға кӛбейтсек (бӛлсек), онда
арфметикалық орта С-ға кӛбейтіледі (бӛлінеді), яғни
x
C
Cx
n
n
x
i
k
i
i
1
1
1
;
C
x
C
x
n
n
x
i
k
i
i
1
1
1
.
5 қасиет. Х және Y белгілер қосындысының (айырымының) арифметикалық
ортасы олардың арифметикалық орталарының қосындысына (айырымына) тең, яғни
Y
X
Z
боласа, онда
Y
X
Z
.
6 қасиет.
a
x
n
n
a
x
i
k
i
i
1
1
,
a
- кез келген тұрақты. Бұл қасиет былай кеңейтіледі:
l
l
a
x
n
n
l
a
x
k
i
i
i
1
,
l
- тұрақты сан кӛбейткіш.
Анықтама. Іріктеулі жиынның арифметикалық ортасын
â
x
-іріктеулі орта деп
атайды. Іріктеулі жиын
n
кӛлемінің мәндері
2
1
x
,
x
, ....,
n
x
әр тҥрлі болса, онда
n
x
x
x
x
n
â
2
1
Егер белгінің мәндері
2
1
x
,
x
, ....,
k
x
сәйкес әр тҥрлі жиіліктері болса және
2
1
n
,
n
, ....,
k
n
, болса, және
n
n
n
n
k
2
1
, онда
n
x
n
x
n
x
n
x
k
k
в
2
2
1
1
, немесе
n
x
n
x
i
k
i
i
â
1
,
n
кӛлеміндегі
x
сандық белгісінің кез келген мәндерін қарастырайық
белгінің мәндері
k
x
x
x
2
1
133
жиілігі
k
n
n
n
2
1
және
k
i
i
n
n
1
.
Қалыпты болу үшін
k
i 1
бұдан әрі
деп қарастырайық.
Жалпы ортаны табамыз
n
x
n
x
i
i
.
Бұдан
x
n
x
n
i
i
.
(*)
const
x
болғандықтан
x
n
n
x
x
n
i
i
. (**)
Белгінің мәнімен жалпы орта
x
x
i
айырымын ауытқу деп атайды
Теорема.Ауытқу мен сәйкес жиіліктерінің кӛбейтінділерінің қосындысы нӛлге тең
0
)
x
x
(
n
i
i
.
Мысал.Х сандық белгісінің үлестірімі берілген
.
n
x
i
i
6
4
10
3
2
1
Ауытқуы мен сәйкес жиіліктерінің кӛбейтінділерінің қосындысы нӛлге тең
екенін анықтаңыз
Шешуі. Жалпы ортаны табамыз
8
1
20
3
6
2
4
1
10
,
x
.
Ауытқумен сәйкес жиіліктерінің кӛбейтіндісінің қосындысын табалық:
0
8
8
)
8
,
1
3
(
6
)
8
,
1
2
(
4
)
8
,
1
1
(
10
)
(
x
x
n
i
i
.
Анықтама. Квадрат ауытқудың арифметикалық ортасы бас дисперсия -
D
деп
аталады және келесі формула бойынша есептеледі
N
)
x
x
(
D
k
i
i
1
2
.
Егер белгінің мәндерінің
2
1
x
,
x
, ...,
k
x
сәйкес жиіліктері
2
1
N
,
N
, ...,
k
N
болып,
2
1
N
N
...
k
N
болса, онда
N
)
x
x
(
N
D
k
i
i
i
1
2
,
Мысал.Бас жиынтық үлестірімі кестесі арқылы берілген
134
.
N
x
i
i
3
10
9
8
6
5
4
2
Бас дисперсияны есептеңіз.
Шешуі.Бас ортасын табамыз
4
30
120
3
10
9
8
6
3
5
10
4
9
2
8
x
.
Бас дисперсияны табамыз:
8
,
1
30
54
30
)
4
6
(
3
)
4
5
(
10
)
4
4
(
9
)
4
2
(
8
2
2
2
2
D
.
Анықтама: Бас дисперсияның квадрат түбірі бас орта квадраттық ауытқу
D
деп аталады..
Анықтама. Егер таңдама
n
кӛлеміндегі белгінің
2
1
x
,
x
, ...,
n
x
мәндері әр түрлі
болса, онда таңдаулы дисперсия мына формуламен есептеледі.
n
)
x
x
(
D
n
i
в
i
1
2
в
.
Егер белгінің мәндерінің
2
1
x
,
x
, ...,
k
x
сәйкес жиіліктері
2
1
n
,
n
, ...,
k
n
болып
2
1
n
n
...
n
n
k
теңдігі орындалса, онда
n
)
x
x
(
n
D
k
i
в
i
i
1
2
в
.
Мысал.Таңдаулы жиынтық мынадай үлестірім кестесімен берілген
.
n
x
i
i
5
10
15
20
4
3
2
1
Таңдаулы дисперсияны есепте
Шешуі.Таңдаулы ортаны табамыз
2
50
100
5
10
15
20
4
5
3
10
2
15
1
20
в
x
.
Енді таңдаулы дисперсияны есептейміз:
1
50
50
50
2
4
5
2
3
10
2
2
15
2
1
20
2
2
2
2
)
(
)
(
)
(
)
(
D
в
.
135
Таңдаулы дисперсияның квадрат түбірі таңдаулы орта квадраттық
в
D
в
ауытқуы немесе стандарт деп аталады..
Дисперсияны есептеуді жеңілдету үшін тӛмендегі теореманы пайдалануға
болады. Теорема: Дисперсия белгінің мәндерінің орта квадраттарынан жалпы ортаның
квадратын
2
2
]
[x
x
D
алғанға тең
Мысалы. Берілген үлестірім бойынша дисперсияны есепте:
.
n
x
i
i
5
10
15
20
4
3
2
1
Шешуі. Жалпы ортаны табайық:
2
50
100
5
10
15
20
4
5
3
10
2
15
1
20
x
.
Белгі мәндерінің квадраттарының ортасын табайық:
5
50
4
5
3
10
2
15
1
20
2
2
2
2
2
x
Сонда дисперсия мынаған тең болады
1
2
5
2
2
2
x
x
D
.
Жоғарыда айтылған орталар, үлестірудегі варианта мәндерімен тығыз
байланыста болатын. Ал қарастырайық деп отырған құрылымдық (структуралық) орта
болса үлестіру ұштарында орналасқан варианта мәндеріне тәуелсіз болып реттелген
варианталар қатарына, яғни үлестіру құрылымының ӛзімен ғана байланысты.
Құрылымдық ортаға медиана мен мода жатады.
Медиана. Жиынтықты тең етіп екіге бӛлетін белгі мәнін медиана деп айтамыз.
Егер белгінің ӛзгеруші мәндері тақ болып, ұлғаю ретімен орналасса
2
1
x
,
x
, ...,
1
m
x
1
2
1
n
m
m
x
,...,
x
,
x
, онда бұл үлестіру үшін
e
M
медианасы
m
x
вариантасына тең, яғни
e
M
m
x
ӛйткені
m
e
x
M
-нен тӛменде және жоғары да белгінің саны бірдей
1
m
мәндері
орналасқан.
Ал варианта саны жұп болса,
2
1
x
,
x
, ...,
1
m
x
,
m
m
m
x
,...,
x
,
x
2
1
онда бұл жиынтықты
тең екіге бӛлетін медиана мәні
1
m
m
x
,
x
аралығында болады. Бұл жағдайда медиана
e
M
-
нің мәні осы екі вариантаның арифметикалық ортасы болады, яғни
1
5
0
m
m
e
x
x
,
M
1-мысал. Х-тің кабылдайтын мәндері 1; 3; 7; 10;14 болса, онда
e
M
=7, ӛйткені
варианталар саны 5, сондықтан 5=2т–1 бұдан
3
m
де сәйкес Х-тің мәні 7-ге
тең.
2-мысал. Егер Х-тің мәндері 1; 3; 6; 10; 14; 17 болса, онда
e
M
=8, ӛйткені
варианта саны 6 (жұп), сондықтан 2т =6, бұдан
3
m
. Демек,
136
e
M
e
M
e
e
n
s
N
k
min
xM
M
1
2
.
Мода (Мо)- Берілген вариациялық қатардыңең жиі кездесетін вариантасын мода
деп атайды. Үлестіру дискретті болғанда моданы анықтау қиынға соқпайды. Бұл
жағдайда ең жоғары жиілікке сәйкес варианта мәні мода болады (мода бірнешеу
болуы да мүмкін).
Ал интервалды вариациялық қатар модасын анықтау күрделілеу. Бұл жердеде
медиананы есептеген сияқты анықталады, яғни алдымен мода болатын интервалды,
мұндай интервалдар бірнешеу болуы да мүмкін, анықтайды одан соң моданың сандық
мәні табылады. Бұл жағдайда мода мәнін, моданың жуық мәнін, мына формуламен
анықтаймыз.
1
0
0
1
0
0
1
0
0
0
0
M
M
M
M
M
M
min
M
n
n
n
n
n
n
k
x
M
.
Мұнда
min
M
x
03
- модалық иитсрвалдың тӛменгі шекарасы
k
- модалық интервал
ұзындығы,
0
M
n
-модалық интервалға сәйкес жиілік,
1
0
M
n
модалық интервал алдындағы
интервалға сәйкес жиілік
1
0
M
n
- модалық интервалдан кейінгі интервалға сәйкес
жиілік.
Вариация құлашы. Ауытқу сипаттамаларының ішіндегі ең қарапайымы
вариация құлашы. Мұның мәні (R) белгінің максимум және минимум мәнінің
айырымына тең, яғни
min
max
x
x
R
1 - мысал. 10 деталь салмагын ӛлшеу нәтижесінде тӛмендегі нәтиже алынған
(граммен): 64; 68; 70; 71; 74; 75; 77; 79; 80; 82. Құлаш мәнін анықтау керек.
Шешуі.
18
64
82
min
max
x
x
R
.
Әрине вариация құлашы белгінің ауытқу дәрежесін ӛте жуық шамамен
бағалайды. Ұшы шекті вариант салмағын есепке алмайды.
Сызықтық ауытқу. Ауытқудың дәлірек бағасын белгі мәндерінің
i
x
арифметикалық ортадан ауытқуын
x
x
i
ескеріп те алуға болар еді. Бірақ
x
x
i
таңбалары әр түрлі болып кездескендіктен, оларды қосқан уақытта бір-бірімен
жойылып қосындысы нӛлге тең болады, яғни
0
1
n
i
i
x
x
(2)
Мұндай ӛзара жойылуды болдырмау ушін кездейсоқ ауытқу мәніне сол
айырымдардың абсолютті шамасын
x
x
i
алады. Сӛйтіп ауытқудың абсолютті
шамалары қосындысының арифметикалық ортасын сызықтық ауытқу мӛлшері ретінде
қабылдаймыз. Бұл ауытқу мәні топтастырылмаған вариациялық қатар ушін
137
k
i
i
x
x
n
d
1
1
,
ал жиіліктері топтастырылған вариациялық қатар үшін
k
i
i
i
i
x
x
n
n
x
x
d
1
1
k
i
i
i
x
x
f
d
1
болады.
Сызықтық ауытқу ӛлшемі қарастырып отырған белгі шама ӛлшеміндей. Ал
статистикада ӛлшемдері бірдей белгіні ғана қарастырмастан ӛлшемдері әр түрлі
белгілерді де салыстыруға тура келеді. Бұл мәселені шешу үшін вариация
коэффициентін енгіземіз.
Вариация коэффициенті. Ол
%
x
x
x
i
100
(4)
формуласымен анықталады. Бұл формуладан вариация коэффициентіне
сызықтық вариация коэффициенті абсолютті ауытқудың арифметикалық ортаға
қатынасының орта проценті алынатынын байқаймыз.
Мысалы
10
6
5
4
3
1
қатары үшін құлаш
9
1
10
құлаш вариациялық
қатардың ең қарапайым характеристикасы болады.
Анықтама. Абсолют ауытқудың арифметикалық ортасын орта абсолют ауытқу деп
аталады
i
i
i
n
x
x
n
в
.
Мысалы, мына қатар үшін
1
5
10
4
16
6
3
1
i
i
n
x
4
20
16
30
30
4
B
X
0
20
4
16
1
4
6
5
4
3
10
4
1
4
Анықтама.. Таңдаулы орта квадраттық ауытқудың таңдаулы ортаға қатынасының
проценті вариация коэффициенті деп аталады.
%
x
V
в
100
в
Достарыңызбен бөлісу: |