Распределение выборочных средних приближенно всегда следует нормальному распределению независимо от распределения совокупности, из которой извлечены выборки. В этом и состоит суть утверждения, называемого центральной предельной теоремой.
Эта теорема гласит следующее.
Выборочные средние имеют приближенно нормальное распределение независимо от распределения исходной совокупности, из которой были извлечены выборки.
Среднее значение всех возможных выборочных средних равно среднему исходной совокупности.
Стандартное отклонение всех возможных средних по выборкам данного объема, называемое стандартной ошибкой среднего, зависит как от стандартного отклонения совокупности, так и от объема выборки
m = SD/√n
Можно сказать с 95% надежностью, что генеральное среднее арифметическое (μ) находится в пределах 95% доверительного интервала, рассчитанного по формуле:
95% ДИ: от (М – 1,96 SD/√n) до (М + 1,96 SD/√n)
99% ДИ: от (М – 2,58 SD/√n) до (М + 2,58 SD/√n)
Распределение Стьюдента
когда наблюдение меньше (или равно) 30
Зачем нужен доверительный интервал
Исследователю нужен такой показатель, который позволяет сделать вывод относительно популяции в целом (на основе изученной выборки).
Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее популяции.
Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=0.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции.
Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным.
Ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки.
Смысл доверительного интервала: точно не известно, чему равна некоторая величина, но можно указать интервал, в котором она находится с заданной вероятностью.
Доверительная вероятность – это степень надежности (в % или долях единицы), которая задается доверительным коэффициентом (критерием Стьюдента), обозначаемым буквой t.
Р-доверительная вероятность– это вероятность того, что интервал содержит истинное значение.
Р-доверительная вероятность определяется, как 100 х (1-α) в %, где a – это уровень значимости.
В биомедицинских исследованиях чаще всего используются 95 % доверительные интервалы. Данный доверительный интервал представляет собой область, в которую попадает истинное значение средней арифметической в 95 % случаев. Другими словами, можно с 95 % надежностью сказать, что истинное значение средней арифметической в генеральной совокупности будет находиться в пределах 95 % доверительного интервала.