И анализ больших данных



Pdf көрінісі
бет24/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   20   21   22   23   24   25   26   27   ...   65
Байланысты:
BIG дата книга

 
 
 
Тема 5 Основные понятия математической статистики
Цель:
рассмотреть методы анализа данных: дескриптивная статистика, 
параметрические, 
непараметрические, 
номинальные 
методы 
(корреляционный, 
регрессионный, дисперсионный анализы, кластерный, дискриминантный, факторный 
анализы).
 
План: 
5.1 Обзор методов статистического анализа данных 
5.1 Обзор методов статистического анализа данных 
Объектом исследования в прикладной статистике являются статистические данные, 
полученные в результате наблюдений или экспериментов. Статистические данные – это 
совокупность объектов (наблюдений, случаев) и признаков (переменных), их 
характеризующих. Например, объекты исследования – страны мира и признаки, – 
географические и экономические показатели их характеризующие: континент; высота 
местности над уровнем моря; среднегодовая температура; место страны в списке по 
качеству жизни, доли ВВП на душу населения; расходы общества на здравоохранение, 
образование, армию; средняя продолжительность жизни; доля безработицы, 
безграмотных; индекс качества жизни и т.д. 
Переменные – это величины, которые в результате измерения могут принимать 
различные значения. 
Независимые переменные – это переменные, значения которых в процессе 
экперимента можно изменять, а зависимые переменные – это переменные, значения 
которых можно только измерять. 
Переменные могут быть измерены в различных шкалах. Различие шкал 
определяется их информативностью. Рассматривают следующие типы шкал, 
представленные в порядке возрастания их информативности: номинальная, порядковая, 
интервальная, шкала отношений, абсолютная. Эти шкалы отличаются друг от друга также 
и количеством допустимых математических действий. Самая «бедная» шкала – 
номинальная, так как не определена ни одна арифметическая операция, самя «богатая» – 
абсолютная. 
Измерение в номинальной (классификационной) шкале означает определение 
принадлежности объекта (наблюдения) к тому или иному классу. Например: пол, род 


36 
войск, профессия, континент и т.д. В этой шкале можно лишь посчитать количество 
объектов в классах – частоту и относительную частоту. 
Измерение в порядковой (ранговой) шкале, помимо определения класса 
принадлежности, позволяет упорядочить наблюдения, сравнив их между собой в каком-то 
отношении. Однако эта шкала не определяет дистанцию между классами, а только то, 
какое из двух наблюдений предпочтительнее. Поэтому порядковые экспериментальные 
данные, даже если они изображены цифрами, нельзя рассматривать как числа и выполнять 
над ними арифметические операции 5 . В этой шкале дополнительно к подсчету частоты 
объекта можно вычислить ранг объекта. Примеры переменных, измеренных в порядковой 
шкале: бальные оценки учащихся, призовые места на соревнованиях, воинские звания, 
место страны в списке по качеству жизни и т.д. Иногда номинальные и порядковые 
переменные называют категориальными, или группирующими, так как они позволяют 
произвести разделение объектов исследования на подгруппы. 
При измерении в интервальной шкале упорядочивание наблюдений можно 
выполнить настолько точно, что известны расстояния между любыми двумя их них. 
Шкала интервалов единственна с точностью до линейных преобразований (y = ax + b). 
Это означает, что шкала имеет произвольную точку отсчета – условный нуль. Примеры 
переменных, измеренных в интервальной шкале: температура, время, высота местности 
над уровнем моря. Над переменными в данной шкале можно выполнять операцию 
определения расстояния между наблюдениями. Расстояния являются полноправными 
числами и над ними можно выполнять любые арифметические операции. 
Шкала отношений похожа на интервальную шкалу, но она единственна с 
точностью до преобразования вида y = ax. Это означает, что шкала имеет фиксированную 
точку отсчета – абсолютный нуль, но произвольный масштаб измерения. Примеры 
переменных, измеренных в шкале отношений: длина, вес, сила тока, количество денег, 
расходы общества на здравоохранение, образование, армию, средняя продолжительность 
жизни и т.д. Измерения в этой шкале – полноправные числа и над ними можно выполнять 
любые арифметические действия. 
Абсолютная шкала имеет и абсолютный нуль, и абсолютную единицу измерения 
(масштаб). Примером абсолютной шкалы является числовая прямая. Эта шкала 
безразмерна, поэтому измерения в ней могут быть использованы в качестве показателя 
степени или основания логарифма. Примеры измерений в абсолютной шкале: доля 
безработицы; доля безграмотных, индекс качества жизни и т.д. 
Большинство статистических методов относятся к методам параметрической 
статистики, в основе которых лежит предположение, что случайный вектор переменных 
образует некоторое многомерное распределение, как правило, нормальное или 
преобразуется к нормальному распределению. Если это предположение не находит 
подтверждения, следует воспользоваться непараметрическими методами математической 
статистики. 


Достарыңызбен бөлісу:
1   ...   20   21   22   23   24   25   26   27   ...   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет