И анализ больших данных



Pdf көрінісі
бет27/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   23   24   25   26   27   28   29   30   ...   65
Байланысты:
BIG дата книга

 
 
Дискриминантный анализ 
Дискриминантный анализ включает статистические методы классификации 
многомерных наблюдений в ситуации, когда исследователь обладает так называемыми 
обучающими выборками. Этот вид анализа является многомерным, так как использует 
несколько признаков объекта, число которых может быть сколь угодно большим. Цель 
дискриминантного анализ состоит в том, чтобы на основе измерения различных 
характеристик (признаков) объекта классифицировать его, т. е. отнести к одной из 
нескольких заданных групп (классов) некоторым оптимальным способом. При этом 
предполагается, что исходные данные наряду с признаками объектов содержат 
категориальную (группирующую) переменную, которая определяет принадлежность 
объекта к той или иной группе. Поэтому в дискриминантном анализе предусмотрена 


39 
проверка непротиворечивости классификации, проведенной методом, с исходной 
эмпирической классификацией. Под оптимальным способом понимается либо минимум 
математического ожидания потерь, либо минимум вероятности ложной классификации. В 
общем случае задача различения (дискриминации) формулируется следующим образом. 
Пусть результатом наблюдения над объектом является построение k-мерного случайного 
вектора Х = (X1, X2, …, XК), где X1, X2, …, XК – признаки объекта. Требуется 
установить правило, согласно которому по значениям координат вектора Х объект 
относят к одной из возможных совокупностей i, i = 1, 2, …, n. Методы дискриминации 
можно условно разделить на параметрические и непараметрические. В параметрических 
известно, что распределение векторов признаков в каждой совокупности нормально, но 
нет информации о параметрах этих распределений. Непараметрические методы 
дискриминации не требуют знаний о точном функциональном виде распределений и 
позволяют решать задачи дискриминации на основе незначительной априорной 
информации о совокупностях, что особенно ценно для практических применений. Если 
выполняются условия применимости дискриминантного анализа – независимые 
переменные–признаки (их еще называют предикторами) должны быть измерены как 
минимум в интервальной шкале, их распределение должно соответствовать нормальному 
закону, необходимо воспользоваться классическим дискриминантным анализом, в 
противном случае – методом общие модели дискриминантного анализа. 


Достарыңызбен бөлісу:
1   ...   23   24   25   26   27   28   29   30   ...   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет