Лекция 3 Data Mining – технология добычи данных Технология Data Mining


Относительная шкала (ratio scale) - шкала, в которой есть определенная точка отсчета и возможны отношения между значениями шкалы



бет6/18
Дата28.04.2023
өлшемі0,87 Mb.
#87620
түріЛекция
1   2   3   4   5   6   7   8   9   ...   18

Относительная шкала (ratio scale) - шкала, в которой есть определенная точка отсчета и возможны отношения между значениями шкалы.

  • Относительная шкала (ratio scale) - шкала, в которой есть определенная точка отсчета и возможны отношения между значениями шкалы.
  • Пример такой шкалы: вес новорожденного ребенка (4 кг и 3 кг). Первый в 1,33 раза тяжелее.
  • Цена на картофель в супермаркете выше в 1,2 раза, чем цена на базаре.
  • Относительные и интервальные шкалы являются числовыми.
  • Для этой шкалы применимы такие операции: равно (=), не равно ( ), больше (>), меньше (<), операции сложения (+) и вычитания(-),умножения (*) и деления (/).

Дихотомическая шкала (dichotomous scale) - шкала, содержащая только две категории.

  • Дихотомическая шкала (dichotomous scale) - шкала, содержащая только две категории.
  • Пример такой шкалы: пол (мужской и женский).
  • Пример использования разных шкал для измерений свойств различных объектов, в данном случае температурных условий, приведен в таблице данных
  •  Таблица - Множество измерений свойств различных объектов
  • Номер объекта
  • Профессия (номинальная шкала)
  • Средний балл (интервальная шкала)
  • Образование (порядковая шкала)
  • 1
  • слесарь
  • 22
  • среднее
  • 2
  • ученый
  • 55
  • высшее
  • 3
  • учитель
  • 47
  • высшее

Задачи анализа данных

  • Классификация (Classification) Наиболее простая и распространенная задача Data Mining. В результате решения задачи классификации обнаруживаются признаки, которые характеризуют группы объектов исследуемого набора данных - классы; по этим признакам новый объект можно отнести к тому или иному классу. Методы решения. Для решения задачи классификации могут использоваться методы: ближайшего соседа (Nearest Neighbor); k-ближайшего соседа (k-Nearest Neighbor); байесовские сети (Bayesian Networks); индукция деревьев решений; нейронные сети (neural networks).
  • Кластеризация (Clustering) Кластеризация является логическим продолжением идеи классификации. Это задача более сложная, особенность кластеризации заключается в том, что классы объектов изначально не предопределены. Результатом кластеризации является разбиение объектов на группы. Пример метода решения задачи кластеризации: обучение "без учителя" особого вида нейронных сетей - самоорганизующихся карт Кохонена.


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   18




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет