Лекция 3 Data Mining – технология добычи данных Технология Data Mining


Рисунок 1. Уровни знаний, извлекаемых из данных



бет3/18
Дата28.04.2023
өлшемі0,87 Mb.
#87620
түріЛекция
1   2   3   4   5   6   7   8   9   ...   18
Байланысты:
Лекция3

Рисунок 1. Уровни знаний, извлекаемых из данных

  • Рисунок 1. Уровни знаний, извлекаемых из данных
  • OLAP

Литература

  • 1. А.А. Барсегян «Методы и модели анализа данных: OLAP и Data Mining», Санкт-Петербург, изд-во БХВ-Петрбург, 2004 г. Книга – обзор технологий обработки данных, первая на русском языке.
  • 2. Р.Г.Степанов. Технология Data Mining: Интеллектуальный Анализ Данных; 2008
  • 3. И.А.Чубукова. Data Mining; 2008
  • 4. Р.Гонсалес.Принципы распознавания образов Дж.Ту,; 1978

Определение Data Mining

  • В целом технологию Data Mining достаточно точно определяет Григорий Пиатецкий-Шапиро — один из основателей этого направления:
  • Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
  • Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Неочевидных - это значит, что найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных - это значит, что обнаруженные закономерности будут полностью соответствовать действительности, в отличие от экспертного мнения, которое всегда является субъективным. Практически полезных - это значит, что выводы имеют конкретное значение, которому можно найти практическое применение. (Григорий Пиатецкий-Шапиро)

Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез (verification-driven data mining) и на "грубый" разведочный анализ, составляющий основу оперативной аналитической обработки данных (OnLine Analytical Processing, OLAP), в то время как одно из основных положений Data Mining - поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Поскольку именно формулировка гипотезы относительно зависимостей является самой сложной задачей, преимущество Data Mining по сравнению с другими методами анализа является очевидным.

  • Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез (verification-driven data mining) и на "грубый" разведочный анализ, составляющий основу оперативной аналитической обработки данных (OnLine Analytical Processing, OLAP), в то время как одно из основных положений Data Mining - поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Поскольку именно формулировка гипотезы относительно зависимостей является самой сложной задачей, преимущество Data Mining по сравнению с другими методами анализа является очевидным.


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   18




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет