11
В настоящее время выделяют следующие основные классы задач анализа данных:
Таблица 2- Основные классы задач анализа данных
Класс задач
Описание, примеры
Прогнозирование
(Forecasting)
Нахождение будущих состояний объекта на основании предыдущих
состояний (исторических данных). Примеры:
- прогнозирование ситуаций на валютных рынках,
- прогнозирование цен на рынке недвижимости,
- прогнозирование демографических процессов,
- прогнозирование климатических процессов….
Классификация
(Classification)
Нахождение правила, позволяющее отнести объект к тому или
иному классу (выбрать класс из
числа известных заранее классов) на
основе информации о том, к какому классу относятся другие объекты.
Примеры:
- Задачи распознавание образов (распознавание рукописного текста,
фотографии (например, определение номера автомобиля по фото),
идентификация личности по фото, голосу, видео…);
- Задачи атрибуции (определение авторства / периода создания /
страны происхождения …произведений искусства, археологических
находок);
- Задачи диагностики (в медицине и технике)
Кластеризация
(Clusterization)
Нахождение правила для автоматического разделения имеющихся
объектов на классы на основании сходства тех или иных характеристик
(факторов) этих объектов. При этом ни сами классы, ни их количество
заранее неизвестны. Примеры:
- Сегментация рынка (разделение всех потенциальных потребителей
на кластеры для последующего целевого воздействия, например,
создания целевой рекламы);
- Задачи разбиения множества индивидов на группы кластеры (в
социологии, психологии, биологии и пр…)
Ассоциация
(Associations)
Поиск устойчивых закономерностей между случайными событиями,
наступающими одновременно.
Пример: - Анализ покупательской корзины – поиск «устойчивых
связей в корзине покупателя» (осуществляется с целью учёта их при
планировании расположения отделов в супермаркете).
Последовательность
(Последовательная
ассоциация,
Нахождение
последовательных
шаблонов) (Sequence,
Sequential association,
Sequential pattern)
Поиск устойчивых закономерностей между случайными событиями,
связанными во времени, т.е. правил вида: после события X через время t
происходит событие Y.
Пример: - После покупки квартиры жильцы в 60% случаев в
течение двух недель приобретают холодильник, а в течение двух
месяцев в 50% случаев приобретается телевизор.
Решение данной задачи широко применяется в
маркетинге и
менеджменте, например, при управлении циклом работы с клиентом
(Customer Lifecycle Management).
Визуализация данных
(Data Visualization)
Графическое изображение данных (2D и 3D диаграммы,
гистограммы, графики, облака точек…)
Анализ отклонений
(Deviation Detection)
Обнаружение и анализ данных, наиболее отличающихся от общего
множества данных. Примеры:
- выявление нетипичной сетевой активности позволяет обнаружить
вредоносные программы; выявление мошенничества с кредитными
карточками.
Таким образом, названные задачи
анализа данных возникают в самых разных
областях, в частности, в таких как: