Семинар 15. Работа с агрегатами


Агрегаты, основанные на столбцах группирования



бет7/10
Дата07.05.2023
өлшемі1,86 Mb.
#90924
түріСеминар
1   2   3   4   5   6   7   8   9   10
Агрегаты, основанные на столбцах группирования
Характеристики моделей больших данных на базе Hadoop отличаются от многомерных моделей. Во избежание объединений между большими таблицами в таких моделях часто не используют связи. Вместо этого атрибуты измерений денормализуются до таблиц фактов. Модели больших данных можно использовать для интерактивного анализа, прибегнув к агрегатам, основанным на столбцах "группировать по" .
В следующей таблице содержится числовой столбец Movement для агрегирования. Все остальные столбцы являются атрибутами для группирования. Таблица содержит данные Интернета вещей и значительное количество строк. Режимом хранения является DirectQuery. Запросы в источнике данных, выполняющие агрегирование по всему набору данных, выполняются медленно из-за огромного объема.

Чтобы обеспечить интерактивный анализ на основе этого набора данных, можно добавить таблицу агрегирования, выполняющую группировку по большинству атрибутов, но исключающую атрибуты с высокой кратностью, такие как широта и долгота. Это значительно уменьшает количество строк, и таблица становиться достаточно небольшой для помещения в кэш в памяти.

Сопоставления агрегатов для таблицы Driver Activity Agg определяются в диалоговом окне Управление агрегатами.

В агрегатах, основанных на столбцах "группировать по", записи GroupBy являются обязательными. Без них не получится обратиться к агрегатам. Это поведение отличается от использования агрегатов на основе связей, в которых записи GroupBy являются необязательными.
В следующей таблице показаны агрегаты для таблицы Driver Activity Agg.

Для таблицы Driver Activity Agg можно установить режим хранения "Импорт".
Пример запроса к агрегату GroupBy
Приведенный ниже запрос достигнет агрегата, так как столбец Activity Date охватывается таблицей агрегирования. Функция COUNTROWS использует агрегат Подсчитать строки таблицы.

Для моделей, которые содержат атрибуты фильтра в таблицах фактов, особенно рекомендуется использовать агрегаты Подсчитать строки таблицы. Power BI может отправлять запросы к набору данных с помощью COUNTROWS в случаях, когда нет явного запроса пользователя. Например, в диалоговом окне фильтра отображается число строк для каждого значения.



Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет