И анализ больших данных



Pdf көрінісі
бет36/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   32   33   34   35   36   37   38   39   ...   65
Байланысты:
BIG дата книга

 
 
Тема 7 Современные программные средства анализа больших объемов 
информации 
 
 
Цель
: рассмотреть современные популярные программные средства анализа 
данных: Statistica, Excel, их преимущества и недостатки 
 
План: 
7.1 Обзор программного средства анализа данных: Statistica 


50 
7.1 Обзор программного средства анализа данных: Statistica 
STATISTICA — это интегрированная система анализа и управления данными. 
STATISTICA — это инструмент разработки пользовательских приложений в бизнесе, 
экономике, финансах, промышленности, медицине, страховании и других областях. 
STATISTICA легка в освоении и использовании. 
Все аналитические инструменты, имеющиеся в системе, доступны пользователю и 
могут быть выбраны с помощью альтернативного пользовательского интерфейса. 
Пользователь может всесторонне автоматизировать свою работу, начиная с применения 
простых макросов для автоматизации рутинных действий вплоть до углубленных 
проектов, включающих в том числе интеграцию системы с другими приложениями или 
Интернет. Технология автоматизации позволяет даже неопытному пользователю 
настроить систему на свой проект. 
Процедуры системы STATISTICA имеют высокую скорость и точность 
вычислений. 
Гибкая и мощная технология доступа к данным позволяет эффективно работать как 
с таблицами данных на локальном диске, так и с удаленными хранилищами данных. 
Система обладает следующими общепризнанными достоинствами: 

содержит полный набор классических методов анализа данных: от основных 
методов статистики до продвинутых методов, что позволяет гибко организовать анализ; 

является средством построения приложений в конкретных областях; 

в комплект поставки входят специально подобранные примеры, 
позволяющие систематически осваивать методы анализа

отвечает всем стандартам Windows, что позволяет сделать анализ 
высокоинтерактивным; 

система может быть интегрирована в Интернет;

поддерживает web-форматы: HTML, JPEG, PNG; 

легка в освоении, и как показывает опыт, пользователи из всех областей 
применения быстро осваивают систему; 

данные системы STATISTICA легко конвертировать в различные базы 
данных и электронные таблицы; 

поддерживает высококачественную графику, позволяющую эффектно 
визуализировать данные и проводить графический анализ; 

является открытой системой: содержит языки программирования, которые 
позволяют расширять систему, запускать ее из других Windows-приложений, например, из 
Excel. 
STATISTICA состоит из набора модулей, в каждом из которых собраны 
тематически связные группы процедур. При переключении модулей можно либо 
оставлять открытым только одно окно приложения STATISTICA, либо все вызванные 
ранее модули, поскольку каждый из них может выполняться в отдельном окне (как 
самостоятельное приложение Windows). 
При исполнении модулей STATISTICA как самостоятельных приложений в любой 
момент времени в любом модуле имеется прямой доступ к «общим» ресурсам (таблицам 
данных, языкам BASIC и SCL, графическим процедурам). 
Командный язык STATISTICA (SCL) 
STATISTICA содержит два встроенных языка программирования STATISTICA 
BASIC и SCL (командный язык). Оба языка предназначены для работы в среде 
STATISTICA и содержат встроенные операции для обращения к таблицам исходных 
данных, таблицам результатов и графическим функциям. 
Язык STATISTICA BASIC представляет собой простой и одновременно достаточно 
мощный язык программирования. С его помощью можно создать широкий спектр 


51 
приложений, начиная от простых программ преобразования данных и кончая сложными 
пользовательскими процедурами комплексного анализа и вывода информации. 
Этот язык программирования пригоден для решения больших вычислительных 
задач, поскольку обрабатываемые массивы данных могут иметь до 8 измерений и нет 
ограничений на размеры массивов. Таким образом, пользователь может использоваться 
всю доступную память и создавать процедуры, включающие операции с большими 
многомерными матрицами. 
Встроенный язык STATISTICA BASIC доступен в любой момент анализа вместе с 
интегрированной средой, которая позволяет писать, редактировать, проверять, отлаживать 
(предварительно прогонять) и выполнять программы. 
Язык STATISTICA BASIC, как обычный язык программирования, поддерживает 
циклические операции и условные переходы, функции и подпрограммы, а также работу с 
динамическими библиотеками (DLL). В то же время он «понимает» структуру файлов 
данных системы STATISTICA и позволяет организовать интерактивную обработку 
данных в среде самой системы с помощью пользовательских диалоговых окон. С 
помощью этого языка пользователь может создавать свои собственные сложные 
программы анализа данных, одновременно используя готовые алгоритмы расчетов и 
построения графиков, предусмотренные в системе STATISTICA
Командный язык SCL ( STATISTICA Command Language) предназначен для 
организации пакетной обработки данных и создания собственных приложений на основе 
процедур, содержащихся в системе STATISTICA. Для того чтобы пользователь мог при 
этом реализовать собственные алгоритмы расчетов, предусмотрена возможность 
интеграции языков STATISTICA BASIC и SCL. 
Программы, написанные на встроенных языках системы STATISTICA, доступны в 
любом модуле системы и на любом этапе анализа данных, при этом их можно вызывать и 
выполнять как с помощью кнопок автозадач, так и непосредственно из окна 
редактирования. Пользователь также имеет возможность создавать собственные 
библиотеки функций и подпрограмм и таким образом значительно расширять 
предлагаемый набор процедур обработки данных и представления результатов. 


Достарыңызбен бөлісу:
1   ...   32   33   34   35   36   37   38   39   ...   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет