«интеграция казахстанской науки в международное научно образовательное пространство»



Pdf көрінісі
бет27/42
Дата15.03.2017
өлшемі8,62 Mb.
#9639
1   ...   23   24   25   26   27   28   29   30   ...   42

Литература

1.Мусин Ж. ―Трагедия Арала началась в двацатых …‖//Простор – 1993 - №11 

2. Hydrobiology  of the  Aral Sea. Edited by Nikolay V. Aladin et al. Dying and 

Dead Seas: Climatic vs. Anthropic  Causes. NATO Science Series IV: Earth and 

Environmental Sciences. Vol. 36. Kluwer, 2004. 

3.The Aral Sea Disaster. Philip Micklin in Annual Review of Earth and Planetary 

Sciences. Vol. 35, pages 47–72; 2007. 

 

 



Қысқаша тҥйіндеме 

 

Арал  теңізі  -  Орталық  Азиядағы  тұзды  тұндырылған  кӛл.  Арал  теңізі 



бүкіл  әлем  бойынша  қайғылы  болып,  қайтадан  қалпына  келуі  мүмкін. 

Сырдарияның басқару саласындағы іске асырылатын жобалардың арқасында 

қазірдің ӛзінде алғашқы Кіші Аралды құруға қол жеткізілуде.  

На

рх



оз

 У

ни



ве

рс

ит



ет

і


251 

 

Краткое резюме 

 

Аральское  море  —  бессточное  соленое  озеро  в  Средней  Азии. 



Аральское  море,  ставшее  трагично  известным  всему  миру,  может 

возродиться.  Благодаря  реализуемому  проекту  по  рациональному 

регулированию  русла  реки  Сырдарьи  уже  удалось  создать  первое 

рукотворное море Малый Арал. 



Executivesummary 

 

The  Aral  is  an  inland  salt-water  sea  with  no  outlet.The  Aral  Sea  which 



became tragically known  around the world.Due to ongoing projects for the sound 

management  of  SyrDarya  it  has  already  managed  to  create  the  first  man-made 

Small Aral Sea.

 

 



 

УДК 004.67                                                                      Дауренбеков И.Р., 

студент 4 курса специальности 

«Информационные системы» 

Университет НАРХОЗ 

Научный руководитель: Ph.D. проф.Укубасова Г.С. 

 

BIG DATA: АППАРАТ АНАЛИЗА ДАННЫХ, ПРОБЛЕМЫ И 

ТЕХНОЛОГИИ 

 

Ключевые  слова:  Big  Data,  большие  данные,  анализ  данных, 

подсистема анализа, многомерный анализ. 

Тҥйінді  сӛздер:  Big  Data,  Big  Data,  деректерді  талдау,  ішкі  жүйесі 

талдау, кӛпӛлшемді талдау. 



Keywords:    Big  Data,  Big  Data,  data  analysis,  subsystem  analysis, 

multivariate analysis. 

 

Анализ  данных  сам  по  себе  процесс  очень  трудоемкий  и  требует 



больших ресурсов для  обработки,  а  если  говорить  уже  о  больших  массивах 

данных,  то  тут  дела  обстоят  сложнее.  Обычно  ситуация  с  большими 

массивами  данных  встречается  в  местах,  где  работа  связана  с  ведением 

розничной  торговли,  банками,  интернетом,  телекоммуникациями,  где 

присутствует  огромный  поток  информации,  который  растет  изо  дня  в  день 

(чеки, платежи, звонки, сообщения и т. д.) [1]. 

Подсистема анализа может быть построена на основе

1. 


подсистемы  информационно-поискового  анализа  на  базе 

реляционных СУБД и статических запросов с использованием языка SQL; 

2. 

подсистемы  оперативного  анализа.  Для  реализации  таких 



подсистем  применяется  технология  оперативной  аналитической  обработки 

данных  OLAP,  использующая  концепцию  многомерного  представления 

данных; 

3. 


подсистемы  интеллектуального  анализа,  реализующие  методы  и 

алгоритмы Data Mining. 

На

рх

оз



 У

ни

ве



рс

ит

ет



і

252 

 

Большие  массивы  данных,  хранящиеся  в  компаниях  и  разного  рода 



предприятиях,  должны  отвечать  3-м  основным  характеристикам  данных: 

скорость,  объем,  разнообразие.  Существует  много  других  характеристик, 

относящиеся  в  эту  категорию,  но  их  можно  считать  дополнением  к  3 

вышеперечисленным.  Опираясь  на  три  основных  фактора,  создаются 

технологии,  за  счет  которых  и  появляется  возможность  хранить  большие 

объемы  информации.  Их  можно  соизмерять  петабайтами.  Таким  образом, 

всплывает проблема с хранением данных

Проблемы  хранения  и  обработки  аналитической  информации 

становятся  все  более  актуальными  и  привлекают  внимание  специалистов  и 

фирм,  работающих  в  области  информационных  технологий,  что  привело  к 

формированию полноценного рынка технологий бизнес-анализа. 

Или  же  взять  сферу  бизнеса.  Каждый  день  составляются  отчеты, 

которые  со  временем  собираются  в  очень  большое  количество.  И  может 

случиться  так,  что  при  анализе  могут  поставить  задачу,  на  которую  эти 

отчеты не смогут дать ответ. Вот и всплывает проблема несоответствия цели 

сбора  информации  и  ее  использования,  но  проблема  неструктурированных 

данных  всегда  остается  актуальной.  Обработка  неструктурированных 

массивов  данных  определяется  рядом  признаков,  которые  осложняют 

процесс  обработки  данных.  Первым  признаком  считают  разнообразность 

данных.  Вторым  признаком  является  такое  свойство,  что  если  даже 

существует несколько файлов с одинаковыми наборами данных, то они могут 

содержать  совсем  различный  смысл.  Третьим  признаком  считают 

динамичность  информации,  так  как  информация  со  временем  меняет  свою 

структуру  и  значение.  Использование  способов  обработки  данных

соприкасается  с  таким  понятием,  как  онтология.  Онтология  -  это 

совокупность 

схем, 

которые 


описывают 

предметную 

областью, 

определяющая проблемы и общую базу задачи [2]. 

К проблемам Big Data так же можно отнести и дефицит специалистов, 

которые могли бы работать с большими данными на должном уровне, ведь от 

их  работы,  зависит  срок  окупаемости  инвестиций  вложенных  в  Big  Data.  В 

связи  с  этим,  все  проекты,  которые  связаны  с  Big  Data,  принято  считать 

сложными  в  реализации  и  оценке  результатов.  Из-за  генерации  большого 

потока  данных  в  бизнес-сфере,  процесс  обработки  проходит  в  режиме  ETL 

("extract",  "transform",  "load"-«извлечение,  преобразование,  загрузка»).  Этот 

режим  помогает  в  управлении  хранилищами  данных,  извлекая  данные  из 

источников  хранения,  трансформирует  и  очищает  с  той  целью,  что  в 

дальнейшем они будут полезны. То есть это не только инструмент переноса 

данных, но и подготовки данных к анализу. 

Традиционными  хранилищами  являются  те  хранилища,  у  которых 

имеется одинаковый набор инструментария для проведения анализа данных

Тут  используются  такие  методы  как  многомерный  анализ  (OLAP), 

кластеризация 

данных, 


проведение 

анализа 


регрессии, 

поиск 


закономерностей.  Так  же  существуют  и  программные  продукты, 

На

рх



оз

 У

ни



ве

рс

ит



ет

і


253 

 

выполняющие  эти  же  функции,  которые  позволяют  работать  с  большими 



данными. 

Книмможноотнести: 

SAPHANA, 

GreenplumChorus, 

AsterDatanCluster.Важным моментом в анализе больших данных является то, 

что нельзя зацикливаться на одном методе, а брать только самые ключевые 

моменты.  Ключевым  фактором  скорости  при  работе  с  Большими  данными 

является  количество  операций  ввода  и  вывода  и  эффективность  ключевых 

индексов. 

Многомерный  анализ  строится  на  построении  многомерного  OLAP 

куба, который в результате выводит таблицу с ячейками. Внутри этих ячеек 

находятся  показатели.  В  свою  очередь  OLAP  подразделяется  на  такие 

системы,  как  MOLAP,  ROLAP  и  HOLAP.  Среди  них  самой  изученной 

является  ROLAP,  а MOLAP  и  HOLAP относятся к категории  «ноу-хау»  что 

мало изучено. 

При  использовании  регрессии  строится  параметрическая  функция, 

которая  основывается  на  числовых  величинах  и  определенный  промежуток 

времени.  Использование  такого  метода  предполагает  то,  что  использование 

нынешних данных с промежутками времени может предсказать дальнейшее 

значение этих величин уже в будущем. 

Метод  классификации  отчасти  схож  с  методом  регрессии,  но 

построение тут строится на зависимости одного переменного от нескольких 

других. 

Кластеризация  строится  на  принципе  разбиения  групп  по  схожим 

признакам. Члены одной группы схожи по определенным признакам между 

собой,  но  разные  по  сравнению  с  другими.  Тут  уже  идет  работа  с 

метаинформацией.  Таким  примером  может  служить  поисковая  система, 

причем любая. 

При  выполнении  различного  рода  "манипуляций"  с  большими 

массивами  данных  нет  определенного  способа  обработки  этих  данных

Поэтому существует множество способов, которые отличны друг от друга, но 

стремятся  к  единому  результату.  Отличием  этих  способов  является 

производительность,  удобство  в  эксплуатации,  а  так  же  технологии 

обработки данных и требования данных. 

В СУБД есть возможность увеличения скорости обработки данных при 

использовании определенных встроенных механизмов. Помимо оптимизации 

работы БД, можно использовать подходы, которые во много раз увеличивают 

скорость  обработки  информации.  Например,  «Комбинированная  модель».  В 

ней  использую  различного  вида  математические  модели  для  обработки. 

Данные  проходят  через  ряд  моделей,  которые  отбирают  данные  по  своему 

функционалу.  В  Комбинированной  модели  есть  свое  правило  «не  тратить 

время на обработку того, что можно и не анализировать». 

В  модели  есть  закономерность  от  простого  к  сложному  (рис.  1).  В 

начале  используются  простые  алгоритмы  решения  задачи,  которые  в 

процессе обработки отбирают данные, под силу их обработки или не стоящие 

смысла  обрабатывать.  Тем  самым  остальные  данные  идут  на  дальнейшую 

На

рх

оз



 У

ни

ве



рс

ит

ет



і

254 

 

обработку,  где  используются  более  сложные  алгоритмы  обработки.  В  итоге 



остается  этап  со  сложной  системой  обработки,  но  и  объем  данных  уже  не 

велик, что увеличивает скорость обработки в несколько раз [3]. 

 

 

 



Рисунок 1–  «Комбинированная» модель обработки 

 больших массивов данных[3]. 

 

Есть  другая  модель,  которая  называется  «параллельная  обработка» 



(рис.2). Это еще один способ обрабатывать БМД с большей скоростью, чем в 

обычном  режиме.  Суть  способа  в  том,  что  поток  данных  он  делит  на 

сегменты и для каждого сегмента строится своя собственная модель. 

 

 



 

 

 



 

 

 



Рисунок 2 –  Модель «параллельной» обработки больших  

массивов данных[3] 

 

В итоге все полученные результаты объединяются в один единый. Этот 



подход  позволяет  выполнять  обработку  с  большей  скоростью,  благодаря 

тому,  что  данные  обрабатываются  пучками  и  не  требует  больших  объемов 

памяти.  Режим  ETL  значительно  уменьшает  время  работы,  а  также  дает 

хорошее преимущество в том, что создавать и содержать простые модели по 

отдельности легче, чем одну массивную. 

Существует много подобных методов, которые различными способами, 

своими  фишками  и  особыми  технологиями  позволяют  выполнять  функцию 

увеличения скорости обработки данных занимая при этом малое количество 

времени. 

Выводы.  В  настоящее  время  предприятиям  приходится  работать  с 

большими объемами информации, которая часто обновляется и приходит из 

разных  источников.  С  помощью  технологий  Big  Data  предприятия  могут 

анализировать  огромные  массивы  данных  и  выявлять  полезные 

На

рх

оз



 У

ни

ве



рс

ит

ет



і

255 

 

закономерности, дающие им конкурентные преимущества. Для более легкого 



восприятия  и  быстрого  принятия  управленческих  решений  необходимо 

представить  результаты  анализа  данных  визуально.  На  данный  момент  есть 

несколько видов представления массивов данных. Но существующие методы 

визуализации еще недостаточно развиты и требуют усовершенствования.  

 

Литература: 

1.  http://polit.ru/article/2013/12/09/ps_bigdata  –  Большие  данные  // 

[Электронный ресурс]. –Дата обращения:24.03.2016 г. 

2. http://www.osp.ru/os/2012/07/13017638  –  Проблемы  анализа  Больших 

Данных // [Электронный ресурс]. Дата обращения:27.03.2016 г. 

3. 


https://basegroup.ru/community/articles/very-large-data 

– 

Анализ 



больших объемов данных//[Электронный ресурс]. Дата обращения:28.03.2016 

г. 


 

Краткое резюме 

В  данной  статье  обоснована  перспективность  применения  технологий 

Big  Data.  Рассмотрены  проблемы  и  описаны  современные  методы  анализа 

больших  данных.  Показаны  преимущества  при  использовании  технологий 

Big Data. 

Қысқаша тҥйіндеме 

Бұл  қағаз  технологиялар  Big  Data  перспективалы  пайдалануды 

негіздейді. Проблемалар және ірі деректерді талдау қазіргі заманғы әдістерін 

сипаттайды. Технологиялардыпайдаланаотырып, BigDataартықшылықтары. 



Executivesummary 

This  paper  substantiates  the  use  of  promising  technologies  Big  Data.  The 

problems and describes modern methods of analysis of large data. The advantages 

of using technologies Big Data. 

 

 

Елібай А.Ә. 



«Экология» мамандығының магистранты  

Ғылыми жетекші: «Табиғатты пайдалану экономикасы»  

кафедрасының доцент м.а., б.ғ.к. Бӛрібай Э.С.   

 

АЛМАТЫ ҚАЛАСЫ ТОПЫРАҚ РЕСУРСТАРЫНЫҢ АУЫР 

МЕТАЛДАРМЕН ЛАСТАНУЫНА ЭКОЛОГИЯЛЫҚ МОНИТОРИНГ 

ЖҤРГІЗУ   

 

Ключевые  слова:  мониторинг,  мегаполис,  эмиссия,  предельно-

допустимое  концентрация  (ПДК),  гидрометеорология,  аккумуляция, 

техногенез, энергосбережение.  

На

рх



оз

 У

ни



ве

рс

ит



ет

і


256 

 

Кілтті  сӛздер:  мониторинг,  мегаполис,  эмиссия,  рауалды  шекті 

концентрация  (РШК),  гидрометеорология,  аккумулятивті,  техногенді, 

энергияүнемдеу. 



 

Key words:monitoring, metropolis , emissions , maximum permissible 

concentration (MPC) , hydrometeorology , accumulation , technogenesis , energy 

saving . 

 

Алматы  қаласы  еліміздегі  ең  ірі  мегаполис  болып  табылады.  Қазіргі 

танда Алматы еліміздің экономика, қаржы, мәдени және білім беру орталығы 

болып  қана  қоймай,  сонымен  қатар    ӛндірістің  ӛсуі,  экономиканың  дамуы, 

халықтың  әл-ауқатының  жақсаруы  қоршаған  орта  мен  қала  экологиясына 

кері  әсерін  тигізуде.  Ауаны  ластаушы  стационарлы,  жылжымалы  кӛздердің 

жылдан-жылға  артуына  байланысты  қала  атмосферасының  ластану  деңгейі 

халықтың  денсаулығына  кері  әсерін  тигізіп  отырғаны  аса  маңызды 

экологиялық жағдайды тудырып отыр.  

Осы  жағдайды  ушықтыруға  қомақты  үлес  қосып  жатқан  қаламыздағы 

автокӛлік  қозғалысы  екендігі  баршамызға  аян.  Алматыда  автокӛліктің  саны 

521 мыңнан астам бірлікті құраса, халықтың автокӛліктерге  ие болу деңгейі 

әрбір 1000 адамға есептегенде 350-ден астам жеңіл кӛлікке жетіп отыр. 

Алматы  қаласы  гидрометеорологиялық  мониторинг  орталығының  

ресми  мәліметтеріне  сүйенсек,  соңғы  жылдары  экологиялық  жағдай 

жақсаруға  бет  алғанын  айтуға  болады.  Алматыда  атмосфералық  ауаның 

ластану  деңгейі  2008  жылы  13,3  құраса,  2015  жылы   бұл  кӛрсеткіш  11,1 

құрады. 


Экологиялық  проблемалардың  қоғам  үшін  жоғарғы  маңыздылығын 

ескере  отырып,  қала  әкімшілігі  мегаполистің  экологиялық  жағдайын 

жақсарту  үшін  кешенді  жұмыс  атқарып  жатқаны  белгілі.  Соған  қарамастан 

Алматы қаласының экологиясы күн тәртібінен түскен емес.  

Біздің  зерттеулерімізде    топырақтың  құрамындағы  ауыр  металдардың  

мӛлшерін анықтауға ерекше  мән берілді. Себебі, су және атмосфералық ауа 

ортасы ауыр металдардың қозғалысы үшін миграциялық орта болып саналса, 

ал  топырақ  ресурсы  обьективті  орта  болып  қана  қоймай,  техногенді 

ластануды,  ластаушы  заттардың  эмиссиясын  айқындайтын  тұрақты 

индикатор.  Ауыр  металдар  топырақ  қабатында  жинақтала  отырып, 

уыттылығының  деңгейіне  байланысты  топырақ  түзуші  бионттардың 

биологиялық белсенділігіне әсер етіп, дамуын тежейді. 

Зерттеу  нысаны  ретіндеӛзіміз  тұратын    жерлердің    топырақ 

ресурстарынан үлгілер алынып, құрамындағы кейбір ауыр металдар мӛлшері 

анықталды. Олар: №1 – Бас ботаникалық бақ; №2 – Нархоз университеті; №3 

– Шаңырақ ықшам ауданы; №4 – Каменка. 



Зерттеу нәтижелері. Топырақтың ауыр металдармен (Cd, Cu және Pb) 

ластану дәрежесін анықтау жұмысы «Алматы қаласы гидрометерологиялық 

мониторинг» мекемесінің экологиялық ақпараттар және химико-

аналитикалық зерттеу лабораториясында  жүргізілді.  

На

рх

оз



 У

ни

ве



рс

ит

ет



і

257 

 

1-кесте. Алматы қаласы бекеттерінен анықталған топырақ құрамындағы ауыр 



металдар мӛлшері 

№ 

Үлгілер 



Кӛктем 

Күз 


Ауыр металдар мӛлшері, мг/кг 

Pb 


Zn 

Cu 


Pb 

Zn 


Cu 

1  Ботан. бақ  25,5±1,5  18,5±0,8  0,5±0,02 

28,3±1,2  20,7±1,5  0,5±0,01 

2  Нархоз 

47,0±1,2  20,7±1,1  0,75±0,01  59,7±1,8  31,3±1,7  1,2±0,02 

3  Шаңырақ 

86,7±2,4  33,0±1,6  1,2±0,03  107,0±8,3  32,0±1,2  1,7±0,02 

4  Каменка 

113±6,3  25,7±0,9  0,8±0,03  127±8,8 

25,0±1,2  1,2±0,02 

 

РШК 


32,0 

23,0 


3,0 

Топырақ құрамындағы ауыр металдардың мӛлшері жылдың кӛктем және 



күз  айында  анықталды    (1-кесте).  Қорғасын  мӛлшері  РШК-мен  (32  мг/кг)  

салыстырғанда  ең  қарқынды  ластанған  Каменка  елді  мекенінде  кӛктем 

айында 113 мг/кг мӛлшерде жоғары болды.  

 

 



1-сурет. Топырақ құрамындағы қорғасынның мӛлшері, мг/кг 

 

Мырыш  элементі  РШК-мен  салыстырғанда  зерттелген  барлық  үлгілерде 



жоғары кӛрсеткіште болды. Ал мыстың мӛлшері 20м қашықтықтан алынған 

топырақ  үлгісінде  83%  жоғары  болды.  Барлық  үлгілерде    зерттелген  ауыр 

металдардың мӛлшері жоғары екендігі байқалды.  

 

 



25,5 

47 


86,7 

113 


28,3 

59,7 


107 

127 


0

20

40



60

80

100



120

140


Бот. бақ 

Нархоз 


Шаңырақ  Каменка 

Кӛктем Pb 

Күз Pb 

18,5 


20,7 

33 


25,7 

20,7 


31,3 

32 


25 

0

5



10

15

20



25

30

35



Бот. бақ 

Нархоз 


Шаңырақ 

Каменка 


Кӛктем Zn 

Күз Zn 


На

рх

оз



 У

ни

ве



рс

ит

ет



і

258 

 

2-сурет. Топырақ құрамындағы мырштың мӛлшері, мг/кг 



 

 

3-сурет. Топырақ құрамындағы мыстың мӛлшері, мг/кг 



 

Қорытынды.  Алматы  қаласының  ластануын  тудыратын  ең  басты 

ластаушы  кӛздерге  автокӛліктердің  қозғалысын    және  қаланың  негiзгi 

экологиялық  мәселелерiнiң  бiрi  ластаушы  заттардың  эмиссиясы  болып 

табылады.  Қаладағы  экологиялық  мәселені  тӛмендету  шараларының  бірі 

толықтай    табиғи  газға  кӛшу,  экологиялық  таза  отынды  пайдалану. 

Сондықтан  бiрiншi  кезектегi  шараларға:   ТЭЦ-1  қазандық  агрегаттарына 

жаңа  эмульгаторлар  қою;   ТЭЦ-1-дегi  ескiрген  қазандық  агрегаттарын 

ауыстыру;  әртүрлi бағыныстағы қазандықтарды экологиялық талаптарға сай 

жаңа  қондырғылармен  жабдықтау; тау  бӛктерi  аймағы  қазандықтарын 

электрмен  жылытуға  кӛшiру  жоспарланған.  Сонымен  қатар  отынның  әр 

түрiмен  жұмыс  iстейтiн  қазандық  агрегаттары  мен  қазандықтарды 

қалдықтардан 

нормативтi 

тазалануын 

қамтамасыз 

ететiн 


тазалау 

қондырғыларын қолдануға баса назар аударылу керек. 

Алматы озық инженерлiк-техникалық қызметкерлерi, экологтары, 

маркетологтары,  экономистерi,  ғылыми  зертханалары,  сертификаттық 

орталығы,  озық  конверсиялық  қондырғысы,  республика  бойынша  дамыған 

инвестициялық, инновациялық, ақпараттық және бiлiм инфрақұрылымы бола 

отыра,    қаланы  кӛгалдандыру  жүйесiн  де  шектемеу  керек.  Қаланың  еркiн 

кәсiпкерлiк  мәртебесi  ынталандырушы  салықпен,  энергия    үнемдегiш 

тауарларды,  озық  технологияны  енгiзумен,  Қазақстан  бекiткен  энергия 

тиiмдiлiгi  Еуропа  Хартиясы  мен  энергия  үнемдеу  туралы  заңда 

қарастырылған  энергия  кӛздерiн  пайдалану  мен  нығайту  жұмыстарын 

жалғастыру  керек.  Қала  аумағын  экологиялық  аудандастыру  мен 

экологиялық  жол  берiлген  жүктеме  кӛлемiн  ескере  отырып,  нақты  қала 

құрылысы  саясатын  жүргiзудi  оңтайландыра  отырып,  урбаанизация 

жағдайын  ескере  отырып,  Алматы  қаласының  экологиялық  картасын  қайта 

құру  қажет  деп  санаймыз.  Сол  үшiн  Алматыға  құрылыс  салу  мен  оны  

жоспарлаудың тиiстi тәртiптерiн, стандартқа сай  экологиялық нормативтерін 

әзiрлеу қажет. 

0,5 

0,75 


1,2 

0,8 


0,5 

1,2 


1,7 

1,2 


0

0,2


0,4

0,6


0,8

1

1,2



1,4

1,6


1,8

Бот. бақ 

Нархоз 

Шаңырақ 


Каменка 

Кӛктем Cu 

Күз Cu 

На

рх



оз

 У

ни



ве

рс

ит



ет

і


259 

 



Достарыңызбен бөлісу:
1   ...   23   24   25   26   27   28   29   30   ...   42




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет