Әлеуметтік медиа: статистика Facebook деректер қорына күн сайын 500 терабайт жаңа деректер жүктелетінін көрсетеді, негізінен әлеуметтік желі серверлеріне фотомен бейнені жүктеуден, хабар алмасу, постылар астындағы түсі ніктемелер және т.б. салдарынан пайда болады.
Реактивті қозғалтқыш ұшу кезінде әрбір 30 минут сайын 10 терабайт деректерді тудырады. Күн сайын мыңдаған ұшу болғандықтан, деректер көлемі петабайтқа жетеді.
Ақпаратты тез жинақтау мен бірге деректерді талдау технологиясы да жылдам қарқын мен дамуда. Егер бірнеше жыл бұрын клиенттерді ұқсас қалаулары бар топтарға саралау ғана мүмкін болса, енді нақты уақыт режимінде әрбір клиент үшін модельдер құруға болады, мысалы, нақты тауарды іздеу Интернет желісі арқылы жүзеге асырылады және салынған үлгіге сәйкес лайықты жарнама немесе нақты ұсыныстар шығарылады. Модель сондай-ақ бірнеше жыл бұрын ойластырылған нақты уақыт режимінде реттелуі және қайта құрылуы мүмкін.
Үлкен деректер көлемі, жасалу жылдамдығы, түрленуі және өзгергіштігі бойынша ерекшеленеді. Бұл сипаттамаларды толығырақ қарастырайық.
1. Көлем. Big Data термині үлкен өлшеммен байланысты. Деректер мөлшері – қажетті нәрселерді анықтаудағы маңызды көрсеткіш. Күн сайын 6 миллион адам сандық медианы пайдаланады, бұл – алдын ала бағалау бойынша 2.5 квинтиллион байт деректер. Сондықтан назар аудартатын бірінші сипаттама – көлемі.
2. Алуан түрлілік – келесі аспект. Ол құрылымдалған және құрылымдалмаған гетерогенді көздер мен деректер табиғатына сілтеме жасайды. Бұрын электрондық кестелер мен деректер қорлары қосымшалардың көпшілігінде қарастырылатын ақпараттың жалғыз көзі болды. Қазіргі таңда электрондық хаттар, фото, бейне, PDF файлдар, аудио формасындағы деректер де аналитикалық қосымшаларда қаралады. Құрылымдалмаған деректердің осындай алуан түрлілігі сақтау, өндіру және талдау проблемаларына алып келеді: компаниялардың 27%-і лайықты деректермен жұмыс істейтініне сенімді емес.
3. Жасалу жылдамдығы.Деректердің талаптарды қанағаттандыру үшін қаншалықты тез жинақталатыны және өңделетіндігі әлеуетті анықтайды. Жылдамдық апарат көздерінен – бизнес үдерістерден, қосымшалардың логоларынан, әлеуметтік желілер мен медиа сайттарынан, сенсорлардан, мобильді құрылғылардан апарат ағынының жылдамдығын анықтайды. Деректер ағыны уақыт өте үлкен және үздіксіз болып келеді.
4. Өзгергіштік – өңдеу мен басқаруды қиындататын уақыттың кейбір сәттерінде деректердің тұрақсыздығын сипаттайды. Мысалы, деректердің басым бөлігі өз ерекшелігіне сай құрылымдалмаған.