Методика прагматического анализа информации состояния «облачного» сервиса в интересах организации интерфейса службы



Pdf көрінісі
бет3/8
Дата10.01.2023
өлшемі1,48 Mb.
#60825
1   2   3   4   5   6   7   8
Постановка задачи 
Рассмотрим деятельность типичного бизнес-представителя ГРИС – компании 
RingCentral – по решению задачи обнаружения и реагирования на сбои. Компания, 
предоставляющая «облачный» телекоммуникационный сервис на рынках США, Европы
и Азиатско-Тихоокеанского региона, на состояние первой половины 2021 г. вносит
в линейку своих облачных сервисов более 1 000 изменений в неделю (рис. 2). 
Рис. 2. Количество изменений в неделю в сервисе компании RingCentral
со второй половины 2015 г. по первую половину 2021 г. 
На графике отчетливо видны несколько недель каждый год в конце декабря и начале 
января, когда количество изменений существенно снижается. Это связано с праздниками
в США и Европе, когда пользователи телекоммуникационного сервиса поздравляют своих 
родственников с Рождеством – на это время компания RingCentral вводит мораторий
на внесение изменений, чтобы минимизировать риск отклонения от SLO. Основной центр 
эксплуатации компании находится в России, в Санкт-Петербург, где первая неделя января – 
это новогодние праздники, что также объясняет низкое количество изменений на этой 
неделе. 


№ 3–2021 Вестник СПб ун-та ГПС МЧС России http://vestnik.igps.ru 
186 
Труды молодых ученых 
Похожая картина наблюдается на графике количества сбоев в неделю (рис. 3).
В конце декабря и начале января наблюдается снижение количества сбоев, 
зарегистрированных в работе облачного сервиса компании RingCentral, что говорит о прямо-
пропорциональной зависимости количества сбоев от количества изменений и о том, что 
количество сбоев, вызванных изменениями, весьма существенно.
Рис. 3. Количество сбоев в неделю в сервисе компании RingCentral
со второй половины 2015 г. по первую половину 2021 г. 
При этом процедура устранения сбоя в работе ГРИС, вызванного внесенным 
изменением, заранее известна и регламентирована. В соответствии с практиками 
эксплуатации, описанными в таких стандартах, как ITIL [6] и SRE [3], каждое изменение 
содержит инструкцию по возвращению системы в исходное состояние. Таким образом, 
целесообразным является анализ информации о превышении пороговых значений
на предмет связи с одним из недавно внесенных в систему или происходящих в данный 
момент изменений. 
Методика 
Как было показано автором в работе «Integration Data Model for Continuous Service 
Delivery in Cloud Computing System» [7], в модели данных предметной области 
(эксплуатации ГРИС) изменение в системе выполняется на определенных серверах;
в то же время события системы мониторинга формируются на основании данных, также 
полученных с определенных серверов. Сопоставив сервера, на которых недавно были 
внесены изменения (рис. 4), с серверами, с которых в данный момент приходят сообщения
о превышении пороговых значений (рис. 5), можно предположить, что данный сбой вызван 
внесенным изменением. 
Рис. 4. Список серверов (hosts) из заявки на изменение 


№ 3–2021 Вестник СПб ун-та ГПС МЧС России http://vestnik.igps.ru 
187 
Труды молодых ученых 
Рис. 5. Сообщение агента системы мониторинга, содержащее указание на сервер (host),


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет