№ 3–2021 Вестник СПб ун-та ГПС МЧС России http://vestnik.igps.ru
186
Труды молодых ученых
Похожая картина наблюдается на графике количества сбоев в неделю (рис. 3).
В
конце декабря и начале января наблюдается снижение количества сбоев,
зарегистрированных в работе облачного сервиса компании RingCentral, что говорит о прямо-
пропорциональной зависимости количества сбоев от количества изменений и о том, что
количество сбоев, вызванных изменениями, весьма существенно.
Рис. 3.
Количество сбоев в неделю в сервисе компании RingCentral
со второй половины 2015 г. по первую половину 2021 г.
При этом процедура устранения сбоя в работе ГРИС, вызванного внесенным
изменением, заранее известна и регламентирована. В
соответствии с практиками
эксплуатации, описанными в таких стандартах, как ITIL [6] и SRE [3], каждое изменение
содержит инструкцию по возвращению системы в
исходное состояние. Таким образом,
целесообразным является анализ информации о превышении пороговых значений
на предмет связи с
одним из недавно внесенных в систему или происходящих в данный
момент изменений.
Методика
Как было показано автором в работе «Integration Data Model for Continuous Service
Delivery in Cloud Computing System» [7], в
модели данных предметной области
(эксплуатации ГРИС) изменение в системе выполняется на определенных серверах;
в то
же время события системы мониторинга формируются на основании данных, также
полученных с определенных серверов. Сопоставив сервера, на которых недавно были
внесены изменения (рис. 4), с серверами, с которых в данный момент приходят сообщения
о превышении пороговых значений (рис. 5), можно предположить, что данный сбой вызван
внесенным изменением.
Рис. 4.
Список серверов (hosts) из заявки на изменение
№ 3–2021 Вестник СПб ун-та ГПС МЧС России http://vestnik.igps.ru
187
Труды молодых ученых
Рис. 5.
Сообщение агента системы мониторинга, содержащее указание на сервер (host),
Достарыңызбен бөлісу: