Инцидент ИТ—это сбой в ИТ-инфраструктуре. Многие администраторы, разработчики и где-то даже техподдержка предпочитают не говорить про инциденты. Понятие инцидента в процессах управления ИТ может отсутствовать. Многие ИТ-шники говорят, что учёт, анализ инцидентов—это бесполезно и утомительно. Такова ИТ -реальность.
Представьте себе, что вы пришли в автосервис. Представьте себе, что с вас попросили полторы тысячи долларов за ремонт автомобиля.
—Что случилось с автомобилем?—интересуетесь вы.
—Какая вам разница? Всё равно вы ничего не понимаете,—слышите вы в ответ.
Описанная ситуация видится абсурдной, но в ИТ подобные моменты возможны. Это кажется не логичным.
Как это не странно, но бизнес, владеющий ИТ, может не знать простых вещей: сколько времени их сотрудники простаивают из-за того, что не работает что-то в компьютере, сколько сбоев было на его серверах, сколько сбоев возникает из-за устаревания средств вычислительной техники. Очень часто для бизнеса ИТ выглядит, как чёрный ящик. Такова бизнес -реальность.
Внутри ИТ, каждое подразделение является чёрным ящиком для другого подразделения, к примеру, администраторы часто не знают, как повлияло на пользователей обновление того или иного сервера, программного обеспечения, настроек и т.п.
На таких предприятиях чаще всего инциденты отсутствуют, как отдельный класс обращений пользователей; расследования серверных сбоев не ведутся или носят философский характер, они формальны, пространны и бесполезны одновременно. Это удивительно, но до сих пор во многих ИТ- компаниях не признают, что у них есть инциденты.
Knight Capital — крупная компания, которая торгует акциями. В сентябре 2012 года в их системе произошёл критический сбой: информационные системы компании приступили к самостоятельной деятельности на фондовом рынке, цены на акции стали жить своей жизнью: росли и падали без всякой логики. Дешевые акции взлетали в цене, дорогие дешевели. За короткое время было осуществлено около 1500 неправильных сделок на сумму примерно 440 миллионов долларов. В результате компания потеряла почти всю свою рыночную капитализацию за один день, что чуть не привело к её банкротству. В компании не было систематического учёта инцидентов и ошибок, что привело к тому, что команда не могла своевременно обнаружить и устранить проблему.
Многие ИТ-шники говорят, что учёт, анализ инцидентов—это бесполезно и утомительно. Может быть они говорят правду, а может быть боятся.
В ходе расследования катастрофы в Knight Capital выяснилось, что один из разработчиков, Джон Ли, обнаружил инциденты ещё до запуска обновления, но решил не сообщать о ней руководству. Он боялся, что это задержит запуск обновления, и решил «замаскировать» проблему, чтобы избежать задержек. В результате, баг остался незамеченным и был внедрён в рабочую систему.
Возможно, что ИТ -шники врут. Такова реальность подозрительности.
Спасибо, что прочитали. Удач вам в мире косяков!
Возможно, что этот сбой — афера. Такова реальность моего воображения. Мир — это совокупность множества реальностей и непонятно, какая реальность реальна.