29 июля 2016 г.

Аптайм и ИБ

По мотивам вот этого слайда с PhD'16 у Владимира Иванова.
Пост в твиттере админов Яндекс маркета.Я в общем полистал, забавно там у них. Специфический юмор разработчиков.Но пост не нашёл от 4 сентября 2015. Это получается 2.7 года аптайма ну почти 3.Сколько там апдейтов то вышло уже?

Работая админом меня всегда удивлял факт присутствия какого-то ореола относительно специальности/профессии.Это типа такие особые люди.Когда я устраивался в одно место помощником админа, то там искали "высокодуховного": тут надо сеточку протянуть, тут с сотрудниками прибухнуть.В 9 утра построение на групповую физическую зарядку.Из этой же оперы.Иначе как расп.здяйством и не назвать.Мнение меняется когда вы попадаете в реальную рабочую обстановку, где каждый день как вызов, где решается и разбирается КАЖДАЯ проблема, где не уйдёшь пока не заработает или не отходит последний транспорт в сторону дома,когда ощущаешь реальную ответственность за людей у которых что-то не работает и стыд за свою некомпетентность, неправильные подходы в каких-то ситуациях потраченное время.
И это исходит не от начальства, а от работника.Подход решения КАЖДОЙ проблемы может он и не правильный, но квалификация и опыт-то откуда берутся, из воздуха что ли.Самое забавное когда попадаешь, вот из среды где админ это нечто аморфоподобное, в среду где надо соответствовать.Я почему-то вспомнил админа банка из доклада Сергея Голованова и Sonic57.

Реально из жизни, когда начальник отдела идёт и говорит и признаёт на весь офис, что у него колхоз а не отдел, не могущий решить какие-то технические проблемы.И по его же мнению не надо делать лишнего и опыта тоже набираться.Это к теме решения проблем и отношения к ним.

Последний аптайм который я видел 250 дней на гипервизоре(на самом деле 332 дня на домашнем сервере).Была часть серверов в датацентрах, ну там явно больше.Не предел в общем.И то я так глянул на гипере интереса ради, перед отключением из-за работ по электрике.Не безопасность, не прикола ради, а только чтобы подумать над тем насколько он стабильно отработал это время не падая в PSOD и любые другие проблемы.И так практически со всеми сервисами. Больше всех конечно перезагружали сервера совместной работы, они же терминалы.

Удержание аптайма в моём конкретном случае, это стабильность работы компании в целом, потому что если перезагружается что-то центральное, то за ним следует всё остальное. Рассылка в почту,звонки и приходы с просьбами подождать придержать работы ради одного конкретного человека от самого низшего до гендира. А потом начинается боль от того, что поднялось, что не поднялось и опять же рассылки, звонки.В общем технические работы на большой инфраструктуре это всегда проблема.Бизнес 24/7/365

Безопасностью здесь и не пахнет.Времени на эту самую безопасность и не оставалось почти, хотя часть мероприятий реализовывалась при первичный настройках ну и когда что-то ломали.
Вот по версии PT самая старая обнаруженная уязвимость была 10 летней давности, вроде как 2004 года.У нас практически "так же" было.Контроллеры доменов, файловые сервера, сервера баз данных, шлюзы на onsupported os...Обновления, нет не слышал.Когда в сканере безопасности видишь 500-1000 "красных записей" на своём периметре, то это нормально.

И сказанное мне в 2015 году одним из сотрудников PT:"Может вы не в том месте работаете", это ещё не самое страшное.

Но я вам тут всё тру про щепитильную тему информационной безопасности.Про качесто ИТ это вобще тихий ужас.Некоторые даже нормально рабочую станцию человеку не могут оформить, я уже не говорю про сервер или сервис.Чтобы они были поставлены грамотно и не пришлось потом сотню раз ходить к ним.Про себя я молчу, косяки за мной тоже водятся.В целом всё это домены ITIL и прочие методики.Признаться я ознакамливался и считаю их во многом правильными, но через некоторое время закрывал.Сравниваю их с общевоинскими уставами по манере изложения.

Про качество, есть пример который я вижу практически каждый день в пару местах. Инсталляции призванные отображать информацию в одной большой организации вот уже 10!!! месяцев показывают прохожим(тысячи людей в день, если не сотни) окно загрузки Grub.Жду когда можно будет отмечать юбилей этого безобразия.Опрокинуть стаканчик пенного.

В своём повествовании я совсем забыл про свич и админа. Про тот который повествуется у Владимира Иванова:

"Мне нужен самый простой свич для heartbeat.Их сеть пакеты теряет и у нас кластер разваливается.Мы поставим выделенный свич, подключим к нему ноды кластера."

Наличие качественного и правильного оборудования в ИТ это тоже проблема, а обоснование его закупки ещё большая.Бизнес он только язык  денег понимает и по человечески с ним нельзя, по крайней мере у меня так складывается.А если будешь по человечески относиться, то переработки это в зарплату входят.Проще купить себе телек за 300к в загородный дом, чем свич за 50 на работу. True story. Не надо думать, что я считаю чужие деньги.Их порой не невозможно считать в соотношении с потерями от некачественного оборудования и от отношения итак сойдёт и от своей причастности к потерям компании.Вспоминая из своей практики предложение купить нормальное управляемое оборудования, чтобы хоть как-то побороть сетевые проблемы, повысить качество, да и вобще. Ответ мне был:"Ты что ДОРАГА!"А через полгода и более, как-то невзначай, когда я уже забыл, начали что-то делать.Полгода и более траты нервов моих, сотрудников организации, времени на различные задачи и хрен знает чего ещё.Нормальная тема забивать проблемы людьми.Лучше ты будешь ходить или бегать в соседние корпуса перезагружать полудохлое, не администрируемое оборудование, чем раскошелиться и закрыть проблему.И эти люди будут вертеться очень долго лишь бы не делать одобрения покупок.

Ничего личного информационная безопасность, только высокие аптаймы.

Написал практически сразу после PhD, но решил приурочить к Дню Системного Администратора.

Комментариев нет:

Отправить комментарий