ДЗ по минторингу // все развертывания происходят с применением ansible там, где это возможно * развернуть в lab'е систему мониторинга (zabbix/nagios) * развернуть graphite. * с помощью выбранной системы замониторить: ** базовые параметры системы (lavg, cpu usage, disk usage) ** состояние mdraid'ов (если нету - сделать простой массив и замониторить) - удобнее через /sys/block делать, чем разбирать /proc/mdstat ** bird: (наличие процесса, порты/сокеты, работу протоколов (включен, есть маршруты) ** ldap: (наличие процесса, порты/сокеты, функционирование сервиса - запрос контрольного пользователя из каталога) ** bind: (наличие процесса, порты/сокеты, функционирование сервиса - разрешение локального доменного имени размещенного на сервере, разрешение рекурсивного запроса) ** bacula - процессы, порты/сокеты, наличие "проваленных" задач у директора и наличие выполненных задач. * поставить графит и написать скрипты(разложив их по серверам ансиблом, а еще лучше своим rpm'ом) которые будут строить графики с поминутным снятием показаний (Чтобы можно было делать через крон) и месячным архивом для: ** cpuUsage (отдельным плюсом будет разрешение точнее чем минута, но это потребует хитростей со скриптом) ** memUsage -//- ** diskUsage -//- ** netUtilization (данных из /proc/net/dev должно хватить) ** diskUtilization (тут придется подумать, т.к. по-умолчанию все каунтеры которые вы можете прочитать - с загрузки системы, а надо с предыдущего чтения). // Формат сдачи - плейбуки для ansible, код скриптов, спеки в репозитории на github. // Предостережение - не старайтесь делать универсальное решение которым можно решить любые задачи, решайте те задачи, которые стоят. помните - KISS && YAGNI. Временные затраты: * мониторинг - примерно 2-3 часа. * графит и скрипты - ~4 часа. * роли для ансибла - ~1 час.