ДЗ по минторингу
// все развертывания происходят с применением ansible там, где это возможно
* развернуть в lab'е систему мониторинга (zabbix/nagios)
* развернуть graphite.
* с помощью выбранной системы замониторить:
** базовые параметры системы (lavg, cpu usage, disk usage)
** состояние mdraid'ов (если нету - сделать простой массив и замониторить) - удобнее через /sys/block делать, чем разбирать /proc/mdstat
** bird: (наличие процесса, порты/сокеты, работу протоколов (включен, есть маршруты)
** ldap: (наличие процесса, порты/сокеты, функционирование сервиса - запрос контрольного пользователя из каталога)
** bind: (наличие процесса, порты/сокеты, функционирование сервиса - разрешение локального доменного имени размещенного на сервере, разрешение рекурсивного запроса)
** bacula - процессы, порты/сокеты, наличие "проваленных" задач у директора и наличие выполненных задач.
* поставить графит и написать скрипты(разложив их по серверам ансиблом, а еще лучше своим rpm'ом) которые будут строить графики с поминутным снятием показаний (Чтобы можно было делать через крон) и месячным архивом для:
** cpuUsage (отдельным плюсом будет разрешение точнее чем минута, но это потребует хитростей со скриптом)
** memUsage -//-
** diskUsage -//-
** netUtilization (данных из /proc/net/dev должно хватить)
** diskUtilization (тут придется подумать, т.к. по-умолчанию все каунтеры которые вы можете прочитать - с загрузки системы, а надо с предыдущего чтения).
// Формат сдачи - плейбуки для ansible, код скриптов, спеки в репозитории на github.
// Предостережение - не старайтесь делать универсальное решение которым можно решить любые задачи, решайте те задачи, которые стоят. помните - KISS && YAGNI. 

Временные затраты:
* мониторинг - примерно 2-3 часа.
* графит и скрипты - ~4 часа.
* роли для ансибла - ~1 час.