Знаете это паршивое чувство, когда вы спокойно пьете утренний кофе, заходите проверить логи или открыть свой сайт, а там вас встречает ледяная пустота и ошибка таймаута? А потом вы открываете личные сообщения и видите, что проект лежит уже три часа, и пользователи любезно или не очень вам об этом сообщают. Ситуация — классика. Особенно если вы арендуете железо у провайдеров, у которых магистрали штормит по расписанию, или балуетесь агрессивным тюнингом системы.
Админ должен узнавать о падении своего сервера первым. Не от пользователей, не от техподдержки хостинга, а от автоматики. Но что делать, если разворачивать корпоративного монстра вроде Zabbix или Prometheus + Grafana ради пары выделенных серверов и десятка сайтов — это откровенный оверкилл? Зачем тратить гигабайты оперативки на метрики, если вам нужно ответить на один простой вопрос: Оно вообще работает?
Именно поэтому я написал и запустил новый сервис — легковесный, быстрый и абсолютно безжалостный к даун-таймам Telegram-бот: @phoenix901mbot. В этой статье я вскрою его подкапотное пространство и расскажу, как пара сотен строк грамотного асинхронного Python-кода заменяют тяжеловесные системы мониторинга.
