Решение проблем — навигация¶
Найди проблему по симптому → перейди к решению.
По симптому¶
| Симптом | Страница | Критичность |
|---|---|---|
| Клиенты не подключаются массово | VPN сервер не работает | P0 |
| API таймаутит / 502 / 503 | Backend ошибки | P0 |
| Все пользователи разлогинились | Runbooks → Redis | P0 |
| Админпанель не открывается | Админпанель не загружается | P1 |
| Grafana показывает сервер DOWN | Сервер DOWN в Grafana | P1 |
| Трафик не считается | Трафик не считается | P2 |
| Worker unhealthy / sync стоит | Worker unhealthy | P1 |
| MySQL не отвечает / too many connections | MySQL проблемы | P1 |
| WL proxy не работает | WL proxy | P1 |
| Reality Scanner не проходит | Reality Scanner | P2 |
По компоненту¶
Backend (10.99.87.249)¶
- Backend 502 / 503 — контейнер упал, OOM, деплой сломался
- Runbooks → API недоступен
VPN Config Service (10.99.87.249:8000)¶
- Worker unhealthy — sync зависает, SSH pool, restart
- Трафик не считается — traffic pipeline
MySQL (10.99.87.62)¶
- MySQL проблемы — connections, slow queries, lock waits
- Runbooks → Too many connections
VPN серверы¶
- VPN сервер не работает — xray, docker, порты
- WL proxy не работает — nftables, upstream
Мониторинг (10.99.87.5)¶
- Сервер DOWN в Grafana — ложные алерты vs реальные
Эскалация¶
Если стандартные шаги не помогли:
- Собрать информацию: логи, скриншоты, время начала проблемы
- Написать в рабочий чат с тегом ответственного
- L2 → L3: любая проблема, не решённая за 30 минут
- L3 → DevOps Lead (zardes): P0 инциденты, потеря данных, безопасность