Мы российский вендор в сфере информационной безопасности. Разрабатываем решение класса VM и EASM - по сканированию на уязвимости. Сейчас мы ищем опытного Senior SRE-инженера , который поможет развивать внутреннюю платформу компании, повышать надежность сервисов, автоматизировать инфраструктуру и внедрять лучшие практики Site Reliability Engineering. Обязанности:
Эксплуатация, развитие и автоматизация Kubernetes-кластеров в production.
Поддержка и развитие платформы виртуализации и корпоративной инфраструктуры.
Обеспечение высокой доступности, производительности и надежности внутренних сервисов.
Автоматизация процессов развертывания, обновления и сопровождения инфраструктуры.
Развитие observability-платформы: мониторинг, логирование, алертинг, метрики и трассировка.
Развитие решений по резервному копированию, Disaster Recovery и обеспечению отказоустойчивости.
Внедрение и развитие Infrastructure as Code и GitOps-подходов с использованием Terraform, Ansible, Helm/Helmfile.
Участие в расследовании инцидентов, проведении postmortem и устранении причин возникновения сбоев.
Совместная работа с командами разработки над повышением надежности сервисов и развитием CI/CD-процессов.
Разработка внутренних платформенных инструментов и сервисов на Go.