В компанию-проваи?дер интернет-платежеи? для любого типа бизнеса, ищем Site reliability engineer.
Задачи:
- Развитие production и pre-production инфраструктуры компании. Поддержание в актуальном состоянии систем и компонентов, ввод в эксплуатацию новых. R&D на предмет более оптимальных решений.
- Работа над улучшением observability системы на уровне железа, сети, компонентов инфраструктуры и самого приложения. Построение и поддержка системы мониторинга (метрики, логи, трассировка запросов и т.д.) и реакции на production инциденты.
- Разработка инструментария для автоматизации рутинных процессов, связанных с обслуживанием системы, подготовкой и поставкой новых релизов.
- Проактивная работа над моделированием потенциальных угроз и прорабатыванием сценариев работы с ними: disaster recovery plan, уменьшение blast radius и т.д.
- Работа над повышением надёжности и отказоустойчивости системы, в т.ч. и с помощью практик вроде chaos engineering.
- Совместная работа с продуктовой и инженерными командами на разных этапах SDLC по формализации и соблюдению SLA/SLO.
Требования:
- Знакомство с элементами нашего технологического стека: k8s on-premise (kubespray), PostgreSQL (+patroni), MySQL, RabbitMQ, Clickhouse.
- Продолжительный опыт оперирования сложных распределённых систем в production со схожими задачами и на похожем технологическом стеке.
- Опыт работы с системами управления конфигурациями (Ansible/Puppet/Chef/Saltstack/etc).
- Хорошее знание Linux (Ubuntu, CentOS/Rocky), понимание контейнеризации.
- Ответственность и нацеленность на командный результат, настойчивость в решении сложных задач.
Будет хорошим плюсом:
- Широкий технический кругозор. Опыт разработки на одном или нескольких современных языках программирования.
- Опыт работы в сфере финансов или в других областях, где безопасность и целостность данных являются ключевыми требованиями.
- Хороший уровень самоорганизации, управления собственным временем и рабочей загрузкой.
Условия:
- Интересные задачи.
- Официальное трудоустройство.
- Соц. пакет (отпуск 26 КД, 5 sick days, мед страховка (после прохождения испытательного срока)).
- Возможность гибридного формата работы (после успешного прохождения испытательного срока).