|
Wildberries►
WB Project DevOps
|
DevOps Engineer |
2024 — now |
Kubernetes
Terraform
Ansible
GitLab CI
OpenTelemetry
|
- GitLab CI / Безопасность: разработал кастомные IB-пайплайны — политики управления доступом, контроль разрешений и проверки безопасности для Go-микросервисов и библиотек; написал кастомный линтер для Go-микросервисов и внутренних библиотек команды.
- Мониторинг и алертинг: настроил с нуля — алерты изначально в Telegram, впоследствии мигрировал на MatterMost, критические инциденты сократились; алерты на panic в Go-сервисах с автоматическим командным уведомлением; SLO/SLI метрики для сервисов проекта — команды впервые получили реальные показатели доступности.
- Docker-образы: внедрил multi-stage builds и чёткое управление зависимостями бинарников — размер образов существенно сократился.
- Трейсинг: развернул и сконфигурировал OpenTelemetry Collector в Kubernetes-кластере; написал Go-библиотеку инструментирования и внедрил её в сервисы HRTech — трейсы экспортируются в Jaeger с поддержкой context propagation через gRPC и HTTP.
- Операционная поддержка: мониторинг работоспособности продуктов команд, выявление проблем и эскалация к ответственным (в т.ч. на сторону разработки); участие в устранении инцидентов на дежурствах и по escalation.
- Kubernetes: траблшутинг сервисов — разбор падений подов, анализ логов, диагностика сетевых проблем и проблем с ресурсами; поддержка команд разработки при инцидентах и штатных вопросах.
- Помощь с БД: помогал разработчикам с отладкой проблем на стороне БД — медленные запросы, локи, нехватка соединений; выявление узких мест и передача на решение профильным командам.
|
|
Wildberries►
WB HRTECH Infra
|
Golang Developer |
2022 — 2024 |
Go
PostgreSQL
Redis
ClickHouse
Grafana
AWS S3
|
- Сервисы и боты: разработка и поддержка сервиса Authorization (JWT-авторизация) и infra-service (бизнес-метрики SLI, роуты для вебхуков); Telegram- и MatterMost-боты для внутренних задач; интеграция с API YouTrack и MatterMost.
- Observability: внедрил метрики в микросервисы — данные поступают в Grafana с задержкой 1–5 минут; настройка дашбордов в Grafana + Thanos; перенос трейсинга с Jaeger на Grafana + ClickHouse.
- CI/CD и инфраструктура: оптимизация пайплайнов с кастомными линтерами — время деплоя сокращено до 1,5 минут; разработал библиотеку для развёртывания CronJob в Kubernetes; проектирование Gin-роутеров с UberFX.
- Данные: внедрил Redis как кэш-слой в Authorization (сессии пользователей), впоследствии полностью перевёл хранение сессий на Redis, отказавшись от PostgreSQL; разработка материализованных представлений в PostgreSQL с Job-процессами; миграция данных между S3 и WB Basket.
- Качество кода: повысил покрытие тестами с 20% до 60% (unit / e2e); участие в проектировании внутренних библиотек, code review и нагрузочных тестах.
|