Заголовок
Выполнять администрирование и сопровождение серверной инфраструктуры и веб-приложений
Компонента
Администрирование
Текст
Выполнять работы по администрированию и сопровождению Linux-инфраструктуры (Debian), веб-серверов Nginx, приложений на PHP/Python/Go, баз данных MySQL/PostgreSQL, Redis и Memcached. * Обновлять операционную систему, серверное и прикладное программное обеспечение, обеспечивать актуальность конфигураций и контроль безопасности инфраструктуры. * Управлять учетными записями, правами доступа, сетевыми политиками и настройками серверов. * Обеспечивать резервное копирование данных, баз данных и конфигураций во внешние S3-совместимые хранилища, контролировать успешность создания резервных копий и возможность восстановления данных. * Обеспечивать сбор, хранение и анализ журналов работы приложений и инфраструктуры в Graylog, включая error logs, slow logs и аудит событий. * Обеспечивать мониторинг инфраструктуры и приложений средствами Checkmk, включая контроль доступности серверов и сервисов, использования CPU, RAM, дисковой и сетевой подсистем, SSL/TLS-сертификатов, процессов, файловых систем, баз данных, Redis, Memcached, cron-задач, очередей и фоновых сервисов. * Контролировать производительность и нагрузку на MySQL/PostgreSQL, выявлять узкие места и предотвращать деградацию сервисов. * Настраивать и сопровождать процессы CI/CD на базе GitLab CI/CD, автоматизировать сборку, тестирование и развертывание приложений. * Настраивать и сопровождать контейнерную инфраструктуру Docker и Docker Compose. * Поддерживать и развивать инфраструктуру как код с использованием Ansible и Terraform. * Управлять DNS-записями, доменами и SSL/TLS-сертификатами, обеспечивать автоматическое продление сертификатов Let's Encrypt. * Контролировать сроки действия сертификатов, доменов, лицензий и иных инфраструктурных компонентов. * Настраивать и сопровождать механизмы отправки электронной почты через внешние SMTP-сервисы, обеспечивать корректность настроек DKIM, SPF и DMARC. * Обеспечивать информационную безопасность инфраструктуры, включая настройку firewall, fail2ban, антивирусной защиты, ограничение доступа к сервисам, контроль уязвимостей и защиту от DDoS-атак. * Оптимизировать производительность приложений, веб-серверов, баз данных, кэширующих систем и очередей обработки данных. * Обеспечивать отказоустойчивость сервисов, разрабатывать и поддерживать процедуры аварийного восстановления (Disaster Recovery). * Взаимодействовать с хостинг-провайдерами, облачными платформами и сторонними поставщиками сервисов по вопросам предоставления услуг, изменения конфигурации ресурсов и устранения инцидентов, влияющих на работоспособность информационных систем. * Проводить диагностику и устранение инцидентов, выполнять профилактические работы, анализировать причины сбоев и принимать меры по предотвращению их повторного возникновения. * Обеспечивать стабильную, безопасную и бесперебойную работу информационных систем и сервисов проекта.