CLOUD - SRE STOCKAGE Ministère des Armées

Le Kremlin-Bicêtre (94)CDI
Il y a 1 heuresSoyez parmi les premiers à postuler

Description du poste

Notre opérateur ambitionne de devenir un acteur clé du Cloud ministériel, avec pour objectif de construire une pile cloud sûre, performante et résiliente, opérée sur l'ensemble du territoire national. À terme, cette infrastructure constituera la fondation d'un véritable opérateur cloud ministériel à l'état de l'art, capable de servir l'ensemble du numérique de défense.
Missions :
•Déployer, opérer et optimiser les clusters Ceph en production (dont multi-sites) : gestion des OSDs, MONs, MGRs ; montée de version ; gestion des incidents de cluster ;
•Concevoir et faire évoluer les architectures Ceph (CRUSH maps, profils d'erasure coding, stratégies de pooling et de tiering NVMe/SSD/HDD, dimensionnement IOPS/bande passante/résilience) ; contribuer aux choix technologiques sur l'évolution du socle de stockage distribué de la plateforme ;
•Opérer le stockage bloc en support des charges Kubernetes ou de VM ;
•Garantir l'isolation multi-tenant, le chiffrement at-rest/in-transit et la conformité aux exigences SSI sur le périmètre Ceph ;
•Déployer et opérer la stack d'observabilité Ceph (métriques cluster, PGs, OSD latency, recovery throughput, alertes, dashboards de capacité) ; conduire des tests de résilience sur le cluster (perte d'OSD, perte de rack, partition réseau, corruption silencieuse) et formaliser les RETEX ;
•Conduire l'exploitation par les SLO, budgets d'erreur et RETEX ;
•Participer à la gestion d'incidents (niveau N3/N4) et aux astreintes.

Date de début : 31/12/2025

Description du profil

Nous cherchons un SRE Ceph confirmé : 5 à 10 ans d'expérience en production sur des environnements de stockage distribué, avec une maîtrise avérée de Ceph en situation réelle.
Vous possédez de l'expérience professionnelle :
•Exploitation SRE de clusters Ceph à grande échelle : déploiement (Rook, cephadm), opération quotidienne, montée de version sans interruption de service ;
•Gestion d'incidents N3/N4, tests de résilience (perte d'OSD, de rack, corruption silencieuse) et participation aux astreintes ;
•Conception ou re-conception d'architectures Ceph : CRUSH maps, choix de profils d'erasure coding, stratégies de pooling et dimensionnement hardware adapté aux profils de charge ;
•Stockage bloc en environnement Kubernetes et/ou VM : snapshots, réplication inter-sites, gestion du backup natif Ceph ;
•Culture SRE appliquée au stockage distribué : pilotage par SLO/SLI, budgets d'erreur, RETEX structurés.
Vous disposez également des compétences techniques suivantes :
•Maîtrise avancée de Ceph (RADOS, RBD) : déploiement, tuning fin, diagnostic de performance, compréhension du protocole CRUSH ; capacité à lire et modifier des CRUSH maps, dimensionner des profils d'erasure coding (k+m, localité) et arbitrer les stratégies de pooling selon les profils de charge ;
•Maîtrise de Linux avancé (I/O scheduler, hugepages, NUMA, optimisation réseau pour trafic de réplication) et d'une stack d'observabilité Ceph (métriques OSD, PG states, recovery throughput) ;
•Maîtrise d'au moins un langage de programmation (Go, Python) et d'infrastructure-as-code (Terraform, Ansible) ;
•Compréhension approfondie des fondamentaux : réplication vs erasure coding, consensus distribué (Paxos appliqué aux MONs Ceph), théorème CAP en contexte multi-sites ;
•Très bonne connaissance sécurité : isolation multi-tenant, chiffrement at-rest/in-transit, gestion des secrets, capacité à dialoguer avec une chaîne SSI.
Vous êtes :
•Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité ;
•Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques ;
•Ancré dans une culture d'analyse factuelle et d'amélioration continue.

Salaire et avantages

Fonction Publique de l'Etat

L'entreprise : Ministère des Armées

Commissariat au Numérique de Défense (CND)
Référence : DEF_62-00065758

Recommandé pour vous

CLOUD - SRE STOCKAGE - SPECIALISATION CEPH Ministère des Armées
Le Kremlin-Bicêtre (94)CDI Il y a 1 heures
INGENIEUR INSPECTIONS TECHNIQUES CYBER SECURITE Ministère des Armées
Malakoff (92)CDI Il y a 17 jours
Administrateur·rice Outils Collaboratifs & Atlassian H/F Jean-Michel.io
Paris (75)CDI Il y a 5 jours