Critères de l'offre
Métiers :
- Backend Lead (H/F)
Expérience min :
- 3 à 20 ans
Secteur :
- Fonction publique
Compétences :
- Openstack
- Apache Cassandra
- Linux unix
- Python
- Kubernetes
- + 1 compétence
Lieux :
- Le Kremlin-Bicêtre (94)
Conditions :
- CDI
- Temps Plein
Description du poste
En tant que Lead SRE Compute & Orchestration, vous concevez, déployez et opérez l'ensemble de la stack compute. Vos missions incluent :
•Provisionnement & inventaire : mettre en œuvre l'automatisation complète (e.g., Tinkerbell, MAAS, Ironic, Netbox ou équivalents) ;
•Firmware & BMC : maîtriser, durcir et automatiser la couche firmware ;
•OS & Images : produire et déployer les images OS durcies ;
•Virtualisation : implémenter et exploiter la couche de virtualisation (OpenStack, Incus, KubeVirt ou équivalent) en garantissant isolation et résilience ;
•Kubernetes : opérer les clusters (control plane, workers, etcd) et assurer leur reconstruction rapide ainsi que la résilience multi-sites ;
•Reproductibilité : garantir des builds et déploiements déterministes, versionnés, auditables ;
•Sécurité : implémenter le durcissement à toutes les couches (firmware, OS, runtime) et contribuer à la chaîne de confiance boot-to-workload ;
•Documentation : rédiger les procédures d'exploitation et la documentation technique ;
•Pilotage : conduire l'exploitation par les SLO, error budgets et RETEX ;
•Équipe : encadrer techniquement les ingénieurs ; contribuer au recrutement et à la montée en compétences.
Date de début : 31/12/2025
Description du profil
Nous cherchons un expert infrastructure compute confirmé (10+ ans d'expérience en production), capable de concevoir et opérer les couches basses d'une plateforme critique, avec une approche SRE et une sensibilité sécurité.
Vous possédez de l'expérience professionnelle :
•Exploitation en production, en mode SRE, de plateforme d'hébergement à grande échelle : gestion d'incidents, astreintes, pilotage par SLO/SLI ;
•Maîtrise opérationnelle d'au moins une solution d'orchestration de compute en production :
◦Soit virtualisation : OpenStack, Incus ou équivalent avec gestion multi-cluster, isolation et résilience ;
◦Soit Kubernetes : déploiement et exploitation de clusters multi-sites avec leur gestion centralisée (Rancher ou équivalent) ;
•Provisionnement bare metal à grande échelle ;
•Culture SRE : automatisation, observabilité, RETEX et amélioration continue.
Vous disposez également des compétences techniques suivantes :
•Expertise pointue attendue sur l'un des deux domaines (VM ou Kubernetes), le second étant couvert par un recrutement complémentaire ;
•Maîtrise fonctionnement Linux et expérience des OS immutables ou durcis ;
•Expertise d'un OS déclaratif ou et d'un langage d'infrastructure as code (Terraform, Ansible, Helm) ;
•Maîtrise d'au moins un langage de programmation (Go ou Python) : être capable d'implémenter des routines d'orchestration (contrôleurs) ;
•Très bonne connaissance des questions de sécurité et de durcissement (firmware, OS, runtime), capacité à dialoguer avec une chaîne SSI.
Vous êtes :
•Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité.
•Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques
•Ancreé dans une culture d'analyse factuelle et d'amélioration continue ;
Atouts appréciés :
•Expérience d'environnements multi-sites / multi-régions ;
•Expérience avec des environnements air-gapped ;
•Connaissance de SecNumCloud et IGI 1300 ;
•Contributions open source.
Salaire et avantages
L'entreprise : Ministère des Armées
Recommandé pour vous



