Ingénieur(e) Admin. Système HPC - N3 F/H Recruteur partenaire

Paris (75)CDITélétravail total
40 000 € - 60 000 € par an
Il y a 1 heures sur le WebSoyez parmi les premiers à postuler

Description du poste

Contexte du poste

Dans le cadre d'un projet de modernisation d'infrastructure HPC critique, nous recherchons un(e) Ingénieur(e) Systèmes HPC de niveau expert pour piloter des activités techniques à forte valeur ajoutée : architecture, optimisation avancée, intégration de nouveaux composants matériels et logiciels, et transfert de compétences.

Le profil exercera en pleine autonomie, en lien étroit avec l'équipe d'exploitation et les équipes scientifiques du client.

Missions principales

- Référent technique de niveau 3 sur l'ensemble de la stack HPC (ordonnancement, stockage parallèle, réseaux, sécurité)

- Conception et implémentation d'architectures HPC et de stockage haute performance pour répondre aux besoins scientifiques

- Optimisation avancée des systèmes de fichiers parallèles (Lustre, GPFS) : tuning fin, diagnostics de performance I/O, gestion de la résilience

- Expertise sur les interconnexions InfiniBand (HDR/NDR) : configuration UCX, diagnostics fabric, intégration MPI

- Pilotage des enjeux GPU : intégration d'accélérateurs (AMD/NVIDIA), configuration des drivers et des stacks ROCm/CUDA

- Conseil et support N3 aux équipes internes et aux utilisateurs scientifiques sur l'optimisation d'applications (profiling, portaging, scaling MPI)

- Définition et mise en œuvre de la politique de sécurité des systèmes HPC (hardening, gestion des accès, audit de conformité)

- Automatisation avancée et Infrastructure as Code (Ansible, Terraform, CI/CD HPC)

- Veille technologique, évaluation de nouvelles solutions, rédaction de documents d'architecture et de recommandations

- Encadrement technique des profils N2 de l'équipe

Environnement technique

Architecture & systèmes

- Linux expert (RHEL/Rocky, architecture kernel, tuning OS à grande échelle)

- Maîtrise avancée d'Ansible ; connaissance de Terraform ou outils IaC équivalents

- Scripting avancé : Python (bibliothèques système, APIs), Bash

- Conteneurisation HPC : Singularity/Apptainer, Podman ; connaissance de Kubernetes appréciée

HPC - expertise avancée

- Slurm : architecture multi-cluster, federation, Burst Buffer, accounting avancé

- Systèmes de fichiers parallèles : Lustre (MDT/OST, tunables kernel), GPFS/Spectrum Scale (architecture NSDs, AFM)

- Réseaux : InfiniBand HDR/NDR, OpenSM, diagnostics avec ibdiagnet ; UCX/RDMA

- Interconnexion MPI : OMPI/MPICH, WI4MPI (portabilité MPI), optimisation collective

- Accélérateurs GPU : intégration AMD MI200/MI300 (ROCm), NVIDIA (CUDA), profiling matériel

Sécurité & conformité

- Sécurité SI sensible : conception et application de politiques de sécurité en environnement réglementé

- Gestion des identités et des accès : LDAP, Kerberos, PAM

- Audit et conformité : outils SCAP, gestion des CVE, durcissement système


Profil recherché

  • Formation supérieure en informatique ou systèmes (Bac+5, ingénieur ou équivalent)

  • 7 ans et plus d'expérience en systèmes, dont au minimum 4 ans en environnement HPC de production à grande échelle

  • Expérience confirmée en environnement réglementé ou hautement sécurisé (défense, nucléaire, espace, ou équivalent)

  • Capacité à exercer en pleine autonomie, à distance, avec des interlocuteurs techniques et scientifiques de haut niveau

  • Excellentes capacités rédactionnelles (documentation d'architecture, procédures, rapports d'incident)

  • Leadership technique naturel, capacité à structurer et transmettre une expertise

  • Maîtrise du français (langue de travail) ; anglais technique courant (lu, écrit, oral)

Rythme de présence

Full remote - déplacements ponctuels sur site si nécessaire (frais remboursés)

Astreintes

Participation occasionnelle aux astreintes de niveau 3 (faible fréquence)


Alliance Services Plus (AS+) est un acteur de référence du calcul haute performance (HPC) en France depuis plus de 15 ans. Filiale du groupe GECI, AS+ s'est imposée comme le spécialiste reconnu, au cœur des environnements HPC les plus critiques. Implantée entre autres sur le campus Teratec, l'entreprise intervient directement au sein des plus grands centres de calcul français, là où se jouent les enjeux technologiques de demain.

En forte croissance, AS+ opère principalement au forfait avec une exigence élevée de performance et de résultats. Ses consultants interviennent directement au cœur des infrastructures et clusters HPC de ses clients, sur des missions à forte valeur ajoutée en infrastructure, développement et support applicatif. Rejoindre AS+, c'est contribuer à des projets stratégiques pour des acteurs majeurs de la recherche, de l'énergie et de l'industrie, tels que le CEA, le CNRS, TotalEnergies ou Michelin, ...

Mais AS+, c'est avant tout un collectif d'experts HPC animé par une culture claire et assumée : "aller plus vite, aller plus loin". Plus vite dans la compréhension des enjeux, la prise en main des environnements et l'exécution. Plus loin dans l'expertise, l'innovation et la qualité des solutions apportées. Cette philosophie se traduit au quotidien par une forte exigence technique, un haut niveau d'autonomie et une responsabilité réelle confiée à chaque consultant.

Intégrer AS+, c'est rejoindre une entreprise qui valorise l'excellence, le partage d'expertise et la progression continue. Un environnement où l'on est challengé, soutenu et reconnu, et où chacun construit une carrière HPC solide, ambitieuse et durable.


Référence : 178599389W

Recommandé pour vous

Ingénieur DevOps expérimenté H/F Jean-Michel.io
Paris (75)CDI Il y a 13 jours
Ingénieur sécurité cloud H/F Jean-Michel.io
Paris (75)CDI Il y a 13 jours
Sales Ops/Revops Le Mercato de l'Emploi
Paris (75)CDI 35 000 € - 45 000 € par an Il y a 5 jours