Critères de l'offre
Métiers :
- Site Reliability Engineer (H/F)
Secteur :
- Recrutement et placement
Lieux :
- Isère (38)
Conditions :
- CDI
- Temps Plein
Description du poste
HPC & AI Eviden est le leader du marché en Europe dans les segments des serveurs et des superordinateurs, reconnu pour ses innovations en intelligence artificielle, cybersécurité et quantique. Nos clients utilisent nos ordinateurs haute performance (HPC) pour des projets cruciaux tels que l'étude du changement climatique, la recherche de vaccins, la décarbonisation et les simulations scientifiques.
L'équipe Software Factory, au cœur de la division R&D HPC & AI, est responsable du développement et de l'exploitation (DevOps) d'une pile complète d'intégration et de livraison continues (CI/CD) pour les équipes de développement logiciel en charge des produits HPC et AI. Actuellement, notre plateforme gère plus de 500 builds par semaine sur une infrastructure hybride, combinant cloud public et laboratoire interne, garantissant une production logicielle entièrement automatisée. Nous recherchons un Site Reliability Engineer, qui jouera un rôle clé dans la gestion et l'optimisation de notre infrastructure.
Vos missions :
- Assurer la surveillance des systèmes et garantir le bon fonctionnement de l'infrastructure du laboratoire et des clusters HPC & AI ;
- Installer, mettre à jour et configurer les logiciels, firmwares et matériels ;
- Faire évoluer les architectures système et infrastructure pour intégrer de nouveaux matériels ;
- Maintenir une infrastructure de développement internationale à la pointe de la technologie ;
- Améliorer le SLA de la plateforme.
Recommandé pour vous


