Observability expert Jean-Michel.io

Paris (75)CDI
Salaire non précisé
Il y a 2 heuresSoyez parmi les premiers à postuler

Description du poste

I. Contexte :

Vous intégrerez l'équipe Global DevOps basée à Paris, sous la responsabilité du Head of DevSecOps.

Dans le cadre de notre démarche d'excellence opérationnelle et de standardisation des pratiques DevSecOps au sein du Groupe, notre département IT souhaite mettre en place et animer une Communauté de Pratique dédiée à l'observabilité et à la supervision de nos applications métiers.

En tant qu'expert Observabilité/Supervision, vous serez chargé de définir et mettre en œuvre une stratégie d'observabilité complète (monitoring, logs, alerting, tracing) afin de garantir une visibilité en temps réel sur l'état de santé, les performances et le comportement de nos applications.

Ces solutions permettront une détection proactive des incidents, un diagnostic rapide des problèmes et assureront la disponibilité de nos services critiques.

L'environnement applicatif est hybride, composé de solutions cloud (D365, Power Apps, services Azure, Data product Fabric) et d'applications hébergées on-premise sur serveurs Windows (sites web, serveurs IIS, etc.).

II. Missions :

  • Agir en tant que référent technique pour contribuer à la construction et à l'implémentation des composants de supervision et des pipelines d'observabilité, en appliquant les meilleures pratiques techniques.
  • Fournir une expertise et, si nécessaire, participer à la conception, l'intégration et le déploiement des solutions de supervision (dashboards, collecte de logs, tracing, détection d'anomalies basée sur l'IA, etc.).
  • Collaborer avec les équipes de développement, d'exploitation et de sécurité pour intégrer les outils et pratiques d'observabilité dans les pipelines CI/CD.
  • Apporter son expertise lors des incidents et des analyses de causes racines.
  • Identifier les besoins spécifiques de chaque équipe et définir des plans d'accompagnement.
  • Développer et maintenir des tableaux de bord et des rapports pour visualiser les performances applicatives.
  • Analyser et interpréter les métriques pour identifier les tendances et détecter les problèmes de manière proactive.
  • Définir la gouvernance, les règles de fonctionnement et les objectifs de la Communauté.
  • Mettre en place des outils collaboratifs (wiki, canaux Teams).
  • Organiser et animer des sessions régulières de la communauté
  • Favoriser les échanges inter-équipes et le partage de connaissances.
  • Co-construire des standards techniques et des guidelines avec les équipes.
  • Rédiger des guides de bonnes pratiques et de la documentation technique.
  • Assurer une veille active sur les technologies et pratiques d'observabilité.
  • Évaluer et tester de nouveaux outils du marché.
  • Proposer des POC et des expérimentations innovantes

Description du profil

III. Competences techniques attendues :

Vous avez acquis une expertise des concepts d'observabilite (metriques, logs, traces) :

  • Expertise des technologies suivantes : Azure Monitor, Grafana, App Insight
  • Experience averee des concepts et outils AI Ops : capacite a integrer et exploiter des solutions d'observabilite et de supervision basees sur l'IA/ML (ex. : detection automatique d'anomalies, alertes predictives, analyse intelligente des causes racines) dans des plateformes d'observabilite d'entreprise.
  • Bonne connaissance des principaux outils et plateformes AI Ops (ex. : Azure AI Monitor, Dynatrace, Davis AI, Moogsoft, New Relic AI, DataDog Watchdog, ou solutions similaires).
  • Capacite a evaluer, recommander et deployer des fonctionnalites d'observabilite pilotees par l'IA pour ameliorer l'efficacite operationnelle et la gestion proactive des incidents.
  • Maitrise des ecosystemes Power Platform (D365, Power Apps, Flux Power Automate)
  • Connaissance des plateformes de donnees basees sur Microsoft Fabric
  • Connaissance des environnements Windows on-premise
  • La connaissance d'autres solutions comme Prometheus, OpenTelemetry, ELK Stack est un plus.

Vous avez une solide experience des pratiques DevOps et SRE (Site Reliability Engineering) :

  • Maitrise des technologies de conteneurisation (Docker, Kubernetes)
  • Connaissance des pipelines CI/CD avec GitHub Actions ou AzD YAML
  • Experience de l'infrastructure as code (Terraform, Ansible)

IV. Soft skills :

  • Capacite a federer et mobiliser des equipes pluridisciplinaires
  • Capacite a animer des groupes de travail et a faciliter des ateliers
  • Excellentes competences en communication orale et ecrite
  • Capacite a vulgariser des concepts techniques complexes
  • Autonomie, proactivite et tenacite
  • Rigueur, methode et esprit logique
  • Anglais courant

Salaire et avantages

Sur requête

L'entreprise : Jean-Michel.io

ELA Technology - ESN à taille humaine fondée en 2017, basée à Paris.Nous accompagnons les grands comptes de la Banque, Assurance et Finance sur leurs projets IT stratégiques : Monétique, Paiements, Data, Infrastructure et Cybersécurité.
Référence : JM-26095-CDI

Recommandé pour vous

ESTREEM - Site Reliability Engineer H/F BNP PARIBAS
Paris (75)CDI Salaire non précisé Il y a 8 jours
Engineering WorkPackage Manager Modem - F/H THALES
Gennevilliers (92)CDI Salaire non précisé Il y a 13 jours
CLOUD - SRE DATA SERVICES Ministère des Armées
Le Kremlin-Bicêtre (94)CDI Salaire non précisé Il y a 16 jours