Observability expert Jean-Michel.io

Paris (75)CDI

Salaire non précisé

Il y a 2 heuresSoyez parmi les premiers à postuler

Critères de l'offre

Métiers :
- Ingénieur de fiabilité de site (H/F)
- + 2 métiers
Expérience min :
- 11 à 20 ans
Compétences :
- Anglais
Lieux :
- Paris (75)
Conditions :
- CDI
- Salaire non précisé
- Temps Plein

Description du poste

I. Contexte :

Vous intégrerez l'équipe Global DevOps basée à Paris, sous la responsabilité du Head of DevSecOps.

Dans le cadre de notre démarche d'excellence opérationnelle et de standardisation des pratiques DevSecOps au sein du Groupe, notre département IT souhaite mettre en place et animer une Communauté de Pratique dédiée à l'observabilité et à la supervision de nos applications métiers.

En tant qu'expert Observabilité/Supervision, vous serez chargé de définir et mettre en œuvre une stratégie d'observabilité complète (monitoring, logs, alerting, tracing) afin de garantir une visibilité en temps réel sur l'état de santé, les performances et le comportement de nos applications.

Ces solutions permettront une détection proactive des incidents, un diagnostic rapide des problèmes et assureront la disponibilité de nos services critiques.

L'environnement applicatif est hybride, composé de solutions cloud (D365, Power Apps, services Azure, Data product Fabric) et d'applications hébergées on-premise sur serveurs Windows (sites web, serveurs IIS, etc.).

II. Missions :

Agir en tant que référent technique pour contribuer à la construction et à l'implémentation des composants de supervision et des pipelines d'observabilité, en appliquant les meilleures pratiques techniques.
Fournir une expertise et, si nécessaire, participer à la conception, l'intégration et le déploiement des solutions de supervision (dashboards, collecte de logs, tracing, détection d'anomalies basée sur l'IA, etc.).
Collaborer avec les équipes de développement, d'exploitation et de sécurité pour intégrer les outils et pratiques d'observabilité dans les pipelines CI/CD.
Apporter son expertise lors des incidents et des analyses de causes racines.
Identifier les besoins spécifiques de chaque équipe et définir des plans d'accompagnement.
Développer et maintenir des tableaux de bord et des rapports pour visualiser les performances applicatives.
Analyser et interpréter les métriques pour identifier les tendances et détecter les problèmes de manière proactive.
Définir la gouvernance, les règles de fonctionnement et les objectifs de la Communauté.
Mettre en place des outils collaboratifs (wiki, canaux Teams).
Organiser et animer des sessions régulières de la communauté
Favoriser les échanges inter-équipes et le partage de connaissances.
Co-construire des standards techniques et des guidelines avec les équipes.
Rédiger des guides de bonnes pratiques et de la documentation technique.
Assurer une veille active sur les technologies et pratiques d'observabilité.
Évaluer et tester de nouveaux outils du marché.
Proposer des POC et des expérimentations innovantes

Description du profil

III. Competences techniques attendues :

Vous avez acquis une expertise des concepts d'observabilite (metriques, logs, traces) :

Expertise des technologies suivantes : Azure Monitor, Grafana, App Insight
Experience averee des concepts et outils AI Ops : capacite a integrer et exploiter des solutions d'observabilite et de supervision basees sur l'IA/ML (ex. : detection automatique d'anomalies, alertes predictives, analyse intelligente des causes racines) dans des plateformes d'observabilite d'entreprise.
Bonne connaissance des principaux outils et plateformes AI Ops (ex. : Azure AI Monitor, Dynatrace, Davis AI, Moogsoft, New Relic AI, DataDog Watchdog, ou solutions similaires).
Capacite a evaluer, recommander et deployer des fonctionnalites d'observabilite pilotees par l'IA pour ameliorer l'efficacite operationnelle et la gestion proactive des incidents.
Maitrise des ecosystemes Power Platform (D365, Power Apps, Flux Power Automate)
Connaissance des plateformes de donnees basees sur Microsoft Fabric
Connaissance des environnements Windows on-premise
La connaissance d'autres solutions comme Prometheus, OpenTelemetry, ELK Stack est un plus.

Vous avez une solide experience des pratiques DevOps et SRE (Site Reliability Engineering) :

Maitrise des technologies de conteneurisation (Docker, Kubernetes)
Connaissance des pipelines CI/CD avec GitHub Actions ou AzD YAML
Experience de l'infrastructure as code (Terraform, Ansible)

IV. Soft skills :

Capacite a federer et mobiliser des equipes pluridisciplinaires
Capacite a animer des groupes de travail et a faciliter des ateliers
Excellentes competences en communication orale et ecrite
Capacite a vulgariser des concepts techniques complexes
Autonomie, proactivite et tenacite
Rigueur, methode et esprit logique
Anglais courant

Salaire et avantages

Sur requête

L'entreprise : Jean-Michel.io

ELA Technology - ESN à taille humaine fondée en 2017, basée à Paris.Nous accompagnons les grands comptes de la Banque, Assurance et Finance sur leurs projets IT stratégiques : Monétique, Paiements, Data, Infrastructure et Cybersécurité.

Voir toutes les offres de Jean-Michel.io

Référence : JM-26095-CDI

Recommandé pour vous

Paris (75)CDI Salaire non précisé Il y a 8 jours

Gennevilliers (92)CDI Salaire non précisé Il y a 13 jours

Le Kremlin-Bicêtre (94)CDI Salaire non précisé Il y a 16 jours

Trouver un emploi par ville

Emploi Boulogne-Billancourt