Analyste qualité des données (H/F) BIOPTIMUS
Paris (75)CDI
Il y a 3 jours sur le WebSoyez parmi les premiers à postuler
Critères de l'offre
Métiers :
- Analyste de données (H/F)
- + 2 métiers
Expérience min :
- 3 à 5 ans
Secteur :
- ESN, Editeurs de logiciel, Services informatiques
Diplômes :
- Bac+5
- + 1 diplôme
Compétences :
- Anglais
- analyse de données
- Cloud
- Pathologie
- Python
- + 3 compétences
Lieux :
- Paris (75)
Conditions :
- CDI
- Temps Plein
- Aucun déplacement à prévoir
Description du poste
En tant qu'Ingénieur(e) en Qualité des Données Biologiques, vous serez responsable des tâches suivantes :
- Développement de pipelines de validation des données : Développer et mettre en œuvre des protocoles complets de validation des données pour divers ensembles de données biologiques (histologie, omiques, cliniques). Assurer l'intégrité, la cohérence et l'exactitude des données grâce à des contrôles de qualité rigoureux. Concevoir et implémenter des pipelines automatisés de qualité des données pour rationaliser la validation et identifier les problèmes potentiels en amont du processus de traitement.
- Curation et standardisation des données : Établir et appliquer des pratiques de standardisation des données pour faciliter l'intégration et l'analyse fluides entre différents types de données. Curer les jeux de données pour améliorer leur exploitabilité pour l'apprentissage automatique.
- Documentation et reporting : Maintenir une documentation détaillée des procédures d'évaluation de la qualité des données, des résultats de validation et des spécifications des données. Générer des rapports réguliers sur les métriques et les tendances de la qualité des données.
- Évaluation des sources de données : Évaluer et valider les sources de données publiques externes, en s'assurant qu'elles respectent nos normes de qualité et qu'elles sont adaptées pour être incluses dans l'entraînement de notre modèle de fondation.
Votre profil
Le/La candidat(e) idéal(e) aura un esprit d'équipe, sera autonome, curieux(se) et rigoureux(se). Vous vous épanouissez dans un environnement dynamique et rapide, et vous êtes une personne avec qui il est agréable de travailler. Nous valorisons les personnes qui possèdent une solide expertise du domaine de la biologie ainsi que de solides compétences informatiques et pratiques.
- Expertise des données omiques : Compréhension approfondie des types de données transcriptomiques (bulk, single-cell, spatiale) et de leurs considérations de qualité spécifiques. Bonne connaissance des données génomiques et protéomiques.
- Gestion de la qualité des données : Expérience avérée dans la mise en œuvre de procédures et de pipelines de contrôle de la qualité des données. Familiarité avec les outils et techniques de validation des données.
- Compétences analytiques : Solides compétences analytiques et de résolution de problèmes pour identifier et résoudre les problèmes de qualité des données.
- Programmation et analyse de données : Maîtrise de Python, bonne connaissance des bibliothèques de visualisation de données (par ex. matplotlib).
- Compétences en communication : Excellentes compétences en communication écrite et orale pour transmettre efficacement les résultats et les recommandations concernant la qualité des données.
- Expertise en pathologie computationnelle : Expérience dans l'analyse par machine learning d'images histologiques.
- Expertise Cloud : Expérience de travail avec AWS, en particulier Sagemaker.
- Expérience en annotation de données : Expérience dans le développement et la mise en œuvre de directives et de processus d'annotation de données. Expérience avec les ontologies de données.
- Alignement spatial de jeux de données multimodaux (par ex. alignement entre différentes modalités d'imagerie).
- Formation : Master 2 (MSc) en Biologie, Biologie Computationnelle ou Bio-informatique.
- Langues : La maîtrise de l'anglais est obligatoire - l'anglais est la langue de travail principale de Bioptimus.
- Développement de pipelines de validation des données : Développer et mettre en œuvre des protocoles complets de validation des données pour divers ensembles de données biologiques (histologie, omiques, cliniques). Assurer l'intégrité, la cohérence et l'exactitude des données grâce à des contrôles de qualité rigoureux. Concevoir et implémenter des pipelines automatisés de qualité des données pour rationaliser la validation et identifier les problèmes potentiels en amont du processus de traitement.
- Curation et standardisation des données : Établir et appliquer des pratiques de standardisation des données pour faciliter l'intégration et l'analyse fluides entre différents types de données. Curer les jeux de données pour améliorer leur exploitabilité pour l'apprentissage automatique.
- Documentation et reporting : Maintenir une documentation détaillée des procédures d'évaluation de la qualité des données, des résultats de validation et des spécifications des données. Générer des rapports réguliers sur les métriques et les tendances de la qualité des données.
- Évaluation des sources de données : Évaluer et valider les sources de données publiques externes, en s'assurant qu'elles respectent nos normes de qualité et qu'elles sont adaptées pour être incluses dans l'entraînement de notre modèle de fondation.
Votre profil
Le/La candidat(e) idéal(e) aura un esprit d'équipe, sera autonome, curieux(se) et rigoureux(se). Vous vous épanouissez dans un environnement dynamique et rapide, et vous êtes une personne avec qui il est agréable de travailler. Nous valorisons les personnes qui possèdent une solide expertise du domaine de la biologie ainsi que de solides compétences informatiques et pratiques.
- Expertise des données omiques : Compréhension approfondie des types de données transcriptomiques (bulk, single-cell, spatiale) et de leurs considérations de qualité spécifiques. Bonne connaissance des données génomiques et protéomiques.
- Gestion de la qualité des données : Expérience avérée dans la mise en œuvre de procédures et de pipelines de contrôle de la qualité des données. Familiarité avec les outils et techniques de validation des données.
- Compétences analytiques : Solides compétences analytiques et de résolution de problèmes pour identifier et résoudre les problèmes de qualité des données.
- Programmation et analyse de données : Maîtrise de Python, bonne connaissance des bibliothèques de visualisation de données (par ex. matplotlib).
- Compétences en communication : Excellentes compétences en communication écrite et orale pour transmettre efficacement les résultats et les recommandations concernant la qualité des données.
- Expertise en pathologie computationnelle : Expérience dans l'analyse par machine learning d'images histologiques.
- Expertise Cloud : Expérience de travail avec AWS, en particulier Sagemaker.
- Expérience en annotation de données : Expérience dans le développement et la mise en œuvre de directives et de processus d'annotation de données. Expérience avec les ontologies de données.
- Alignement spatial de jeux de données multimodaux (par ex. alignement entre différentes modalités d'imagerie).
- Formation : Master 2 (MSc) en Biologie, Biologie Computationnelle ou Bio-informatique.
- Langues : La maîtrise de l'anglais est obligatoire - l'anglais est la langue de travail principale de Bioptimus.
Référence : 198LPGQ
Recommandé pour vous

Paris (75)CDI 45 000 € - 48 000 € par an Il y a 3 jours

Paris (75)CDI 60 000 € - 75 000 € par an Il y a 13 jours

Paris (75)CDI Il y a 5 jours