Apprentissage ingénieur (H/F) de 3 ans sur le volet modélisation des données du métier de 'data scientist' CNRS

Toulouse (31)Alternance / Apprentissage
Salaire non précisé
Il y a 3 heures sur le WebSoyez parmi les premiers à postuler

Description du poste

L'apprenti-e sera rattaché-e dans l'équipe Supports aux projets du CRI dont l'objectif est d'aider à la réalisation des différents projets de recherche de l'IRIT notamment sur les aspects de la recherche par les données tels que le calcul, le développement logiciel, les données et l'IA. L'équipe met à disposition des chercheurs la plateforme de calcul Occidata pour l'expérimentation des codes de calcul et la plateforme logicielle OCS pour la Science Ouverte.


La mission confiée à l'apprenti-e sera de contribuer aux développements fonctionnels et logiciels de la plateforme OCS dédiée aux données de la recherche pour répondre aux besoins des projets de l'IRIT dans les domaines de la Science Ouverte (SO) et des Sciences des Données (SD) :


- étudier les principes FAIR pour les produits de la recherche (Findable Accessible, Interoperable, Reusable), l'existant de la plateforme OCS, l'éco-système numérique de la SO et des SD.


- faire l'état de l'art sur la spécification des données et des traitements pour les SD et enrichir leur modèle sémantique dans la plateforme. Mettre en place des indices de qualité.


- intégrer un modèle pour la description des codes et des services de traitement et de déploiement.


- enquêter sur les besoins des chercheurs dans les domaines de la SO, des SD et des sciences reproductibles. Faire ressortir des cas d'usage d'intérêt.


- contribuer à la feuille de route fonctionnelle et technique de la plateforme.


- élaborer des documentations, des communications et des ateliers à destination des chercheurs et ingénieurs.


- construire la cartographie des produits de la recherche ouverts de l'IRIT (données, codes, publications, work services de traitement, vocabulaires, DMP, datapapers) pour contribuer à améliorer la visibilité scientifique de l'IRIT, la citabilité et la réutilisabilité de ses travaux et des produits de ses recherches.


- enrichir la sémantique des produits de la recherche et de la plateforme avec les langages du web des données et une base graphe SPARQL. Mettre en place l'inférence sémantique pour améliorer les fonctionnalités de la plateforme.


- refactorer des codes existants, développer de nouvelles fonctionnalités et de nouvelles vues de l'interface utilisateur de la plateforme. Ecrire leurs tests logiciels (frameworks javascript VueJS). Adopter l'environnement de développement (Gitlab, VSC).


- faire évoluer la plateforme vers un Environnement Virtuel de Recherche (VRE). Ses usages de recherche par les données seront intégrés à l'éco-système de la Science Ouverte et dans le web des données pour améliorer les usages, la provenance des ressources, une exploitation et une reproductibilité amélioré des expérimentations dans les projets en recherche par les données.


Localisation : 31000 Toulouse

Date de début : 13/09/2026

Référence : 6a20a3f25c68f751dcee17ac

Recommandé pour vous

Ingénieur QA Senior – Éditeur de solutions e-commerce Silkhom
Toulouse (31)CDI 55 000 € - 70 000 € par an Il y a 3 jours
A350 & A380 - Fuselage Structure Customer Support - Fatigue & DT engineer on NCF (f/m) AIRBUS
Toulouse (31)CDI Salaire non précisé Il y a 5 jours