Critères de l'offre
Métiers :
- Data scientist (H/F)
Secteur :
- Recrutement et placement
Diplômes :
- Diplôme de grande école d'ingénieur
- + 1 diplôme
Compétences :
- Anglais
Lieux :
- Yvelines (78)
Conditions :
- Stage
- Temps Plein
Description du poste
Dassault Systèmes, l'entreprise de la 3DEXPERIENCE, est un « accélérateur de progrès humain ». Elle propose aux entreprises et aux particuliers des environnements virtuels collaboratifs qui leur permettent d'imaginer des innovations plus durables. En développant un jumeau virtuel du monde réel, grâce à la plateforme 3DEXPERIENCE et à ses applications, Dassault Systèmes donne à ses clients les moyens de repousser les limites de l'innovation, de l'apprentissage et de la production.
Les 20 000 collaborateurs de Dassault Systèmes travaillent à créer de la valeur pour nos 270 000 clients de toutes tailles, dans toutes les industries, dans plus de 140 pays. Pour plus d'informations, visitez notre site www.3ds.com/fr
Chez Dassault Systèmes, nous unissons depuis des années nos forces avec des partenaires technologiques et scientifiques de renom (FDA, Harvard, MIT, INRIA, INSERM, Prix Nobel…) pour transformer les technologies de pointe en solutions concrètes pour nos clients.
Nos objectifs sont clairs :
Proposer une offre complète de bout en bout,
Structurer les filières industrielles du futur,
Intégrer les technologies les plus avancées dans nos solutions.
Dans un monde où la science évolue vite, notre mission est d'explorer et cartographier les réseaux scientifiques (chercheurs(euses), organisations, thématiques), détecter les tendances émergentes et transformer ces connaissances en leviers d'innovation stratégique.
Pour cela, nous développons des outils exploitant les publications scientifiques, avec un défi majeur : désambiguïser et enrichir les entités (entreprises, chercheurs(euses)), afin d'améliorer la qualité et la fiabilité des données.
Vos missions
Vous contribuerez au développement de briques logicielles visant à améliorer la qualité des données scientifiques grâce à la désambiguïsation et à l'enrichissement d'entités nommées.
Concrètement, vus aurez pour mission de :
- Analyser des textes scientifiques et extraire des informations pertinentes grâce à des techniques de traitement du langage naturel.
- Relier ces données à des graphes de connaissances (Knowledge Graph) pour en accroître la valeur.
- Améliorer la qualité et la précision des entités extraites grâce à des mécanismes de désambiguïsation.
Vos activités incluront
- Proposer et expérimenter des algorithmes de désambiguïsation (symboliques, statistiques ou hybrides).
- Concevoir un pipeline d'enrichissement sémantique interrogeant des sources externes.
- Contribuer à l'intégration des résultats dans nos systèmes internes pour renforcer leur impact.
En rejoignant Dassault Systèmes, vous participerez à des projets d'envergure internationale, à l'interface de la science, de l'IA et de l'innovation, dans un environnement stimulant qui valorise la curiosité, l'audace et la collaboration.
Vos qualifications
Vous êtes actuellement en Master 2 / Bac+5 (école d'ingénieur ou université) avec une spécialisation en Data Science / Machine Learning
Vous faites preuve de curiosité et de rigueur, vous aimez la modélisation sémantique et les défis liés à la compréhension des réseaux de collaboration.
Vous maîtrisez :
- Python (obligatoire)
- Les bases du NLP (tokenisation, embeddings, etc.)
- Une familiarité avec les modèles de langage (BERT, Qwen, etc.)
Vous souhaitez développer vos compétences sur :
Le web sémantique et la désambiguïsation d'entités
Les graphes de connaissances (RDF, SPARQL)
Le déploiement (Docker, APIs REST, etc.)
Vous êtes à l'aise en anglais, à l'écrit comme à l'oral.
Nous rejoindre c'est…
Recommandé pour vous


