STAGE - Clustering multimodal à large échelle (F/H) Groupe Talents Handicap

Yvelines (78)Stage
Il y a 11 heuresSoyez parmi les premiers à postuler

Description du poste

En tant qu'organisateur de forums de recrutement, Talents Handicap accompagne de très nombreuses entreprises & organisations en France dans leurs recrutements de collaborateurs en situation de handicap. Participant actuellement à l'un de nos forums.
L'entreprise Dassault Systèmes recherche actuellement des profils :


Dassault Systèmes, l'entreprise de la 3DEXPERIENCE, est un « accélérateur de progrès humain ». Elle propose aux entreprises et aux particuliers des environnements virtuels collaboratifs qui leur permettent d'imaginer des innovations plus durables. En développant un jumeau virtuel du monde réel, grâce à la plateforme 3DEXPERIENCE et à ses applications, Dassault Systèmes donne à ses clients les moyens de repousser les limites de l'innovation, de l'apprentissage et de la production.

Les 20 000 collaborateurs de Dassault Systèmes travaillent à créer de la valeur pour nos 270 000 clients de toutes tailles, dans toutes les industries, dans plus de 140 pays. Pour plus d'informations, visitez notre site www.3ds.com/fr

Au sein de la R&D Netvibes, l'équipe Sourcing & Standardization est en charge du développement de composants pour l'acquisition, le traitement, le stockage et l'exploitation de données à très large échelle.
Le stage se déroulera dans le cadre du service PartSupply de la 3DEXPERIENCE Marketplace, offrant un accès unique à un riche catalogue de composants mécaniques, électriques et électroniques, mis à disposition par des milliers de fournisseurs à travers le monde.

La similarité entre composants est au cœur de l'expérience PartSupply, aussi bien pour la recherche d'objets similaires, la classification de pièces et d'assemblages, que pour la standardisation de catalogues clients.
Les composants sont organisés dans un graphe de similarité 3D, puis exploités par des algorithmes d'apprentissage statistique.

L'objectif de ce stage est d'explorer des approches multimodales, notamment textuelles, en exploitant les embeddings de titres, paramètres, descriptions, documentations, etc., afin d'améliorer la structuration et le regroupement des composants.

Une deuxième partie du stage sera consacrée à l'exploration de l'usage des LLMs, notamment pour la description automatique, la classification et la normalisation des données.

Vos missions :
- Réaliser un état de l'art sur le clustering, les embeddings, les mesures de similarité et les approches associées.
- Calculer et évaluer des embeddings pour le calcul de similarité.
- Intégrer ces embeddings dans le graphe et mesurer leur impact sur le clustering.
- Explorer l'usage de LLMs pour la standardisation et la classification des composants.


Vos qualifications :
Etudiant.e en cursus BAC+5, en école d'ingénieurs ou formation Universitaire spécialité Data Science / Big Data / Machine Learning, vous êtes à la recherche d'un de 6 mois à partir de janvier 2026.
Connaissances solides en algorithmique et structures de données.
Bonne maîtrise des technologies d'apprentissage statistique et d'analyse de données.
Maîtrise des langages Java et Python.
Connaissance des architectures scalables et distribuées.
Bonne maîtrise de l'anglais à l'oral et à l'écrit pour la rédaction de documentation.

Des connaissances des frameworks de Machine/Deep Learning est un plus.
Des connaissances en moteurs de recherche et bases de données sont un plus.

Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans.

Principaux avantages et bénéfices :
Environnement multiculturel
Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie…)
Engagement en faveur de la diversité et de l'inclusion
Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc

Référence : 284779