Data Scientist (H/F) Recruteur partenaire
Paris (75)CDI
Salaire non précisé
Hier sur le WebSoyez parmi les premiers à postuler
Critères de l'offre
Métiers :
- Data scientist (H/F)
Expérience min :
- 1 à 5 ans
Secteur :
- Cabinets de conseils
Lieux :
- Paris (75)
Conditions :
- CDI
- Salaire non précisé
- Temps Plein
- Aucun déplacement à prévoir
Description du poste
Redesign Group est un fournisseur mondial de solutions technologiques et de cybersécurité. Nous nous appuyons sur la pensée design, l'expertise interdépendante et les solutions technologiques émergentes pour aider les organisations à réussir leur transformation. La diversité de nos équipes internationales, nos partenariats avec des fabricants de technologies stratégiques et nos services de cybersécurité nous positionnent comme un partenaire d'affaires prêt à relever les défis de demain.
Description du poste
Nous recrutons un data scientist motivé pour contribuer à des fonctionnalités basées sur LLM, en collaboration avec notre équipe d'ingénierie. Vous participerez à la conception, à l'implémentation et à l'exploitation de systèmes LLM (RAG, agents, réglage fin, optimisation de l'inférence) qui respectent nos SLA produit et génèrent un impact commercial mesurable. Nous recherchons des personnes avec de bonnes bases en apprentissage automatique et en ingénierie logicielle, curieuses et prêtes à apprendre ; les outils ne sont qu'un moyen d'y parvenir.
Vos responsabilités :
Contribuer à la conception, à l'implémentation et à l'exploitation de systèmes LLM en production (pipelines de récupération, orchestration d'agents, flux de réglage fin), du prototype à la mise à l'échelle, avec le soutien de l'équipe.
Aider à traduire des problèmes produit en objectifs d'apprentissage automatique mesurables et à identifier des compromis pragmatiques (taille du modèle vs latence, stratégie de récupération vs précision, coût vs qualité).
Construire des pipelines d'évaluation (automatisés et humains) et suivre des KPI pour l'hallucination, la pertinence et l'équité.
Participer à l'optimisation de l'inférence et des déploiements (quantification, traitement par lots, mise à l'échelle automatique, stratégies de cache).
Exigences essentielles
2 ans ou plus d'expérience en ingénierie ou recherche appliquée en apprentissage automatique/deep learning, idéalement avec une première expérience de déploiements en production.
Bonne connaissance des modèles de type Transformer et des techniques d'entraînement/fin-tuning (notamment les méthodes économes en paramètres comme LoRa/adaptateurs).
Une première expérience de création de pipelines RAG et/ou de workflows d'agents, avec une attention à la qualité de la recherche et à l'ingénierie du contexte.
Des bases en optimisation et déploiement de l'inférence (compromis latence/coût, quantification, batching, autoscaling).
Bonnes compétences en ingénierie logicielle : code propre, tests, CI/CD, observabilité et documentation claire.
Capacité à communiquer clairement et à expliquer des compromis techniques aux équipes produit, infrastructure et métier.
Atouts
Expérience des bases de données vectorielles (Qdrant) et des architectures d'embeddings.
Connaissance des moteurs d'inférence (vLLM, Triton, HF Inference) ou de la compression/distillation de modèles.
Expérience en matière de sécurité, de gouvernance ou d'audit de conformité en apprentissage automatique. Expérience en conception de frameworks d'évaluation humaine et en réalisation de tests A/B pour différentes versions de modèles.
Technologies utilisées : Python, écosystème PyTorch/Transformers, bases de données vectorielles (Qdrant ou autre), frameworks RAG (LangChain/LlamaIndex), outils d'inférence/de déploiement (vLLM, Triton, points de terminaison HF), conteneurisation (Docker), monitoring (Prometheus/Grafana, métriques de modèles personnalisées). Remarque : nous privilégions la maîtrise des concepts à la fidélité à une marque spécifique.
Description du poste
Nous recrutons un data scientist motivé pour contribuer à des fonctionnalités basées sur LLM, en collaboration avec notre équipe d'ingénierie. Vous participerez à la conception, à l'implémentation et à l'exploitation de systèmes LLM (RAG, agents, réglage fin, optimisation de l'inférence) qui respectent nos SLA produit et génèrent un impact commercial mesurable. Nous recherchons des personnes avec de bonnes bases en apprentissage automatique et en ingénierie logicielle, curieuses et prêtes à apprendre ; les outils ne sont qu'un moyen d'y parvenir.
Vos responsabilités :
Contribuer à la conception, à l'implémentation et à l'exploitation de systèmes LLM en production (pipelines de récupération, orchestration d'agents, flux de réglage fin), du prototype à la mise à l'échelle, avec le soutien de l'équipe.
Aider à traduire des problèmes produit en objectifs d'apprentissage automatique mesurables et à identifier des compromis pragmatiques (taille du modèle vs latence, stratégie de récupération vs précision, coût vs qualité).
Construire des pipelines d'évaluation (automatisés et humains) et suivre des KPI pour l'hallucination, la pertinence et l'équité.
Participer à l'optimisation de l'inférence et des déploiements (quantification, traitement par lots, mise à l'échelle automatique, stratégies de cache).
Exigences essentielles
2 ans ou plus d'expérience en ingénierie ou recherche appliquée en apprentissage automatique/deep learning, idéalement avec une première expérience de déploiements en production.
Bonne connaissance des modèles de type Transformer et des techniques d'entraînement/fin-tuning (notamment les méthodes économes en paramètres comme LoRa/adaptateurs).
Une première expérience de création de pipelines RAG et/ou de workflows d'agents, avec une attention à la qualité de la recherche et à l'ingénierie du contexte.
Des bases en optimisation et déploiement de l'inférence (compromis latence/coût, quantification, batching, autoscaling).
Bonnes compétences en ingénierie logicielle : code propre, tests, CI/CD, observabilité et documentation claire.
Capacité à communiquer clairement et à expliquer des compromis techniques aux équipes produit, infrastructure et métier.
Atouts
Expérience des bases de données vectorielles (Qdrant) et des architectures d'embeddings.
Connaissance des moteurs d'inférence (vLLM, Triton, HF Inference) ou de la compression/distillation de modèles.
Expérience en matière de sécurité, de gouvernance ou d'audit de conformité en apprentissage automatique. Expérience en conception de frameworks d'évaluation humaine et en réalisation de tests A/B pour différentes versions de modèles.
Technologies utilisées : Python, écosystème PyTorch/Transformers, bases de données vectorielles (Qdrant ou autre), frameworks RAG (LangChain/LlamaIndex), outils d'inférence/de déploiement (vLLM, Triton, points de terminaison HF), conteneurisation (Docker), monitoring (Prometheus/Grafana, métriques de modèles personnalisées). Remarque : nous privilégions la maîtrise des concepts à la fidélité à une marque spécifique.
Salaire et avantages
Mensuel de 4000.0 Euros à 5416.67 Euros sur 12.0 mois
Complémentaire santé
Titres restaurant / Prime de panier
Complémentaire santé
Titres restaurant / Prime de panier
Référence : 210PSNS
Recommandé pour vous

Paris (75)CDI Salaire non précisé Il y a 9 jours

Paris (75)CDI À partir de 42 000 € par an Hier

Paris 19 (75)CDI Salaire non précisé Il y a 19 jours