Ingénieur Data & IA TAL/NLP (H/F) Recruteur partenaire

Palaiseau (91)CDITélétravail partiel

Hier sur le WebSoyez parmi les premiers à postuler

Critères de l'offre

Métiers :
- Ingénieur Big Data (H/F)
- + 2 métiers
Télétravail :
- Télétravail partiel
Expérience min :
- débutant à 1 an
Secteur :
- Cabinets de conseils
Diplômes :
- Doctorat
- + 1 diplôme
Compétences :
- Anglais
- Python
- JGraph
- Kubernetes
- SDK
Lieux :
- Palaiseau (91)
Conditions :
- CDI
- Temps Plein
- Aucun déplacement à prévoir

Description du poste

Nous recrutons un Ingénieur Data & IA TAL / NLP, spécialisé dans les modèles de langage, les systèmes d'inférence à grande échelle, et les frameworks agentiques modernes.
Type de contrat : CDI, salaire selon expérience, forfait jours Syntec
Expérience requise : stage NLP a minima si junior, expérience 1 à 5 ans en projet NLP et architecture cloud / on-premise si profil expérimenté
Lieu de travail : École polytechnique (Palaiseau, 91) 1 à 2 jours par semaine, sinon télétravail
Vous rejoindrez notre équipe NLP/LLM pour concevoir, optimiser et déployer des systèmes IA de pointe : recherche sémantique, RAG avancés, fine-tuning, distillation, quantization, graphes de connaissances et systèmes agentiques orchestrés.
Vos missions :
- Concevoir, entraîner, fine-tuner et optimiser des modèles de langage (LLM open-source ou propriétaires)
- Implémenter, benchmarker et améliorer des pipelines RAG de nouvelle génération : Retrieval, filtering, ranking, Evaluation quantitative/qualitative des performances, Robustesse multilingue (français / anglais)
- Évaluer et optimiser des modèles d'embeddings : BGE, E5, Qwen Embedding, GritLM, SFR-Embedding, etc., Comparaison de performances sur nos cas d'usage internes, Sélection et ajustement de modèles pour différents contextes (dense, hybrid, reranking)
- Construire des systèmes agentiques via : LangChain / LangGraph, LlamaIndex, OpenAI Agents SDK, ou autres frameworks avancés d'orchestration LLM
- Concevoir des pipelines robustes pour la collecte, génération et nettoyage de données complexes
- Mettre en place des stratégies d'optimisation d'inférence (quantization, distillation, pruning, batching, caching)
- Développer des protocoles d'évaluation rigoureux (benchmarks, stress tests, LLM-as-a-judge, datasets internes)
- Collaborer étroitement avec les équipes engineering et produit pour intégrer vos solutions en production
Profil recherché :
- Master/Ingénieur/PhD en machine learning, NLP, informatique ou domaine associé
- Souhaité : 2-5+ ans d'expérience en NLP/LLM ou IA appliquée
- Excellente maîtrise de Python, PyTorch (ou TensorFlow) et HuggingFace Transformers
- Expérience concrète dans la mise en œuvre de pipelines RAG complets et robustes, l'évaluation d'embedding models (BGE, Qwen, E5, etc.) et la comparaison de retrieveurs
- Compétence confirmée avec des frameworks agentiques : LangChain, LangGraph, LlamaIndex, OpenAI Agents SDK, ou équivalents
- Connaissance des modèles open-source (Llama, Mistral, Qwen, Gemma.) et des techniques de fine-tuning (LoRA, QLoRA, adapters)
- Connaissances pratiques en architecture de déploiement IA (Docker, APIs, scaling, monitoring)
- Capacité d'analyse, autonomie, rigueur scientifique et communication claire
- Adaptabilité et intérêt marqué pour les approches open-source

Salaire et avantages

Ordinateur portable
Complémentaire santé

Référence : 201QCFP

Recommandé pour vous

Massy (91)CDI 60 000 € - 65 000 € par an Il y a 11 jours

Massy (91)CDI Il y a 9 jours

Versailles (78)CDI 45 000 € - 55 000 € par an Il y a 22 jours

Trouver un emploi par ville

Emploi Corbeil-Essonnes

Emploi Étampes

Emploi Évry-Courcouronnes

Emploi Les Ulis

Emploi Massy

Emploi Palaiseau