Data Scientist - Vision, NLP et Propriété Intellectuelle (H/F) Recruteur partenaire
Pau (64)CDITélétravail partiel
Hier sur le WebSoyez parmi les premiers à postuler
Critères de l'offre
Métiers :
- Data scientist (H/F)
Télétravail :
- Télétravail partiel
Expérience min :
- 1 à 5 ans
Secteur :
- ESN, Editeurs de logiciel, Services informatiques
Diplômes :
- Doctorat
- + 2 diplômes
Lieux :
- Pau (64)
Conditions :
- CDI
- Temps Plein
Description du poste
Startup issue du domaine de la propriété intellectuelle, développant des solutions d'intelligence artificielle pour les experts de la protection des innovations.
Nos outils exploitent la vision, le NLP et l'apprentissage explicable pour assister les professionnels du droit : détection de similarités, génération d'arguments, rédaction de brevets et analyse de portefeuilles.
Nous opérons à l'interface entre recherche académique et ingénierie logicielle (Python, PyTorch, Docker, PostgreSQL, OVHCloud, modèles multimodaux).
Notre objectif : rendre l'IA juridique interprétable, fiable et utile.
Description du poste
Rattaché(e) au responsable R&D, le/la Data Scientist Vision-NLP interviendra sur tout le cycle de développement des modèles : conception, entraînement, validation et déploiement.
Le poste combine recherche appliquée, ingénierie de données et modélisation explicable.
Missions principales
1. Extraction et préparation des données
- Développement de pipelines d'ingestion (textes, images, décisions, marques).
- Extraction structurée depuis XML, PDF, JSON et images (OCR, parsing).
- Nettoyage, normalisation et enrichissement sémantique (lemmatisation, entités, classes).
2. Modélisation et apprentissage
- Conception de modèles de vision (SigLIP, CLIP, ViT, CNN) pour logos et marques.
- Développement NLP : embeddings, fine-tuning de transformers, classification multi-label.
- Construction de modèles interprétables (SHAP, LIME, attention weights).
- Évaluation expérimentale et définition de métriques adaptées aux usages PI.
3. Mise en production
- Intégration dans des conteneurs Docker, automatisation des déploiements.
- Collaboration avec les ingénieurs backend pour l'exposition via API.
- Suivi des performances, retraining périodique et documentation technique.
4. Recherche et innovation
- Veille scientifique sur Similarity Learning, Explainable AI, Vision-Language Models.
- Participation aux orientations R&D, rédaction de rapports techniques.
- Contribution à des projets de recherche académiques et partenariaux.
Profil recherché
Formation
Master 2 ou Doctorat en IA, Informatique, NLP, Vision par ordinateur ou domaine proche.
Une connaissance de la propriété intellectuelle (marques, brevets, classification de Nice) est appréciée.
Expérience
1 à 3 ans en data science, recherche appliquée ou modélisation IA (stages inclus).
Expériences concrètes en NLP et/ou Vision : prototypes, publications ou produits.
Pratique de la mise en production (Docker, FastAPI, Kubernetes ou équivalent).
Compétences techniques
Python, PyTorch/TensorFlow, scikit-learn, pandas, NumPy.
Vision : CLIP, SigLIP, ViT, CNN, OpenCV.
NLP : BERT, MPNet, Gemma, embeddings, fine-tuning, similarity learning.
Interprétabilité : SHAP, LIME, feature importance, attention visualization.
DevOps/Infra : Docker, Git, PostgreSQL, FastAPI, OVHCloud/AWS.
Formats : XML, JSON, SQL, OCR, ensembles multimodaux.
Qualités professionnelles
Rigueur scientifique et documentation précise.
Autonomie, sens expérimental et aptitude au travail interdisciplinaire.
Intérêt pour l'IA explicable et la reproductibilité des modèles.
Localisation : Pau (télétravail partiel)
Rémunération : selon profil (32 000 € - 34 000 € brut/an)
Prise de poste : dès que possible
Équipement : GPU local et cloud, corpus internes de PI
Encadrement : équipe R&D mixte (chercheurs, ingénieurs, juristes)
Nos outils exploitent la vision, le NLP et l'apprentissage explicable pour assister les professionnels du droit : détection de similarités, génération d'arguments, rédaction de brevets et analyse de portefeuilles.
Nous opérons à l'interface entre recherche académique et ingénierie logicielle (Python, PyTorch, Docker, PostgreSQL, OVHCloud, modèles multimodaux).
Notre objectif : rendre l'IA juridique interprétable, fiable et utile.
Description du poste
Rattaché(e) au responsable R&D, le/la Data Scientist Vision-NLP interviendra sur tout le cycle de développement des modèles : conception, entraînement, validation et déploiement.
Le poste combine recherche appliquée, ingénierie de données et modélisation explicable.
Missions principales
1. Extraction et préparation des données
- Développement de pipelines d'ingestion (textes, images, décisions, marques).
- Extraction structurée depuis XML, PDF, JSON et images (OCR, parsing).
- Nettoyage, normalisation et enrichissement sémantique (lemmatisation, entités, classes).
2. Modélisation et apprentissage
- Conception de modèles de vision (SigLIP, CLIP, ViT, CNN) pour logos et marques.
- Développement NLP : embeddings, fine-tuning de transformers, classification multi-label.
- Construction de modèles interprétables (SHAP, LIME, attention weights).
- Évaluation expérimentale et définition de métriques adaptées aux usages PI.
3. Mise en production
- Intégration dans des conteneurs Docker, automatisation des déploiements.
- Collaboration avec les ingénieurs backend pour l'exposition via API.
- Suivi des performances, retraining périodique et documentation technique.
4. Recherche et innovation
- Veille scientifique sur Similarity Learning, Explainable AI, Vision-Language Models.
- Participation aux orientations R&D, rédaction de rapports techniques.
- Contribution à des projets de recherche académiques et partenariaux.
Profil recherché
Formation
Master 2 ou Doctorat en IA, Informatique, NLP, Vision par ordinateur ou domaine proche.
Une connaissance de la propriété intellectuelle (marques, brevets, classification de Nice) est appréciée.
Expérience
1 à 3 ans en data science, recherche appliquée ou modélisation IA (stages inclus).
Expériences concrètes en NLP et/ou Vision : prototypes, publications ou produits.
Pratique de la mise en production (Docker, FastAPI, Kubernetes ou équivalent).
Compétences techniques
Python, PyTorch/TensorFlow, scikit-learn, pandas, NumPy.
Vision : CLIP, SigLIP, ViT, CNN, OpenCV.
NLP : BERT, MPNet, Gemma, embeddings, fine-tuning, similarity learning.
Interprétabilité : SHAP, LIME, feature importance, attention visualization.
DevOps/Infra : Docker, Git, PostgreSQL, FastAPI, OVHCloud/AWS.
Formats : XML, JSON, SQL, OCR, ensembles multimodaux.
Qualités professionnelles
Rigueur scientifique et documentation précise.
Autonomie, sens expérimental et aptitude au travail interdisciplinaire.
Intérêt pour l'IA explicable et la reproductibilité des modèles.
Localisation : Pau (télétravail partiel)
Rémunération : selon profil (32 000 € - 34 000 € brut/an)
Prise de poste : dès que possible
Équipement : GPU local et cloud, corpus internes de PI
Encadrement : équipe R&D mixte (chercheurs, ingénieurs, juristes)
Salaire et avantages
Annuel de 32000.0 Euros à 34000.0 Euros sur 12.0 mois
Primes
Titres restaurant / Prime de panier
Primes
Titres restaurant / Prime de panier
Référence : 198YQPJ
Recommandé pour vous

Biarritz (64)CDI 40 000 € - 55 000 € par an Il y a 2 jours

Saint-Médard-en-Jalles (33)CDI Hier

Mérignac (33)CDI Il y a 19 jours