Data scientist (H/F) SOC ETUDE SYSTEMES INFORMATIONS
Boulogne-Billancourt (92)CDI
Il y a 4 heures sur le WebSoyez parmi les premiers à postuler
Critères de l'offre
Métiers :
- Data scientist (H/F)
Expérience min :
- débutant à 2 ans
Secteur :
- ESN, Editeurs de logiciel, Services informatiques
Diplômes :
- Diplôme de grande école d'ingénieur
- + 1 diplôme
Lieux :
- Boulogne-Billancourt (92)
Conditions :
- CDI
- Temps Plein
- Aucun déplacement à prévoir
Description du poste
Au sein du pôle R&D IA et sous la responsabilité du Directeur Technique, vous participerez à la conception, au développement et au déploiement de solutions d'intelligence artificielle appliquées à la gestion électronique des documents et courriers (GED / GEC) :
- Développer des outils de traitement automatique de documents : OCR / OMR, segmentation, détection de doublons, Reconnaissance de types de documents (RAD) et Extraction automatique d'informations clés (LAD)
- Mettre en œuvre des modèles de Question Answering et de RAG (Retrieval-Augmented Generation) pour interroger les bases documentaires
- Concevoir des assistants IA pour la rédaction automatique, la correction grammaticale ou la reformulation
- Participer à l'entraînement et à l'évaluation de modèles de machine learning / deep learning (fine-tuning sur corpus internes)
- Travailler sur des solutions d'indexation intelligente, avec auto-apprentissage basé sur les corrections manuelles
- Contribuer à l'amélioration continue des performances des algorithmes (précision, rappel, temps de traitement)
- Documenter les solutions développées et travailler en collaboration avec les équipes produit, fonctionnelle et technique
PROFIL RECHERCHÉ
De formation Bac+5 (école d'ingénieur ou université) en data science, intelligence artificielle ou informatique, vous avez une première expérience (stage ou alternance) dans le développement de solutions IA appliquées à la gestion documentaire ou au traitement de texte.
Vous maîtrisez Python et ses bibliothèques de data science (Pandas, scikit-learn), ainsi que des frameworks de deep learning tels que PyTorch ou TensorFlow. Une connaissance des modèles de langage (LLMs - LLaMA, GPT, Mistral.), du question answering, et des architectures de RAG (Retrieval-Augmented Generation) est fortement appréciée. Vous avez déjà mis en œuvre des traitements d'OCR, d'extraction automatique de données (LAD), de reconnaissance de documents (RAD), ou de classification supervisée sur des documents semi-structurés (PDF, courriers, images.).
Vous êtes capable de concevoir des pipelines IA de bout-en-bout : ingestion, prétraitement, inférence, intégration dans des API ou systèmes GED. Curieux(se), rigoureux(se) et autonome, vous appréciez les environnements techniques complexes, l'innovation, et le travail en équipe. La connaissance de LangChain, Haystack, Elasticsearch ou d'outils d'annotation et de fine-tuning est un plus.
- Développer des outils de traitement automatique de documents : OCR / OMR, segmentation, détection de doublons, Reconnaissance de types de documents (RAD) et Extraction automatique d'informations clés (LAD)
- Mettre en œuvre des modèles de Question Answering et de RAG (Retrieval-Augmented Generation) pour interroger les bases documentaires
- Concevoir des assistants IA pour la rédaction automatique, la correction grammaticale ou la reformulation
- Participer à l'entraînement et à l'évaluation de modèles de machine learning / deep learning (fine-tuning sur corpus internes)
- Travailler sur des solutions d'indexation intelligente, avec auto-apprentissage basé sur les corrections manuelles
- Contribuer à l'amélioration continue des performances des algorithmes (précision, rappel, temps de traitement)
- Documenter les solutions développées et travailler en collaboration avec les équipes produit, fonctionnelle et technique
PROFIL RECHERCHÉ
De formation Bac+5 (école d'ingénieur ou université) en data science, intelligence artificielle ou informatique, vous avez une première expérience (stage ou alternance) dans le développement de solutions IA appliquées à la gestion documentaire ou au traitement de texte.
Vous maîtrisez Python et ses bibliothèques de data science (Pandas, scikit-learn), ainsi que des frameworks de deep learning tels que PyTorch ou TensorFlow. Une connaissance des modèles de langage (LLMs - LLaMA, GPT, Mistral.), du question answering, et des architectures de RAG (Retrieval-Augmented Generation) est fortement appréciée. Vous avez déjà mis en œuvre des traitements d'OCR, d'extraction automatique de données (LAD), de reconnaissance de documents (RAD), ou de classification supervisée sur des documents semi-structurés (PDF, courriers, images.).
Vous êtes capable de concevoir des pipelines IA de bout-en-bout : ingestion, prétraitement, inférence, intégration dans des API ou systèmes GED. Curieux(se), rigoureux(se) et autonome, vous appréciez les environnements techniques complexes, l'innovation, et le travail en équipe. La connaissance de LangChain, Haystack, Elasticsearch ou d'outils d'annotation et de fine-tuning est un plus.
Salaire et avantages
Annuel de 34000.0 Euros sur 12.0 mois
Chèque repas
Mutuelle
Chèque repas
Mutuelle
L'entreprise : SOC ETUDE SYSTEMES INFORMATIONS
Sesin est éditeur et intégrateur de logiciels de GEIDE, de gestion de contenus et de dématérialisation des documents et des processus.
Grâce à ses outils de travail collaboratif, ses solutions mobiles et ses applications de gestion et de partage des informations, Sesin participe à la digitalisation des entreprises et de la société.
Créée il y a près de 40 ans, Sesin, c est aujourd'hui une vingtaine de collaborateurs au service d une clientèle de grands comptes et d'administrations.
Grâce à ses outils de travail collaboratif, ses solutions mobiles et ses applications de gestion et de partage des informations, Sesin participe à la digitalisation des entreprises et de la société.
Créée il y a près de 40 ans, Sesin, c est aujourd'hui une vingtaine de collaborateurs au service d une clientèle de grands comptes et d'administrations.
Référence : 194PDQQ
Recommandé pour vous

Boulogne-Billancourt (92)Alternance / Apprentissage 900 € - 1 600 € par mois Il y a 7 heures

Lisses (91)CDI 55 000 € - 60 000 € par mois Il y a 4 jours

Boulogne-Billancourt (92)Alternance / Apprentissage 900 € - 1 600 € par mois Il y a 7 heures