STAGE - Extraction et structuration d’informations non structurées Covéa

Les Paris (73)CDI
Il y a 2 heuresSoyez parmi les premiers à postulerCandidature facile

Description du poste




STAGE - Extraction et structuration d'informations non structurées


« La DSIN Covéa est riche de 2000 collaborateurs (sur les sites de Niort, Le Mans, Chartres, Saran, Paris Montparnasse, Saint Lazare et Levallois) que je souhaite voir grandir dans un esprit de proximité, de modernité et de plaisir. Rejoignez nos équipes pour répondre à l'ambition de Covéa, de ses métiers (assurance IARD, Vie, Santé, Prévoyance, Protection Juridique, Assistance) et de ses marques (MAAF, MMA et GMF). La DSI reste au coeur des opérations et de la transformation au travers d'un SI doté de capacités digitales, data et d'intelligence artificielle et d'une ambition d'excellence opérationnelle et industrielle (cloud native) » (Philippe CUVELIER - DSI COVEA)
Dans le cadre de sa stratégie data et IA, Covéa explore les solutions permettant d'extraire automatiquement des informations à partir de documents non structurés (textes libres, presse régionale, contrats, etc.) pour les transformer en données structurées exploitables. L'objectif est de construire une chaîne d'extraction robuste, généralisable et efficiente, en s'appuyant sur les modèles de langage (LLM) mais aussi sur des techniques alternatives plus légères.
Mots clés : NLP, LLM, Extraction d'information, Structuration, IA frugale, Modèles hybrides

Votre mission ?

La Direction SMART IA propose un stage de 5 à 8 mois pour concevoir et évaluer différentes approches d'extraction d'information non structurées.
Vos objectifs seront de :
• Définir une méthodologie d'extraction et de structuration adaptée à différents types de documents
• Implémenter plusieurs approches (LLM, modèles classiques, règles, approches hybrides, etc.) et les comparer selon des critères de performance, coût (ressources et temps de calcul) et généricité.
• Proposer une solution réutilisable et adaptable à de nouveaux cas d'usage.

Et concrètement ?

Dans le cadre de votre mission :
• Vous devrez appréhender et comprendre les modèles spécialisés de compréhension du langage naturel déjà construits par Covéa.
• Vous réaliserez un état de l'art des techniques d'extraction d'information (LLM,, modèles supervisés, règles linguistiques…).
• Vous sélectionnerez un ou plusieurs cas d'usage métier pour expérimenter les approches (ex. : presse régionale, contrats d'assurance).
• Vous développerez un pipeline d'extraction et de structuration de données.
• Vous mettrez en place un benchmark prenant en compte différents critières : précision, temps de calcul, consommation mémoire, facilité de déploiement.
• Vous implémenterez au moins une solution à l'état de l'art et proposerez des ajustements adaptés à l'environnement de nos projets
• Vous proposerez une manière pédagogique de restituer visuellement les résultats
• En lien avec les acteurs opérationnels, vous évaluerez les impacts d'une éventuelle mise en oeuvre des solutions proposées.

Environnement de travail :
- Bénéfice du forfait « mobilité durable » permettant la prise en charge d'une partie des frais de déplacements réalisés en covoiturage, vélo ou auto-partage,
- Prise en charge à hauteur de 75% d'un titre d'abonnement aux transports publics
- Restaurant d'entreprise,
- Nos sites situés dans la région parisienne sont facilement accessibles en transport en commun et ceux situés en région bénéficient de parkings sécurisés + bornes de recharge électrique
- Installations mobilités « douces » (vélo, …),
- Espaces de détente, de convivialité (terrasse ou extérieur, …) et de co-working



Et si c'était vous ?
• Vous êtes curieux et appétent à comprendre les métiers de l'assurance,
• Vous pensez que, demain, l'expérience client doit être améliorée par l'usage de la technologie,
• Vous savez qu'une exploitation intelligente des ressources de calcul passe par le mélange de créativité et d'expertise en mathématiques et informatique,
• Vous connaissez Python et ses packages scientifiques, notamment pytorch, transormers, spaCy…
• Vous avez une première expérience avec les LLM et les techniques d'évaluation de modèles.



Covéa est un groupe mutualiste engagé, constitué des marques MAAF, MMA, GMF et du réassureur PartnerRe.
Acteur économique majeur des territoires, grâce à ses 24 000 collaborateurs,Covéa protège plus de 11 millions de clients et sociétaires en France.

Rejoignez le leader de l'assurance, contribuez à sa réussite : votre talent, notre engagement !

L'entreprise : Covéa

Le groupe mutualiste Covéa est un leader européen de l'assurance et de la réassurance.

Covéa est un acteur financier solide et dynamique, premier assureur de biens et responsabilité en France à travers ses trois marques MAAF, MMA, GMF et 10ème réassureur mondial avec la marque PartnerRe.

Acteur économique majeur des territoires, grâce à ses 24 000 collaborateurs en France et dans le monde, Covéa protège plus de 11 millions de clients et sociétaires en France.

Référence : req39347

Recommandé pour vous

RESPONSABLE D'ACTIVITÉ (F/H) Randstad
Voiron (38)CDI 40 000 € - 45 000 € par an Il y a 21 jours
Responsable d'activité photovoltaïque H/F Fauché
Gerzat (63)CDI Il y a 22 jours
Team Leader (H/F) - Grenoble Experis ManpowerGroup
Grenoble (38)CDI Il y a 13 jours