Expertises
il y a 2 heures
Opportunité exclusive
Partagez cette opportunité
Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.
Information importante
Type de contrat:
Freelance
Salaire / Taux journalier :
Salaire selon profil
Localisation :
Paris, France
Date de démarrage :
Urgent
Mode de travail :
Hybride
Publié le :
12 avril 2026
Le besoin
Contexte
Grand groupe pharmaceutique international qui fait évoluer sa plateforme GenAI interne pour automatiser et fiabiliser la production documentaire à grande échelle. Dans un environnement fortement réglementé, l'enjeu est de construire des fondations data robustes et scalables pour alimenter les workflows d'intelligence artificielle en production.
Missions
Parsing & ingestion : développer et maintenir des parsers multi-formats (DOCX avec styles, tables et track changes ; Excel avec cellules fusionnées, multi-feuilles et formules)
Modèle de données intermédiaire : définir un format normalisé post-parsing, compatible avec les workflows Data Science en aval
Traçabilité & qualité des données : implémenter la traçabilité source à travers les pipelines d'ingestion ; assurer les contrôles de complétude (doublons, métadonnées manquantes, cohérence)
CI/CD & déploiement : concevoir et déployer des pipelines CI/CD via Terraform ; mettre en place des smoke tests et workflows de validation post-ingestion
Stack & compétences attendues
Python avancé, notamment sur le parsing documentaire (DOCX, Excel)
Data pipelines, CI/CD et infrastructure cloud (AWS, Terraform)
Qualité des données, robustesse et scalabilité
Interface régulière avec des équipes Data Science
Modalités
Démarrage : dès que possible
Localisation : Paris – 3j/semaine sur site
TJM : selon profil
Durée : mission longue durée
Profil recherché
5 ans d'expérience minimum en tant que Data Engineer
Parsing documentaire avancé — maîtrise de python-docx, openpyxl ou équivalents, avec gestion des cas complexes (styles, track changes, cellules fusionnées, formules)
Data pipelines & qualité — expérience en ingestion, transformation, traçabilité et contrôles de complétude en environnement de production
Infrastructure cloud AWS + Terraform — capacité à concevoir et déployer une infra from scratch, pas juste l'utiliser
CI/CD appliqué à la data — smoke tests, validation post-ingestion, automatisation des déploiements pipelines
D'autres offres idéales pour vous !
Ces entreprises cherchent également d'excellents profils
LittleBig Connection
Data Engineer - ITSM & IA
540€/jour
Freelance
Urgent
Lille, France
Sur site, Hybride
Expertises
il y a 4 jours
Opportunité exclusive
Theodo
Data Engineer Senior - Expert Cloud & IA Générative
Freelance
Urgent
Paris, France
Hybride
Expertises
il y a 3 jours
Opportunité exclusive
Avelsen
Data Scientist – Plateforme GenAI | Pharma
Freelance
Urgent
Paris, France
Hybride
Expertises
il y a 3 heures
Opportunité exclusive