Trouver une offreRecruteurs

Data Engineer – Plateforme GenAI

Opportunité exclusive

Urgent

Hybride

Data Engineer – Plateforme GenAI

Avelsen

Data Engineer – Plateforme GenAI

Expertises

Data EngineeringPythonAWSTerraform

il y a 2 heures

Opportunité exclusive

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante


Type de contrat:

Freelance

Salaire / Taux journalier :

Salaire selon profil

Localisation :

Paris, France

Date de démarrage :

Urgent

Mode de travail :

Hybride

Publié le :

12 avril 2026

Le besoin


Contexte

Grand groupe pharmaceutique international qui fait évoluer sa plateforme GenAI interne pour automatiser et fiabiliser la production documentaire à grande échelle. Dans un environnement fortement réglementé, l'enjeu est de construire des fondations data robustes et scalables pour alimenter les workflows d'intelligence artificielle en production.

Missions

  • Parsing & ingestion : développer et maintenir des parsers multi-formats (DOCX avec styles, tables et track changes ; Excel avec cellules fusionnées, multi-feuilles et formules)

  • Modèle de données intermédiaire : définir un format normalisé post-parsing, compatible avec les workflows Data Science en aval

  • Traçabilité & qualité des données : implémenter la traçabilité source à travers les pipelines d'ingestion ; assurer les contrôles de complétude (doublons, métadonnées manquantes, cohérence)

  • CI/CD & déploiement : concevoir et déployer des pipelines CI/CD via Terraform ; mettre en place des smoke tests et workflows de validation post-ingestion

Stack & compétences attendues

  • Python avancé, notamment sur le parsing documentaire (DOCX, Excel)

  • Data pipelines, CI/CD et infrastructure cloud (AWS, Terraform)

  • Qualité des données, robustesse et scalabilité

  • Interface régulière avec des équipes Data Science

Modalités

  • Démarrage : dès que possible

  • Localisation : Paris – 3j/semaine sur site

  • TJM : selon profil

  • Durée : mission longue durée

Profil recherché


  1. 5 ans d'expérience minimum en tant que Data Engineer

  2. Parsing documentaire avancé — maîtrise de python-docx, openpyxl ou équivalents, avec gestion des cas complexes (styles, track changes, cellules fusionnées, formules)

  3. Data pipelines & qualité — expérience en ingestion, transformation, traçabilité et contrôles de complétude en environnement de production

  4. Infrastructure cloud AWS + Terraform — capacité à concevoir et déployer une infra from scratch, pas juste l'utiliser

  5. CI/CD appliqué à la data — smoke tests, validation post-ingestion, automatisation des déploiements pipelines

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

LittleBig Connection

Data Engineer - ITSM & IA

540€/jour

Freelance

Urgent

Lille, France

Sur site, Hybride

Expertises

Requêtes SQLTableauPythonDatabricksNLP / Natural Language ProcessingAmazon S3

il y a 4 jours

Opportunité exclusive

Theodo

Data Engineer Senior - Expert Cloud & IA Générative

Freelance

Urgent

Paris, France

Hybride

Expertises

LLMs / Large language modelsData EngineeringDockerDevOpsGoogle BigQueryGitLabAutomatisations No-codeAuditDiagnosticTerraformIAGcloudSQLDBTCI/CDdataDataflowCloud composerAPI

il y a 3 jours

Opportunité exclusive

Avelsen

Data Scientist – Plateforme GenAI | Pharma

Freelance

Urgent

Paris, France

Hybride

Expertises

LLMs / Large language modelsPythonAWSLangChainGenAI

il y a 3 heures

Opportunité exclusive

Réseau professionnel conçu pour les talents

© 2026. Tous droits réservés.

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils