Partagez cette opportunité
Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.
Information importante
Type de contrat:
Freelance
Salaire / Taux journalier :
Salaire selon profil
Localisation :
Évry-Courcouronnes, France
Date de démarrage :
2 à 4 semaines
Mode de travail :
Sur site
Publié le :
15 avril 2026
Le besoin
Projet en forfait
Durée : 16 à 20 semaines
Mission
Concevoir et industrialiser la chaîne d’ingestion, de normalisation et de structuration de données externes dans le cadre d’une solution Data & IA de collecte et d’analyse de données multi-sources.
Garantir :
la qualité des données
la robustesse des pipelines
la traçabilité des traitements
l’exploitabilité des flux pour les briques analytiques
Rôle dans le projet
Responsable du socle pipeline Data
Prise en charge de :
la collecte des sources externes
le parsing documentaire
la normalisation et structuration des données
l’exposition des données vers les modules d’analyse (NLP / IA)
Profil recherché
5 à 10 ans d’expérience
Forte autonomie
Expérience sur données non structurées (documents, web, PDF, etc.)
Capacité à délivrer rapidement sans compromettre la robustesse
Responsabilités principales
Développer des pipelines d’ingestion automatisés
Concevoir et implémenter des connecteurs vers des sources externes
Gérer le parsing documentaire (découpage, nettoyage, structuration)
Mettre en place des mécanismes de déduplication et de contrôle qualité
Concevoir les modèles de données intermédiaires et normalisés
Collaborer avec les équipes IA/NLP pour rendre les données exploitables
Participer aux tests, à la documentation et à la fiabilité des traitements
Compétences indispensables
Python avancé
Conception de pipelines de données et orchestration
APIs, scraping raisonné, parsing documentaire (PDF, HTML…)
SQL et modélisation de données
PostgreSQL
Culture forte de :
qualité de données
logs et monitoring
tests et industrialisation
Gestion des problématiques :
volumétrie
erreurs
reprise sur incident
supervision
Compétences appréciées
Airflow, Prefect ou équivalent
Librairies de parsing documentaire (PyMuPDF, pdfplumber, OCR…)
Elasticsearch, indexation, moteur de recherche
Bases vectorielles (pgvector ou équivalent)
Docker, GitLab CI/CD
D'autres offres idéales pour vous !
Ces entreprises cherchent également d'excellents profils
Theodo
Data Engineer Senior
NA
Freelance
Urgent
Casablanca, Maroc
Hybride, Sur site
Expertises
il y a 4 mois
Opportunité exclusive
Espace Freelance
Data Engineer Senior - Freelance
Freelance
Urgent
Paris, France
Hybride
Expertises
il y a 18 heures
Opportunité exclusive
Elevate
Data engineer Senior
Freelance
Dans 4 à 8 semaines
Paris, France
Hybride
Expertises
il y a 17 heures
Opportunité exclusive