Trouver une offreRecruteurs

Data Engineer Senior

Opportunité exclusive

Urgent

Hybride, Sur site

Data Engineer Senior

Theodo

Data Engineer Senior

Expertises

LLMs / Large language modelsData EngineeringAWS

il y a 3 mois

Opportunité exclusive

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante


Type de contrat:

Freelance

Salaire / Taux journalier :

NA

Cette offre est à 0% de commission 🎉

Localisation :

Casablanca, Maroc

Date de démarrage :

Urgent

Mode de travail :

Hybride, Sur site

Publié le :

23 décembre 2025

Le besoin


Data Engineer Senior

Nous recrutons un(e) Data Engineer senior pour un projet à forte portée : digitaliser le droit au Maroc et en Afrique et créer la première base de connaissance juridique interrogeable par l’IA.

Notre ambition est de construire une plateforme capable de répondre à des questions juridiques de façon fiable, sourcée et traçable, en s’appuyant sur un corpus massif de documents juridiques hétérogènes.

🚀 Pourquoi ce projet est différent

Vous rejoignez une mission “infrastructure de connaissance” :

  • contribuer à rendre le droit plus accessible 

  • bâtir un actif durable : une base structurée du droit marocain (français), extensible à l’Afrique

  • travailler sur un défi technique concret et profond : transformer du non-structuré en une donnée exploitable, fiable et maintenable à grande échelle

🎯 Votre mission

Vous serez responsable de la chaîne “documents → données structurées” qui alimentera notre moteur IA (RAG).

Au cœur du poste (intérêt technique)

Constituer une base de données structurée du droit marocain en français à partir de données très hétérogènes :

  • PDF (texte et scannés), Word, images, fichiers texte, parfois bruités ou incomplets

  • extraction de texte (parsing + OCR si nécessaire), nettoyage 

  • structuration : détection titres/chapitres/sections/articles, hiérarchie, normalisation

  • chunking intelligent (par structure juridique plutôt que par taille arbitraire), avec traçabilité (source, page, identifiants)

  • métadonnées : date, type de texte (loi/décret/circulaire/jurisprudence…), source, version, numéros d’articles, etc.

  • déduplication & versioning : documents redondants, amendements, versions consolidées

  • industrialisation : orchestration, logs, retries, idempotence, monitoring, tests qualité

✅ Profil recherché

  • 3+ ans d’expérience en Data Engineering et/ou Document AI / NLP appliqué

  • Très bonne maîtrise de Python

  • Expérience réelle avec documents non structurés : parsing PDF, OCR, nettoyage, structuration

  • Habitude de livrer en production : pipelines robustes, observabilité, qualité, performance

Stack / compétences (indicatif)

  • Stockage : AWS

  • Traitement documents : outils OCR/parsing, pipelines de prétraitement texte

  • Tests & qualité : métriques, échantillonnage, validation automatique

⭐ Bonus (appréciés)

  • Expérience sur corpus juridiques / réglementaires / contenus à forte exigence de précision

  • Familiarité avec les problématiques multilingues (FR/AR) et encodage

  • Connaissances de base sur les besoins en aval (vector DB, retrieval, citation)

🧪 Process de sélection

  • Test en ligne (20 min)

  • Entretien technique (60 min)

📍 Localisation

  • Poste basé à Casablanca

  • Remote possible (au Maroc ou à l’étranger) selon profil et niveau d’autonomie

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

Unitech Solutions

Data Engineer Senior

500

Freelance

Dans 2 à 4 semaines

Paris, France

Hybride

Expertises

Big DataPythonAWSdbtApache SparkTerraform

il y a 1 mois

Opportunité exclusive

Skiils

Data Engineer senior

CDI

Urgent

91300 Massy, France

Hybride

Expertises

Google Cloud PlatformJavaKafkaGitLabScalaKubernetes

il y a 20 jours

Opportunité exclusive

Ecaris

Data Engineer Senior GCP - Finance

600-650€/jour

Freelance

Urgent

Paris, France

Hybride, Sur site

Expertises

dbtTerraformGoogle Cloud Platform (GCP)Cloud Composer (Airflow)Google Kubernetes Engine (GKE)AirbyteCI/CDDataOps

il y a 3 jours

Opportunité exclusive

Réseau professionnel conçu pour les talents

© 2026. Tous droits réservés.

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils