Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Opportunité exclusive

Urgent

Hybride

Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Visian

Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Expertises

Machine LearningIA

il y a 1 jour

Opportunité exclusive

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante

Type de contrat:

Freelance

Taux journalier :

Salaire selon profil

Localisation :

Paris, France

Date de démarrage :

Urgent

Mode de travail :

Hybride

Publié le :

4 mai 2026

Le besoin

Dans le cadre d'un besoin d'un de ses clients, Visian recherche un Data Engineer.

Expertise opérationnelle sur les plateformes Data/IA

Challenger et améliorer concrètement les plateformes Dagster (orchestration) et Trino (requêtage distribué) : diagnostiquer les problèmes de performance, optimiser les configurations, revoir les patterns d'utilisation.
Concevoir et optimiser les pipelines d'ingestion et de processing de données basées sur Spark : performance des jobs, gestion des volumétries, stratégies de partitionnement et formats de stockage (Delta Lake, Iceberg).
Intervenir directement sur les évolutions techniques pour accompagner la montée en charge (volumétrie, nombre d'utilisateurs, complexité des pipelines).
Contribuer à la gouvernance technique par la pratique : établir les standards à partir de cas concrets, documenter les décisions techniques.
Évaluer et prototyper l'intégration de nouveaux composants dans l'écosystème (formats de stockage, outils de catalogue, moteurs de calcul).

Industrialisation & Scalabilité

Industrialiser les pipelines Data et IA/ML : fiabilité, observabilité, reproductibilité — en mettant en œuvre soi-même les solutions, pas uniquement en les spécifiant.
Concevoir et implémenter les patterns de déploiement et d'exploitation à l'échelle en collaboration avec les équipes support et l'équipe d'ingénierie de production.
Mettre en place concrètement les mécanismes de monitoring, d'alerting et de capacity planning adaptés aux workloads Data/IA.
Structurer le support de niveau 3 (expertise) et accompagner l'équipe de production sur le support de niveaux 1 et 2.

Accompagnement & Montée en compétence

Conseiller et accompagner les équipes de développement et de data science dans l'utilisation optimale des plateformes.
Assurer un rôle de référent technique opérationnel au sein de l'équipe — par l'exemple et le pair-working, pas uniquement par le conseil.
Participer à la veille technologique et réaliser des POCs sur des évolutions pertinentes pour l'écosystème Data/IA.

Environnement fonctionnel

La prestation se déroulera au sein du service en charge :

Des plateformes Data & IA/ML (Dagster, Trino, Delta Lake/Iceberg, Superset, OpenMetadata)
Des plateformes Kubernetes (on-prem et Cloud) servant de socle d'hébergement
Des outils DevOps (intégration continue, déploiement, observabilité)
Des projets de R&D visant à moderniser le SI (POCs, présentations)
De l'accompagnement des initiatives IA/ML du groupe
Des outils de monitoring

Environnement technique

Data / Orchestration : Dagster, Trino, Apache Spark, Hive, Delta Lake/Iceberg, Superset, OpenMetadata
IA / ML : Workloads IA/ML sur Kubernetes, outils MLOps
Hébergement : Kubernetes (Rancher RKE on-prem, AKS Azure), Docker
DevOps / Observabilité : ArgoCD, Jenkins, Grafana, Prometheus, Sysdig
Langages : Python, Go
Versioning / Stockage : GitLab, Artifactory, S3

Livrables attendus

Mise en œuvre des sujets précités
Recommandations techniques documentées sur Dagster, Trino et autres outils, appuyées sur des diagnostics concrets
Plans de scalabilité et roadmap d'évolution du socle Data/IA

Profil recherché

Compétences indispensables

Orchestration de données (Dagster ou équivalent) : Expert
Moteur de requêtage distribué (Trino ou équivalent) : Expert
Ingestion & processing de données (Apache Spark) : Maîtrise à Expert
Écosystème Data/Big Data (Delta Lake/Iceberg, Hive) : Maîtrise à Expert
Mise à l'échelle de plateformes Data en production : Expert
Python : Maîtrise
Systèmes Unix/Linux : Maîtrise

Compétences appréciées

Conteneurisation (Docker) et orchestration (Kubernetes) : Maîtrise
Plateformes cloud (Azure AKS) : Connaissance à Maîtrise
Infrastructure as Code et GitOps : Connaissance à Maîtrise
Outils MLOps / déploiement de modèles IA : Connaissance
Développement applicatif (Go, Java) : Connaissance

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

LeHibou

Data engineer senior IA / ML - Apache Spark

580

Freelance

Urgent

Paris, France

Hybride

Expertises

Big DataData EngineeringApache Spark

il y a 10 heures

Opportunité exclusive

Salutech

Expert Data Engineer - Freelance

Freelance

Dans 2 à 4 semaines

Paris, France

Hybride

Expertises

PythonKubernetesApache SparkData orchestrationDistributed query enginesData lakehouse technologies

il y a 8 heures

Opportunité exclusive

ClubSec

Data Engineering (IA/ML) (senior >8 ans d'exp)

580

Freelance

Dans 2 à 4 semaines

Paris, France

Hybride

Expertises

KubernetesApache Sparktrinodagsterargo CD

il y a 8 heures

Opportunité exclusive

Réseau professionnel conçu pour les talents

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils

Entreprises

Trouver des profils

Publier une offre

Études de cas

À propos

Contact

Politique de confidentialité

Conditions générales