Trouver une offreRecruteurs

Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Opportunité exclusive

Urgent

Hybride

Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Visian

Data Engineer (IA/ML – Dagster, Trino & Apache Spark)

Expertises

Machine LearningIA

il y a 1 jour

Opportunité exclusive

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante


Type de contrat:

Freelance

Taux journalier :

Salaire selon profil

Localisation :

Paris, France

Date de démarrage :

Urgent

Mode de travail :

Hybride

Publié le :

4 mai 2026

Le besoin


Dans le cadre d'un besoin d'un de ses clients, Visian recherche un Data Engineer.

Expertise opérationnelle sur les plateformes Data/IA

  • Challenger et améliorer concrètement les plateformes Dagster (orchestration) et Trino (requêtage distribué) : diagnostiquer les problèmes de performance, optimiser les configurations, revoir les patterns d'utilisation.

  • Concevoir et optimiser les pipelines d'ingestion et de processing de données basées sur Spark : performance des jobs, gestion des volumétries, stratégies de partitionnement et formats de stockage (Delta Lake, Iceberg).

  • Intervenir directement sur les évolutions techniques pour accompagner la montée en charge (volumétrie, nombre d'utilisateurs, complexité des pipelines).

  • Contribuer à la gouvernance technique par la pratique : établir les standards à partir de cas concrets, documenter les décisions techniques.

  • Évaluer et prototyper l'intégration de nouveaux composants dans l'écosystème (formats de stockage, outils de catalogue, moteurs de calcul).

Industrialisation & Scalabilité

  • Industrialiser les pipelines Data et IA/ML : fiabilité, observabilité, reproductibilité — en mettant en œuvre soi-même les solutions, pas uniquement en les spécifiant.

  • Concevoir et implémenter les patterns de déploiement et d'exploitation à l'échelle en collaboration avec les équipes support et l'équipe d'ingénierie de production.

  • Mettre en place concrètement les mécanismes de monitoring, d'alerting et de capacity planning adaptés aux workloads Data/IA.

  • Structurer le support de niveau 3 (expertise) et accompagner l'équipe de production sur le support de niveaux 1 et 2.

Accompagnement & Montée en compétence

  • Conseiller et accompagner les équipes de développement et de data science dans l'utilisation optimale des plateformes.

  • Assurer un rôle de référent technique opérationnel au sein de l'équipe — par l'exemple et le pair-working, pas uniquement par le conseil.

  • Participer à la veille technologique et réaliser des POCs sur des évolutions pertinentes pour l'écosystème Data/IA.

Environnement fonctionnel

La prestation se déroulera au sein du service en charge :

  • Des plateformes Data & IA/ML (Dagster, Trino, Delta Lake/Iceberg, Superset, OpenMetadata)

  • Des plateformes Kubernetes (on-prem et Cloud) servant de socle d'hébergement

  • Des outils DevOps (intégration continue, déploiement, observabilité)

  • Des projets de R&D visant à moderniser le SI (POCs, présentations)

  • De l'accompagnement des initiatives IA/ML du groupe

  • Des outils de monitoring

Environnement technique

  • Data / Orchestration : Dagster, Trino, Apache Spark, Hive, Delta Lake/Iceberg, Superset, OpenMetadata

  • IA / ML : Workloads IA/ML sur Kubernetes, outils MLOps

  • Hébergement : Kubernetes (Rancher RKE on-prem, AKS Azure), Docker

  • DevOps / Observabilité : ArgoCD, Jenkins, Grafana, Prometheus, Sysdig

  • Langages : Python, Go

  • Versioning / Stockage : GitLab, Artifactory, S3

Livrables attendus

  • Mise en œuvre des sujets précités

  • Recommandations techniques documentées sur Dagster, Trino et autres outils, appuyées sur des diagnostics concrets

  • Plans de scalabilité et roadmap d'évolution du socle Data/IA

Profil recherché


Compétences indispensables

  • Orchestration de données (Dagster ou équivalent) : Expert

  • Moteur de requêtage distribué (Trino ou équivalent) : Expert

  • Ingestion & processing de données (Apache Spark) : Maîtrise à Expert

  • Écosystème Data/Big Data (Delta Lake/Iceberg, Hive) : Maîtrise à Expert

  • Mise à l'échelle de plateformes Data en production : Expert

  • Python : Maîtrise

  • Systèmes Unix/Linux : Maîtrise

Compétences appréciées

  • Conteneurisation (Docker) et orchestration (Kubernetes) : Maîtrise

  • Plateformes cloud (Azure AKS) : Connaissance à Maîtrise

  • Infrastructure as Code et GitOps : Connaissance à Maîtrise

  • Outils MLOps / déploiement de modèles IA : Connaissance

  • Développement applicatif (Go, Java) : Connaissance

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

LeHibou

Data engineer senior IA / ML - Apache Spark

580

Freelance

Urgent

Paris, France

Hybride

Expertises

Big DataData EngineeringApache Spark

il y a 10 heures

Opportunité exclusive

Salutech

Expert Data Engineer - Freelance

Freelance

Dans 2 à 4 semaines

Paris, France

Hybride

Expertises

PythonKubernetesApache SparkData orchestrationDistributed query enginesData lakehouse technologies

il y a 8 heures

Opportunité exclusive

ClubSec

Data Engineering (IA/ML) (senior >8 ans d'exp)

580

Freelance

Dans 2 à 4 semaines

Paris, France

Hybride

Expertises

KubernetesApache Sparktrinodagsterargo CD

il y a 8 heures

Opportunité exclusive

Réseau professionnel conçu pour les talents

© 2026. Tous droits réservés.

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils