Expertises
il y a 10 heures
Opportunité exclusive
Publié par un Top Recruteur
Partagez cette opportunité
Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.
Information importante
Type de contrat:
Freelance
Taux journalier :
Salaire selon profil
Localisation :
Paris, France
Date de démarrage :
4 à 8 semaines
Mode de travail :
Hybride
Publié le :
26 mai 2026
Le besoin
Objectif du poste
Suivi de la disponibilité, la performance et la résilience des plateformes IA / Data / LLM déployées 100 % sur Kubernetes. Vous pilotez le RUN (opérations quotidiennes, incidents, évolutions mineures) d’une équipe offshore de 3 personnes, garantissant une prise en charge fluide des incidents, la mise en œuvre des correctifs et l’optimisation continue des ressources. Vous assurez également la coordination entre les équipes produit, les équipes d’infrastructure et les fournisseurs afin d’aligner les exigences métier avec les contraintes techniques.
2. Contexte
Équipe : 3 ingénieurs (DevOps/Infra / Data) basés offshore, travail majoritairement asynchrone.
Portefeuille : 3 produits majeurs – plateforme d’inférence LLM, pipeline de data‑science, service de mise à disposition de modèles IA.
Environnement technique : Kubernetes (cluster(s) on‑prem & cloud hybride), Helm, Argo CD, CI/CD (GitLab / Jenkins), observabilité (Prometheus / Grafana, Loki), secrets management (Vault), gestion des GPU (NVIDIA GRID).
Méthodologie : Agile (Scrum/Kanban) – tableau JIRA, suivi ITSM (ServiceNow).
3. Missions principales
Domaine Responsabilités
Gestion du RUN • Supervision des alertes, incidents et changements ;
• Coordination du triage (L1 → L2 → L3) avec l’équipe offshore ;
• Rédaction & maintenance des runbooks, playbooks et SOP ;
• Suivi du MTTR, escalades et reporting aux parties prenantes.
Incident Management & RCA • Conduite d’enquêtes post‑mortem (RCA) ;
• Mise en place d’actions correctives et préventives ;
• Gestion du carnet d’incidents dans ServiceNow (SNOW).
Optimisation des plateformes • Monitoring des métriques (latence, utilisation GPU, capacité des nœuds) ;
• Propositions d’optimisation (autoscaling, right‑sizing, tuning des ressources) ;
• Gestion des patchs de sécurité et suivi des CVE.
Automation & CI/CD
• Automatisation des tâches récurrentes (scripts Python, Terraform, Ansible) ;
• Intégration des bonnes pratiques GitOps.
Collaboration & gouvernance • Interface avec les Product Owners, les équipes DataScience et les fournisseurs d’infrastructure ;
• Participation aux cérémonies Scrum/Kanban (stand‑up, grooming, retro) ;
• Veille à la conformité ITSM (processes, KPI, SLA).
Support aux utilisateurs • Gestion des demandes d’accès, des droits RBAC et de la documentation technique ;
• Formation ponctuelle (on‑boarding) des nouveaux membres de l’équipe offshore.
4. Profil recherché
Domaine Exigences
Expérience • 5 + ans d’expérience en exploitation (Run/Production) d’environnements Kubernetes à grande échelle ;
• Expérience confirmée avec des équipes offshore ou distribuées (3 personnes minimum).
Compétences techniques
• Kubernetes, Helm, Argo CD ;
• Scripting Python (débogage, packaging : venv, poetry, uv) ;
• Notions Data Science : pandas, numpy ;
• CI/CD (GitLab, Jenkins), IaC (Terraform, Ansible) ;
• Observabilité (Prometheus, Grafana, Loki) ;
• Gestion des GPU (NVIDIA GRID) ;
• Sécurité production : gestion CVE, RBAC, Vault.
Méthodologies ITSM & Agile • Maîtrise de ServiceNow (SNOW) et des processus ITIL ;
• Gestion de tickets JIRA, expérience Scrum/Kanban.
Compétences soft • Leadership d’une petite équipe distante ; capacité à communiquer clairement en asynchrone ;
• Esprit d’analyse et résolution d’incidents ;
• Rédaction technique (runbooks, rapports d’incident) ;
• Sens du service client interne, diplomatie et capacité à gérer les priorités conflictuelles.
Langues Français courant, anglais professionnel (écrit et oral).
Formation Bac + 5 en informatique, génie logiciel, systèmes d’information ou équivalent.
D'autres offres idéales pour vous !
Ces entreprises cherchent également d'excellents profils
Jedha
Juré de certification en Intelligence Artificielle (AIA)
300
Freelance
Urgent
Paris, France
Sur site
Expertises
il y a 8 jours
Opportunité exclusive
Avelsen
Run Lead
Freelance
Dans 2 à 4 semaines
Lyon, France
Hybride, Sur site
Expertises
il y a 5 jours
Opportunité exclusive
Neovity
Architecte IA
Freelance
Urgent
Paris, France
Télétravail, Hybride
Expertises
il y a 4 heures
Opportunité exclusive