Expertises
il y a 10 heures
Opportunité exclusive
Partagez cette opportunité
Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.
Information importante
Type de contrat:
Freelance
Taux journalier :
Salaire selon profil
Localisation :
Paris, France
Date de démarrage :
Urgent
Mode de travail :
Hybride
Publié le :
1 juin 2026
Le besoin
Hello,
System Architect Gen AI
Site : Paris ; 3 jours min /semaine obligatoire sur site
Date de démarrage : asap
Date de fin : 31/12/2026
Description and Location
Titre du poste : System Architect Gen AI expert GCP & Microsoft
Département ou Service : Département Data
Conditions de travail : Présentiel 3 jours par semaine minimum
Objectif de la mission : sous la supervision du System Architect AI, le rôle principal est de concevoir, de mettre en œuvre et de faire évoluer les assets Gen AI sur une plateforme hybride GCP/Microsoft, en visant évolutivité et performance. Le candidat doit garantir la cohérence technique, la scalabilité et la robustesse des solutions d'IA Générative et être un référent sur les architectures LLM.
Les tâches incluent :
Architecture Gen AI : Conception d'architectures découplées, scalables et sécurisées (RAG, Agents autonomes), définition de l'architecture applicative des environnements LLM (DEV, UAT, PROD) et intégration CI/CD via LLMOps.
Développeur Augmenté : Une expérience prouvée dans les solutions de "Développeur Augmenté" est requise pour mener à bien une partie des tâches du poste.
Gouvernance et Dette Technique : Mise en application des principes de gouvernance de l'IA et gestion de la dette technique.
Architectures Robustes : Conception d'architectures robustes et tolérantes aux pannes, rédaction de contrats d'interface, développement de processus de fallback et gestion des exigences non fonctionnelles (latence, sécurité, fiabilité).
Modèles d'Interaction et d'Ingestion : Définition de modèles optimisés, analyse des besoins métiers, création de modèles conceptuels pour le stockage vectoriel, optimisation des tokens LLM, collaboration avec les équipes de développement et mise en place de mécanismes d'évaluation continue.
Les compétences techniques attendues sont :
GCP : Agent Platform (ex-VertexAI), BigQuery Data Agents.
Microsoft : Copilot, Copilot Studio, WorkIQ, M365 Copilot Agents.
Code : Python, SQL.
Frameworks : ADK, Protocols : A2A, MCP.
Les spécificités & connaissances attendues sur GCP, LLMOps & Architectures Cognitives :
Maîtrise de l'orchestration et du Function Calling : Expérience prouvée dans le découplage de la logique métier pour interagir dynamiquement avec le Système d'Information, garantissant un code modulaire et réutilisable (Python, Go, etc.).
Écosystèmes GCP & Microsoft IA : Connaissance approfondie de Agent Platform (ex-Vertex AI), Gemini et de la plateforme Microsoft équivalente. Capacité à sélectionner les modèles adéquats selon le rapport coût/performance/complexité et à évoluer dans un environnement cloud multi-modèles.
Conception avancée pour les forts volumes et cas d'usage complexes :
Gestion de bases de données vectorielles à l'échelle (Vector Search).
Stratégies avancées de mise en cache sémantique pour réduire la latence et les coûts.
Maîtrise des architectures par Agents (multi-agents, planification, réflexion).
Prendre en compte les besoins de sécurité liés à la Gen AI :
Connaissance des stratégies de prévention des attaques de type Prompt Injectionou Data Poisoning.
Mise en place de filtrages stricts (OLS/RLS sémantique) pour garantir que les LLMs ne restituent que les données auxquelles l'utilisateur a accès.
Assurer l'observabilité et le monitoring (LLMOps) : Connaissance des best practices pour monitorer les chaînes applicatives IA (traçabilité des prompts, temps de réponse, coûts par token) ainsi que la diffusion des logs vers les couches de Sécurité des SI (SIEM).
Les livrables comprennent la documentation des exigences, les spécifications techniques, la communication des décisions techniques, le support aux équipes et la rédaction de documentation technique (diagrammes d'architecture, spécifications de pipelines LLMOps).
D'autres offres idéales pour vous !
Ces entreprises cherchent également d'excellents profils
Qualis Recrutement
Administrateur / Ingénieur Google Cloud Platform (GCP) – Paris 14e
45000
CDI
Urgent
Paris, France
Sur site
Expertises
il y a 3 jours
Opportunité exclusive
Neonum
Data Analyst (>5 ans) / BI Analyst GCP – BigQuery & Power BI @ Banque @ Paris
500-520 € selon profil
Freelance
Urgent
Paris, France
Hybride
Top Recruteur
Expertises
il y a 10 heures
Opportunité exclusive
Visian
Data Architect
Freelance
Urgent
Paris, France
Sur site, Hybride
Expertises
il y a 9 heures
Opportunité exclusive