Trouver une offreRecruteurs

System Architect Gen AI expert GCP & Microsoft

Opportunité exclusive

Urgent

Hybride

System Architect Gen AI expert GCP & Microsoft

Nigel Frank

System Architect Gen AI expert GCP & Microsoft

Expertises

Google BigQueryAzure

il y a 10 heures

Opportunité exclusive

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante


Type de contrat:

Freelance

Taux journalier :

Salaire selon profil

Localisation :

Paris, France

Date de démarrage :

Urgent

Mode de travail :

Hybride

Publié le :

1 juin 2026

Le besoin


Hello,

System Architect Gen AI

  • Site : Paris ; 3 jours min /semaine obligatoire sur site

  • Date de démarrage : asap 

  • Date de fin : 31/12/2026

Description and Location

Titre du poste : System Architect Gen AI expert GCP & Microsoft

Département ou Service : Département Data

Conditions de travail : Présentiel 3 jours par semaine minimum

Objectif de la mission : sous la supervision du System Architect AI, le rôle principal est de concevoir, de mettre en œuvre et de faire évoluer les assets Gen AI sur une plateforme hybride GCP/Microsoft, en visant évolutivité et performance. Le candidat doit garantir la cohérence technique, la scalabilité et la robustesse des solutions d'IA Générative et être un référent sur les architectures LLM.

Les tâches incluent :

  • Architecture Gen AI : Conception d'architectures découplées, scalables et sécurisées (RAG, Agents autonomes), définition de l'architecture applicative des environnements LLM (DEV, UAT, PROD) et intégration CI/CD via LLMOps.

  • Développeur Augmenté : Une expérience prouvée dans les solutions de "Développeur Augmenté" est requise pour mener à bien une partie des tâches du poste.

  • Gouvernance et Dette Technique : Mise en application des principes de gouvernance de l'IA et gestion de la dette technique.

  • Architectures Robustes : Conception d'architectures robustes et tolérantes aux pannes, rédaction de contrats d'interface, développement de processus de fallback et gestion des exigences non fonctionnelles (latence, sécurité, fiabilité).

  • Modèles d'Interaction et d'Ingestion : Définition de modèles optimisés, analyse des besoins métiers, création de modèles conceptuels pour le stockage vectoriel, optimisation des tokens LLM, collaboration avec les équipes de développement et mise en place de mécanismes d'évaluation continue.

Les compétences techniques attendues sont :

  • GCP : Agent Platform (ex-VertexAI), BigQuery Data Agents.

  • Microsoft : Copilot, Copilot Studio, WorkIQ, M365 Copilot Agents.

  • Code : Python, SQL.

  • Frameworks : ADK, Protocols : A2A, MCP.

Les spécificités & connaissances attendues sur GCP, LLMOps & Architectures Cognitives :

  • Maîtrise de l'orchestration et du Function Calling : Expérience prouvée dans le découplage de la logique métier pour interagir dynamiquement avec le Système d'Information, garantissant un code modulaire et réutilisable (Python, Go, etc.).

  • Écosystèmes GCP & Microsoft IA : Connaissance approfondie de Agent Platform (ex-Vertex AI), Gemini et de la plateforme Microsoft équivalente. Capacité à sélectionner les modèles adéquats selon le rapport coût/performance/complexité et à évoluer dans un environnement cloud multi-modèles.

  • Conception avancée pour les forts volumes et cas d'usage complexes :

    • Gestion de bases de données vectorielles à l'échelle (Vector Search).

    • Stratégies avancées de mise en cache sémantique pour réduire la latence et les coûts.

    • Maîtrise des architectures par Agents (multi-agents, planification, réflexion).

  • Prendre en compte les besoins de sécurité liés à la Gen AI :

  • Connaissance des stratégies de prévention des attaques de type Prompt Injectionou Data Poisoning.

  • Mise en place de filtrages stricts (OLS/RLS sémantique) pour garantir que les LLMs ne restituent que les données auxquelles l'utilisateur a accès.

  • Assurer l'observabilité et le monitoring (LLMOps) : Connaissance des best practices pour monitorer les chaînes applicatives IA (traçabilité des prompts, temps de réponse, coûts par token) ainsi que la diffusion des logs vers les couches de Sécurité des SI (SIEM).

Les livrables comprennent la documentation des exigences, les spécifications techniques, la communication des décisions techniques, le support aux équipes et la rédaction de documentation technique (diagrammes d'architecture, spécifications de pipelines LLMOps).

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

Qualis Recrutement

Administrateur / Ingénieur Google Cloud Platform (GCP) – Paris 14e

45000

CDI

Urgent

Paris, France

Sur site

Expertises

Google Cloud Platform

il y a 3 jours

Opportunité exclusive

Neonum

Data Analyst (>5 ans) / BI Analyst GCP – BigQuery & Power BI @ Banque @ Paris

500-520 € selon profil

Freelance

Urgent

Paris, France

Hybride

Top Recruteur

Expertises

Google Cloud PlatformGoogle BigQueryBase de données SQLData AnalystPower BI

il y a 10 heures

Opportunité exclusive

Visian

Data Architect

Freelance

Urgent

Paris, France

Sur site, Hybride

Expertises

Requêtes SQLData EngineeringPythonAWSPySparkData architecture

il y a 9 heures

Opportunité exclusive

Réseau professionnel conçu pour les talents

© 2026. Tous droits réservés.

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils