Pour qui ?

Les équipes de développement et les leads techniques qui intègrent des LLM dans des produits et des systèmes internes. À l’aise avec le code et les APIs.

Objectifs

À la fin de la formation, les participants savent :

Développer contre les APIs LLM : sorties structurées, streaming, batch, gestion d’erreurs
Concevoir des systèmes agentiques : tool use, MCP, orchestration, et leurs limites
Construire et évaluer un pipeline RAG : chunking, recherche hybride, évaluation
Utiliser efficacement les outils de développement assisté par IA en équipe
Amener une fonctionnalité LLM en production : monitoring, évaluation, maîtrise des coûts

Programme

Jour 1 — Sous le capot, et premières intégrations

Les entrailles des LLM, pour ingénieurs. Intuition du transformer, tokens et embeddings, le pipeline d’entraînement (pré-entraînement, SFT, RL), modèles base contre instruct, paramètres d’inférence (température, top-p, fenêtre de contexte). Pourquoi les hallucinations sont structurelles. Démo : exécution d’un petit modèle en local qu’on regarde halluciner.

L’écosystème, cartographié. Modèles propriétaires contre open-weight et leurs licences. Hugging Face, frameworks d’inférence (llama.cpp, vLLM), local contre API gérée — coût, souveraineté, latence. Fournisseurs gérés : Bedrock, Azure, Vertex, options européennes.

Développer contre les APIs. SDK Anthropic et OpenAI : structure commune et différences. Sorties structurées, streaming, traitement par batch. Gestion d’erreurs, rate limits, retries. Le prompt caching et son effet sur la facture.

Atelier — première intégration. Construire un petit pipeline d’extraction contre une vraie API : sortie structurée, validation, mesure des coûts.

Jour 2 — Agents, RAG, développement assisté par IA

Tool use et agents. Le function calling à partir de zéro. Model Context Protocol (MCP). Boucles agentiques : planification, exécution, correction. Orchestration multi-agents — et les cas où une chaîne déterministe bat un agent.

Le RAG, fait correctement. Embeddings et bases vectorielles. Stratégies de chunking. Recherche hybride (vectorielle + lexicale). RAG contre contexte long contre fine-tuning. Comment évaluer un pipeline RAG avant que vos utilisateurs ne le fassent.

Le développement assisté par IA. Claude Code, Cursor, Copilot : ce qui change réellement dans le workflow d’une équipe. Agents, hooks, serveurs MCP en pratique. Les conventions d’équipe qui gardent le code généré par IA relisible.

Atelier — construire un agent. Intégrer un agent avec tool use sur une tâche réelle : accès aux fichiers, une API externe, et une étape de vérification.

Jour 3 (optionnel) — Production, sécurité, évaluation

Architecture de production et observabilité. Architectures de référence. Monitoring de la latence, des coûts, des taux d’erreur et de la qualité des sorties. Stratégies de fallback et dégradation gracieuse.

Sécurité. Prompt injection (directe et indirecte), jailbreaks, fuite de données personnelles. Contrôles techniques : filtrage, sandboxing, revue humaine. Threat modeling d’une application LLM — en pratique, sur votre propre architecture.

Évaluation et qualité continue. Construire des jeux d’évaluation à partir du trafic réel. Pipelines d’évaluation automatisée, détection de régressions, LLM-as-judge et ses pièges.

Atelier — pipeline d’évaluation. Mettre en place une évaluation automatisée sur un cas d’usage réaliste et s’en servir pour comparer deux modèles.

Modalités

Deux à trois jours selon le périmètre, sur site ou à distance
Pratique : les participants développent contre de vraies APIs pendant la formation
Inclut des points de suivi après la formation pour passer en revue vos projets IA