Dans ce dernier volet, nous passons à l’analyse technique. Apprenez à construire, tester et superviser techniquement un agent de recrutement conforme en utilisant W&B Weave. Nous démontrerons deux techniques complémentaires de mitigation des risques – l’évaluation hors-ligne avant le déploiement, et les garde-fous en temps réel en production – tout en montrant comment capturer des métriques quantitatives et des traces qualitatives grâce à une surveillance granulaire. Découvrez comment intégrer le fine-tuning, l'entraînement du modèle, l’ingénierie système et le code applicatif dans un pipeline unifié et auditable.
À quoi s’attendre:
- Une session approfondie de 30 minutes sur notre pipeline agentique avec Weave, en continuité avec les Parties 1 & 2
- Une double stratégie de mitigation des risques : benchmarks hors-ligne pour tester les décisions, garde-fous en ligne pour faire respecter les politiques à l’exécution
- Démonstration de la collecte de traces dans W&B : dashboards de performance et biais, ainsi que journaux de conversations pour audits qualitatifs
- Modèles d’intégration pour unifier fine-tuning (W&B Models), workflows Weave et composants applicatifs
Ce que vous apprendrez:
- Comment concevoir et exécuter des benchmarks hors-ligne pour valider le comportement des agents selon les critères de conformité
- Comment configurer les garde-fous Weave et les hooks de validation W&B pour détecter les violations en temps réel
- Les meilleures pratiques pour capturer, visualiser et trier les métriques quantitatives et les traces qualitatives
- Comment architecturer un pipeline complet, de bout en bout, qui fournit une piste d’audit vivante et exploitable