Chargement...
Video bientot disponible
## Le concept Fonctionnement, avantages, exemple d utilisation et le RLHF (apprentissage par retour humain). ## En pratique Observer une IA apprendre a jouer (demo OpenAI Gym ou video AlphaGo). ## L essentiel en 5 secondes L IA apprend par essais-erreurs avec des recompenses.