Apprentissage par renforcement profond

L’apprentissage par renforcement profond (Deep Reinforcement Learning ou DRL) est une méthode d’apprentissage automatique qui combine les principes de l’apprentissage par renforcement avec les techniques de l’apprentissage profond. Il vise à apprendre des politiques de décision complexes dans des environnements dynamiques en utilisant des réseaux de neurones profonds pour représenter et généraliser les états et les actions.

Exemple : AlphaGo Zero, un programme d’intelligence artificielle développé par DeepMind, utilise l’apprentissage par renforcement profond pour apprendre à jouer au jeu de Go en s’améliorant continuellement grâce à l’expérience.

Retourner à l'index du lexique