Q-Learning
Le Q-learning est une technique d’apprentissage par renforcement où un agent apprend à choisir des actions qui maximisent une récompense future dans un environnement donné. Il est basé sur la notion de fonction Q, qui estime la valeur de prendre une action dans un état particulier. C’est comme apprendre à jouer aux échecs non pas en mémorisant chaque mouvement possible, mais en comprenant quelles stratégies augmentent les chances de gagner à long terme.
Exemple : Un robot explorateur utilise le Q-learning pour naviguer dans un labyrinthe. Chaque mouvement (action) que le robot fait est évalué en fonction de la récompense anticipée (par exemple, atteindre la sortie du labyrinthe). En expérimentant différentes actions et en apprenant de l’expérience, le robot découvre le chemin optimal pour sortir du labyrinthe.
Retourner à l'index du lexique