Apprentissage par renforcement inverse

L’apprentissage par renforcement inverse (IRL) est une approche de l’apprentissage par renforcement où un agent apprend à partir de démonstrations humaines plutôt que de récompenses directes. L’objectif est de reproduire le comportement observé dans les démonstrations en apprenant implicitement la fonction de récompense qui motive ce comportement.

Exemple : Dans le contexte de la robotique, un robot peut apprendre à naviguer dans un environnement en observant les déplacements humains et en apprenant à reproduire ces comportements à l’aide de l’apprentissage par renforcement inverse.

Retourner à l'index du lexique