Apprentissage par Renforcement Guidé
L’apprentissage par renforcement guidé est une approche d’apprentissage automatique utilisée pour entraîner des modèles génératifs à générer des sorties spécifiques en réponse à des objectifs définis. Dans cette approche, des récompenses ou des pénalités sont définies pour guider le modèle vers des comportements souhaités ou évités.
Exemple : En utilisant l’apprentissage par renforcement guidé, un modèle de langage génératif peut être entraîné à produire des traductions précises et fluides pour des paires de phrases donnée, en récompensant les traductions de haute qualité et en pénalisant les erreurs de traduction.
Retourner à l'index du lexique