Apprentissage par Renforcement Guidé

L’apprentissage par renforcement guidé est une approche d’apprentissage automatique utilisée pour entraîner des modèles génératifs à générer des sorties spécifiques en réponse à des objectifs définis. Dans cette approche, des récompenses ou des pénalités sont définies pour guider le modèle vers des comportements souhaités ou évités.

Exemple : En utilisant l’apprentissage par renforcement guidé, un modèle de langage génératif peut être entraîné à produire des traductions précises et fluides pour des paires de phrases donnée, en récompensant les traductions de haute qualité et en pénalisant les erreurs de traduction.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page