apprentissage par renforcement avec rétroaction humaine

Domaine: intelligence artificielle
Auteur: Office québécois de la langue française
Dernière mise à jour: 2025

Définition :

Technique d'apprentissage par renforcement où des rétroactions sont fournies à un modèle d'intelligence artificielle par des humains, et non uniquement par des règles prédéfinies.

Notes :

L'apprentissage par renforcement avec rétroaction humaine s'inscrit dans le concept plus général d'« apprentissage automatique avec intervention humaine ».

Les rétroactions sont parfois fournies de manière indirecte, par l'intermédiaire d'un modèle de récompense qui, lui, est entraîné par des humains.

Cette fiche fait partie du vocabulaire L'intelligence artificielle en évolution : les termes de l'IA.

Termes privilégiés :

apprentissage par renforcement avec rétroaction humaine n. m.
ARRH n. m.
apprentissage par renforcement à partir de retours humains n. m.
apprentissage par renforcement à partir de la rétroaction humaine n. m.
apprentissage par renforcement avec retour humain n. m.

Traductions

anglais
Auteur : Office québécois de la langue française, 2025
Termes :
1. reinforcement learning from human feedback
2. RLHF