apprentissage par renforcement avec rétroaction humaine
- Domaine
-
- intelligence artificielle
- Dernière mise à jour
Définition :
Technique d'apprentissage par renforcement où des rétroactions sont fournies à un modèle d'intelligence artificielle par des humains, et non uniquement par des règles prédéfinies.
Notes :
L'apprentissage par renforcement avec rétroaction humaine s'inscrit dans le concept plus général d'apprentissage automatique avec intervention humaine.
Les rétroactions sont parfois fournies de manière indirecte, par l'intermédiaire d'un modèle de récompense qui, lui, est entraîné par des humains.
Cette fiche fait partie du vocabulaire L'intelligence artificielle en évolution : les termes de l'IA.
Termes privilégiés :
- apprentissage par renforcement avec rétroaction humaine n. m.
- ARRH n. m.
- apprentissage par renforcement à partir de retours humains n. m.
- apprentissage par renforcement à partir de la rétroaction humaine n. m.
- apprentissage par renforcement avec retour humain n. m.
Traductions
-
anglais
Auteur : Office québécois de la langue française,Termes :
- reinforcement learning from human feedback
- RLHF