Intentions de capteurs simples à explorer

Grâce à un simple masquage des couleurs, des statistiques d’image de niveau supérieur peuvent être dérivées. Récompenser l’agent pour avoir délibérément modifié ces statistiques conduit à diverses explorations et à des comportements intéressants tels que, par exemple, saisir ou soulever des objets.

Exemple de compétences

J’ai appris à partir de zéro et des pixels et de la proprioception uniquement. Les récompenses externes sont rares et les intentions de détection simples (SSI) sont utilisées comme seules tâches auxiliaires.

vidéo

Enregistrer un commentaire

Plus récente Plus ancienne

نموذج الاتصال