Paper review - Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning

06 Mar 2022

한 달 만에 돌아온 여섯 번째 논문 리뷰입니다. Multi-agent Reinforcement learning 에 관련된 논문이고, 굉장히 현실적인 문제를 다루고 있습니다. 우리가 로봇을 RL로 학습한다고 가정해보죠. A라는 로봇으로 학습시킨 policy를 B라는 로봇에 그대로 넣었을 때 잘 동작할까요? A와 B가 완전히 동일한 로봇이라 할지라도 미묘하게 다른 부분들이 있을 겁니다. 무게중심의 위치가 다르다던지, 배터리 잔량이 다를 수도 있고, 모터의 토크 곡선에서 차이가 날 수도 있죠. 그렇다면 어떠한 로봇에 넣더라도 잘 동작할 수 있는 policy를 어떻게 만들 수 있을까요? 이 논문은 그 해법을 distributed MARL에서 찾았습니다.

To be continue…