초록 close

This paper examines the implications of a model of political judgment on cooperation in the repeated Prisoner’s Dilemma (PD) game. Specifically, a learning model that incorporates basic psychological learning processes, wellestablished in political behavior and psychology, is applied via simulations to the dynamics of cooperation robustly observed in classic repeated PD game experiments. The result shows that the model implies a version of reinforcement learning and that it can robustly account for the emergence of cooperation observed in the experiments when learning is over immediate action. The model provides a coherent and psychologically realistic explanation for why and how a boundedly rational player, left to their own devices, can learn to cooperate over time. Essentially, it suggests that basic, well-established psychological learning processes together tend to lead players to learn to cooperate over time under quite general conditions.


이 논문은 정치학 모형이 죄수의 딜레마 반복 게임에서 협력의 증진에 대해 갖는 함의를 연 구한다. 죄수의 딜레마 반복 게임에 관한 고전적인 실험 데이타는 참여자들의 협력 비율이 점 차적으로 증가한다는 것을 보여준다. 이 연구는 이 실험 데이타에 정치학과 심리학에서 검증된 이론을 기반으로 만들어진 모형을 시뮬레이션을 통해서 적용한다. 시물레이션 결과는 이 모형 이 그동안 게임 이론에서 많이 연구된 단순 경험학습(reinforcement learning)을 포함하고 있 으며 실험에서 관찰된 협력의 증가를 잘 설명할 수 있다는 것을 보여준다. 이 연구는 왜 그리 고 어떻게 사람들이 죄수의 딜레마 반복게임에서 경험을 통해 협력을 배울 수 있는 가에 대한 일관되고 심리학적이고 현실적인 설명을 제시한다