리서치 하이라이트
새로운 인공지능 시스템, 알파고 제로
Nature 550, 7676
바둑의 세계 최고 기사를 이기기 위해서, 인공지능 프로그램인 알파고는 수백만 건의 인간 바둑 기사들의 수를 통해 학습하는 방법을 이용했었다. David Silver와 공동연구원들은 알파고 제로(AlphaGo Zero)라는 프로그램을 개발하였는데, 이 프로그램은 강화 학습만을 기본으로 하고 있으며, 단독 훈련을 통해서만 학습하게 된다. 알파고 제로는 단지 몇 일만에 자체적으로 5백만 번의 게임과 학습을 통해서 무작위적인 움직임으로 시작하여, 최강 인간 레벨까지 갈 수 있으며, 기존의 알파고를 모두 물리쳤다. 인간이 1천년에 걸쳐서 만들어낸 개념을 기계 자체적으로 게임의 원리를 알아내기 때문에, 인간의 편견을 넘어서 이론적으로 일반화할 수 있는 특성이 있다는 것이 이번 연구를 통해서 밝혀졌다.